Document Understanding
最新
False
  • 发行说明
横幅背景图像
Document Understanding 发行说明
上次更新日期 2024年5月9日

2022 年 3 月

一般发布说明 - ML 包

2022 年 3 月 14 日 | V22.1.6

DocumentUnderstanding + DocumentClassifier + Data Extraction ML 包在 AI Center Cloud 中发布,包版本 22.1.6

错误修复

  • 修复了一个错误,该错误导致 AI Center 中的训练管道或完整管道由于空行数据预处理中的 ML 包问题而失败。

2022 年 3 月 7 日 | V22.2.3

UiPathDocumentOCR - 在 AI Center Cloud 中发布,包版本 22.2.3

卓越的能力

手写识别 OCR 集成到 UiPath 文档 OCR 中。在许多情况下,会混合使用字段。通过集成手写读取功能,我们能够将正确的识别应用于每个字段:打印识别应用于打印文本,手写识别应用于手写文本。

虽然手写识别 OCR 可以检测任何手写内容,但请注意,它仅针对英语进行了训练和优化。

改进

字数限制从每页 1600 增加到 10000。

添加了以下科学符号:μ<>

2022 年 3 月 2 日 | V22.1.4

DocumentUnderstanding + DocumentClassifier + Data Extraction ML 包在 AI Center Cloud 中发布,包版本 22.1.4

新增功能

水电费账单 ML 包现已正式发布。

改进

总体而言,性能和可扩展性得到了改进。

与以前的版本相比,在新版 DocumentUnderstanding ML 包上训练时的分数有了显着提高。

现在可以正确解析列字段中的日期。

日期解析现在可以识别土耳其语月份名称。

更改

在 GPU 与 CPU 上训练时,更改了训练管道和完整管道的行为。21.10.x在 CPU 上训练的模型更小,因此训练速度比以前的版本更快,但准确性比以前略低。

此版本已逆转此行为,因此在 GPU 和 CPU 上训练的模型是完全相同的模型,并且训练速度已恢复到 2021.10 之前的水平,这意味着在 CPU 上的训练速度再次比在 GPU 上的训练速度慢 10 到 20 倍。

General Release Notes - Document Understanding

2022 年 3 月 29 日

改进

添加了有关“训练”、“验证”和“评估”文档类型的更多描述性工具提示。

错误修复

  • 修复了一个已知问题,该问题导致搜索或下载文档时,如果文件名中含有需要 URL 编码的字符(&,+#'),则查询失败。
  • 修复了导致“预测”功能在文本非常密集的文档上失败的错误。

2022 年 3 月 7 日

改进

在文档搜索中实现,允许您仅在当前文档中搜索文本实例。这对于包含许多页面的文档尤其有用。搜索栏位于屏幕左下方,也可以使用快捷键 Ctrl + Shift + F 访问。

使用“预测”功能时,将删除手动标记的数据,并使用模型中的新值覆盖文档。

将数据集导入另一个 Document Manager 会话或运行训练管道时,不再使用 split.csv。文件中的数据现在已集成到数据集中最新文件夹的 JSON 文件中,更确切地说,是在“子集”字段中。因此,如果您手动修改文件或将其从数据集中完全删除,则不会对模型的训练产生影响。但是,请注意,对于 21.10 ML 包版本或更低版本,该文件仍会保留以用于文档级别导出。

添加了永久删除单个文件的选项。此选项可以在文档名称旁边的下拉列表中找到,旁边是下载选项。

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.