Document Understanding
最新
False
  • 发行说明
横幅背景图像
Document Understanding 发行说明
上次更新日期 2024年5月9日

2022 年 5 月

一般发布说明 - ML 包

2022 年 5 月 10 日 | V22.4.0

DocumentUnderstanding + 文档分类器 + 数据提取 ML 包

新增功能

通过集成手写识别 OCR,手写功能现在可用于 UiPath 文档 OCR 和 UiPathDocumentOCR_CPU 包。UiPath.OCR.LocalServer Studio 包中也有相同的功能。有关该活动的更多详细信息,请参阅此处

提取 ML 包的新架构,具有重要优势,尤其是对于使用 DocumentUnderstanding ML 包训练的模型。

水电费账单W9护照 ML 包现在已作为 GA 提供。预览版中提供了五个新的开箱即用预训练 ML 包,以简化您的工作。

预览版中提供了五个新的开箱即用预训练 ML 包,以简化您的工作。请参阅此处,以找到有关它们的所有必要信息。

“文档搜索”是 Document Manager 中提供的一项新功能,可帮助标记页数很多的文档。

改进

已对用于 AI Center 中文档提取的 ML 包进行了改进。评估 Excel 电子表格推出了新的工作表,使您能够更好地组织和解释评估的数据。

Automation Suite 离线安装中的 ML 包已收到新的离线捆绑包。

UiPathDocumentOCR 的准确性和性能已得到改进。

错误修复

对解析日期字段的多项修复,包括列字段中的日期、土耳其语文档中的日期、遥远的未来日期

General Release Notes - Document Understanding

2022 年 5 月 30 日

新增功能

Document Understanding 现在可用于一般用途,采用了集成度更高的新界面,其中包括 Document Manager 和 Forms AI。在 UiPath Cloud 中的租户上启用该服务,左侧导航栏中将显示一个新选项卡。

Forms AI 现在作为 Document Understanding 的一部分提供,可用于上传和处理具有标准布局和字段的结构化表单。

Data Manager 名称更改为 Document Manager

Document Manager 中提供了一个新选项,可让您永久删除单独的文件。该选项位于同时包含下载选项的下拉列表中。

现在,您可以选择重命名先前创建的字段。

现在可以在文档内进行搜索,您可以在当前文档中搜索字词。

通过导入数据集收集的数据现在已集成到子集字段的 JSON 文件中,这意味着,如果您手动修改文件或从数据集中完全删除文件,则不会影响模型的训练。

现在,已删除的文档将不会从重复数据删除中排除,这意味着您现在可以导入同一个文档两次。已删除的文档也会从搜索或筛选中排除,因此,除非您使用 deleted 关键字,否则它只会搜索未删除的文档。

文档视图收到了新的入门提示。

改进

将预测功能与 Document Manager 一起使用时,未由用户手动编辑的标记数据将替换为从模型接收的值。

添加了有关“训练”、“验证”和“评估”文档类型的更多描述性工具提示。

列和常规字段的编辑字段对话框已重组。“后处理”、“多页”、“评分”和“颜色”选项已移至“高级”选项卡。其余选项可在“常规”选项卡中找到。

改进了重复文档的导入速度。

分类字段现在按创建顺序显示。

错误修复

  • 修复了一个已知问题,该问题导致搜索或下载文档时,如果文件名中含有需要 URL 编码的字符(&,+#'),则查询失败。
  • 修复了导致“预测”功能在文本非常密集的文档上失败的错误。
  • 删除了每个会话最多导入 2000 个文档的限制。现在,考虑到每次导入最多 2000 页的限制,一个会话中可以包含 2000 多个文档。
  • 修复了按 ctrlshift 时无法选择 3 个以上方框的错误。
  • 修复了一个错误,该错误导致导入在重新启动 Pod 后暂停处理,但作业没有恢复。
  • 修复了“ 预测 ” 函数无法从整个文档中提取数据的错误。 请注意,将该功能与 公共端点 一起使用时,仍然存在 10 页的限制。
  • 修复了 Microsoft Read OCR 的错误,即匹配 *.cognitiveservices.azure.com 子域的端点会引发 OCR endpoint is not valid 错误。
  • 修复了导致 Document Manager 数据集的导入内容在超过 10 页的文档上会混淆页面的错误。
  • 修复了一个错误,该错误在选择“所有已加标签”选项时会导致下载或导出空数据集或完整数据集的一小部分。

已知问题

  • 最大导入大小从 2GB 或 2000 页减少到 1GB 或 2000 页
  • 搜索或下载文档时,如果文件名中含有需要 URL 编码的字符(&,+#'),则会失败,并显示 invalid query

2022 年 5 月 24 日

改进

修复了使用 Action Center 在 Cloud 上运行验证站点时导致消耗大量内存的错误。现在一切正常,内存消耗在正常范围内。

2022 年 5 月 6 日

改进

“预测”按钮已移至“设置”按钮旁边。

批次名称已添加到管理栏中。

已从 AI Center 中删除设置 MLPackages.View 权限的请求。

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.