- Document Understanding 发行说明
- ML 包和公共端点发行说明
- 常规 ML 包和公共端点更新
- ML 包和公共端点版本历史记录
ML 包和公共端点版本历史记录
发行日期:2024 年 7 月 23 日
在 UiPath Document Understanding OCR 和端点(包括 UiPath Document Understanding OCR_CPU)中发布 | v24.7
改进
- 通过添加对 əƏ 字符的识别,提高了阿塞拜疆语的准确性。
- 磁墨字符识别 (MIRC) 的识别和检测得到了改进,从而提高了准确性,尤其是支票的准确性。
- 以前,当使用空格作为分隔符时,在某些情况下无法识别数字。现在,此问题已得到改进,现在可以在使用空格作为分隔符时识别数字。
错误修复
UiPath Document Understanding OCR 的置信度分数得到了提高,尤其是在处理质量较低的图像时。在使用置信度分数来决定文档是否需要在 Action Center 中进行人工验证的工作流中,此改进可能会导致接受验证的文档数量增加。
Release date: 3 October 2024
Released in Data Extraction ML packages | v24.4.4
错误修复
- We've fixed an issue that was causing AI Center training pipelines to report inaccurately high scores for
ID Number
andPhone Number
field types. This ensures that the reported scores match the actual scores. - We've corrected an issue that was related to parsing values on Japanese fields when the Extended Languages OCR was in use.
发行日期:2024 年 5 月 24 日
- DocumentUnderstanding + Data Extraction ML 包 | v24.4.0
- DocumentClassifier ML 包 | v24.4.0
改进
- 提高了“日本发票”ML 包的准确性。“日本发票”模型还有 11 个新字段。有关已提取字段的完整列表,请查看《开箱即用模型详细信息》文件。
- “工资单”模型的性能得到了改进。
- 新 ID 可用于“身份证”ML 包:
- Aadhaar 身份证
- 沙特阿拉伯身份证
- 永久帐号卡
- UB04 ML 包有新的可用字段。有关已提取字段的完整列表,请查看《开箱即用模型详细信息》文件。
- “支票”ML 包有新的可用字段。有关已提取字段的完整列表,请查看《开箱即用模型详细信息》文件。
勘误 - 于 2024 年 6 月 20 日添加:添加了与解析日语日期相关的错误修复的相关信息。
勘误 - 添加于 2024 年 5 月 28 日:添加了有关几项改进的更多信息。
发布日期:2024 年 4 月 1 日
在数据提取 ML 包中发布 | v24.2.0
- 1040 附表 C
- 1040 附表 D
- 1040 附表 E
- UB04
发布日期:2024 年 2 月 12 日
在端点 + DocumentUnderstanding + Data Extraction ML 包中发布 | v23.10.3
现在,属于 AI Center 的所有开箱即用的预训练 ML 包的新版本可用于一般用途。
此新版本带来了与提取双向(从左到右和从右到左)文本值相关的错误修复。
发行日期:2023 年 10 月 26 日
在端点 + DocumentUnderstanding + Data Extraction ML 包中发布 | v23.10.0
现在,所有开箱即用的预训练 ML 包的新版本可用于一般用途。
我们一直在不断努力,改善您的 Document Understanding 体验。在本发行版中,我们确保对产品的安全性和稳定性进行了次要改进。
发布日期:2023 年 8 月 3 日
已在 DocumentUnderstanding + 数据提取 ML 包中发布 | v23.7.0
- 在表格跨越许多页面的文档中,表格行(行项目)将拆分为 2 页,在某些情况下甚至更多。以前的模型版本假定每个分页符也是一个换行符,并且它将项目分成多个部分。当前模型版本修复了此问题。要在工作流中使用此功能,您需要在该特定工作流中使用 DocumentUnderstanding.ML.Activities 包版本 1.23.0 预览版和 23.7.0 模型版本。
- 模型现在针对每页具有更快的预测时间,并且可以更有效地使用 RAM,从而允许处理更大的文档。
发行日期:2023 年 5 月 10 日
在 DocumentUnderstanding + 数据提取 ML 包中发布 | v23.4.0
UiPath 文档 OCR 现在作为开箱即用的预训练包提供,可用于 GPU 和 CPU。这使不想使用公共端点的客户能够借助隔离环境,在自己的租户中部署 UiPath 文档 OCR。
现在可以使用七个新的开箱即用预训练 ML 包列表供一般用途。 以下是七种新模式的列表:
- 公司注册证书/良好声誉证明书
- 原产地证书
- 儿童产品证书
- CMS1500
- 欧盟符合性声明
- 发货发票
- 工资单
发布日期:2023 年 2 月 23 日
在端点 + DocumentUnderstanding + 数据提取 ML 包中发布 | v23.2.0
新增功能和改进
新版开箱即用预训练 ML 包 (23.1.0) 及其公共端点已发布,现在使用最先进的基于 LayoutLM 转换器的架构,该架构更强大,并且整体上提高了准确性,尤其是在列字段(表格)上。
此改进使开箱即用的预训练 ML 包更加强大,这意味着您可能会在训练和预测时遇到更长的延迟。
For all situations where latency is critical (e.g.: attended scenarios) we recommend deploying the models as ML Skills using a GPU.
We have improved how the scores are calculated after Training/Evaluation/Full pipelines to provide a separate score for each column field. Before this improvement, F1 scores were calculated as a whole, for all column fields taken together.
我们宣布即将移除模型评估中使用的手动编辑功能。单击此处可查看更多信息。
已知问题
The project import from AI Center is currently disabled. We are actively working on this and expect to have it reenabled by the end of March.
2023 年 5 月 8 日勘误
已知问题
Fatal Python error: Segmentation fault
。 在此错误修复之前,我们建议您使用 ML 包 v23.4。
2023 年 4 月 20 日勘误
所有管道的总分现在表示准确度,以前表示 F1 分数。为了保持向后兼容性,AI Center 中的评估工件仍同时包含准确度和 F1 分数。
发行日期:2022 年 12 月 13 日
在端点 + DocumentUnderstanding + Data Extraction ML 包中发布 | v22.11.0
此版本对开箱即用的预训练 ML 包的公共端点进行了重大改进,这意味着我们现在使用的是基于 LayoutLM 的最新深度学习架构。
此改进为所有文档类型(尤其是发票模型)提供更高的准确性,并且还提高了列字段和表格的准确性。
我们向“发票”模型添加了新的提取字段,这些字段现在包含“发货日期”、“供应商电子邮件地址”、“银行名称”、“银行账号”、“IBAN”、“SWIFT 代码”、“银行地址”、“银行汇款路线号码”和“税率”。您可以访问此页面并单击每个模型的可用链接,以查看提取的字段列表。
现在,除了完整管道或评估管道外,训练管道也可以返回模型分数。
现在,每个列字段都可以使用 F1 分数。到目前为止,F1 分数仅适用于作为一个整体的所有列字段。
发行日期:2022 年 10 月 7 日
在端点 + DocumentUnderstanding + Data Extraction ML 包中发布 | v22.10.0
新增功能和改进
-Preview
标签:InvoicesAustralia、InvoicesIndia、PurchaseOrders。
DeliveryNotes 模型已重命名为 BillsOfLading。
现在有十个新的预训练模型可用:Acord25、1040、Checks、Bank Statements、Financial statements、Packing Lists、Acord131、Acord126、Acord140、Vehicle Titles。
错误修复
已修复上述包中的几个错误。
Release date: 6 September 2022
已在 DocumentUnderstanding + 数据提取 ML 包中发布 | v22.6.0 预览版
AI Center 中的 DU ML 包有 18 个新的预览版 ML 包可用,这些包具有更高级的模型架构。您可以通过包名称末尾的“Preview”轻松识别它们,例如:InvoicesPreview、PurchaseOrderPreview、Acord125Preview 等。
我们已使用所有新的预览版 ML 包更新了公共端点列表,您可以在“公共端点”查看。
请注意,这些预览模型不会使用您的许可证权限中的 DU/AI Unit。
修复了私有技能使用方面的错误,现在私有技能只能与属于使用 AI Center 实例的同一组织的 API 密钥一起使用。
发行日期:2022 年 7 月 18 日
已在 Document Understanding + 文档分类器 + 数据提取 ML 包中发布 | v22.5.1
错误修复
- 修复了导致提取的字段显示在验证站点的错误页面上的错误。
- 修复了导致某些页面上的最后一行文本无法在 Document Manager 中数字化的错误。
- 修复了一个错误,该错误会阻止在 AI Center 的完整/评估管道中显示
evaluation_F1_invoices.txt
文件中的某些 F1 分数项目。 - 修复了一个错误,该错误会导致当模型只有列字段时,在 AI Center 的完整/评估管道中的
evaluation_F1_invoices.txt file
中计算错误的整体 F1 分数。
发行日期:2022 年 7 月 14 日
已在 Document Understanding + 文档分类器 + 数据提取 ML 包中发布 | v22.4.2
错误修复
- 修复了导致提取的字段显示在验证站点的错误页面上的错误。
- 修复了导致某些页面上的最后一行文本无法在 Document Manager 中数字化的错误。
- 修复了一个错误,该错误会阻止在 AI Center 的完整/评估管道中显示
evaluation_F1_invoices.txt
文件中的某些 F1 分数项目。 - 修复了一个错误,该错误会导致当模型只有列字段时,在 AI Center 的完整/评估管道中的
evaluation_F1_invoices.txt file
中计算错误的整体 F1 分数。
发行日期:2022 年 5 月 10 日
在 Document Understanding + 文档分类器 + 数据提取 ML 包中发布
| v22.4.0
新增功能
通过集成手写识别 OCR,手写功能现在可用于 UiPath 文档 OCR 和 UiPathDocumentOCR_CPU 包。UiPath.OCR.LocalServer Studio 包中也有相同的功能。
提取 ML 包的新架构,具有重要优势,尤其是对于使用 DocumentUnderstanding ML 包训练的模型。
水电费账单、W9 和护照 ML 包现在已作为 GA 提供。预览版中提供了五个新的开箱即用预训练 ML 包,以简化您的工作。
预览版中提供了五个新的开箱即用预训练 ML 包,以简化您的工作。
“文档搜索”是 Document Manager 中提供的一项新功能,可帮助标记页数很多的文档。
改进
已对用于 AI Center 中文档提取的 ML 包进行了改进。评估 Excel 电子表格推出了新的工作表,使您能够更好地组织和解释评估的数据。
Automation Suite 离线安装中的 ML 包已收到新的离线捆绑包。
UiPathDocumentOCR 的准确性和性能已得到改进。
错误修复
对解析日期字段的多项修复,包括列字段中的日期、土耳其语文档中的日期、遥远的未来日期
发行日期:2022 年 3 月 2 日
已在 Document Understanding + 文档分类器 + 数据提取 ML 包中发布 | v22.1.4
新增功能
水电费账单 ML 包现已正式发布。
改进
总体而言,性能和可扩展性得到了改进。
与以前的版本相比,在新版 DocumentUnderstanding ML 包上训练时的分数有了显着提高。
现在可以正确解析列字段中的日期。
日期解析现在可以识别土耳其语月份名称。
更改
在 GPU 与 CPU 上训练时,更改了训练管道和完整管道的行为。21.10.x在 CPU 上训练的模型更小,因此训练速度比以前的版本更快,但准确性比以前略低。
此版本已逆转此行为,因此在 GPU 和 CPU 上训练的模型是完全相同的模型,并且训练速度已恢复到 2021.10 之前的水平,这意味着在 CPU 上的训练速度再次比在 GPU 上的训练速度慢 10 到 20 倍。
发行日期:2021 年 10 月 22 日
已在数据提取 ML 包和端点中发布| v21.10.9
新增功能
采购订单 ML 包现已正式发布,并且已准备就绪,可以在生产场景中使用。
中国发票、交付说明、汇款通知书、W2 和 W9 ML 包现在处于公开预览阶段。我们建议您签出这些包,并开始将其用于需要处理的文档类型。
改进
已实施文档级别评估。此评估代表了 RPA 工作流的运行时性能。
还可以对数据集进行评估,与对 ML 包进行评估相比,这样需要评估的字段数更少。这有助于对开箱即用的预训练 ML 包进行评估。
eval.redo_ocr
设置为 true。
现在,CPU 上的训练使用更小的模型,可使速度提高 5 到 7 倍。但是,CPU 上的训练预计会导致准确度降低 0-5%。
Evaluation.xlsx
文件添加了“最低置信度”列和“直通处理率”列。
大大改进了 UtilityBills ML 包。
针对跨 1 到 2 行文本的地址改进了地址解析。
改进了提取负值、非常大的值(11 位或以上)或遥远的未来日期的功能。
添加了对收据上的旋转框的支持。
串联跨度增强功能。
错误修复
- 修复了在字符串类型字段中不返回特殊字符的错误。
- 修复了 Passports ML 包的一个错误,即写为序数(1st、2nd、3rd 和 4th 等)的日期解析不正确。
已知问题
当前不支持使用来自验证站点的数据再训练“日本发票”和“中国发票”ML 包。解决方法是使用 Google Cloud Vision OCR。
即将弃用
自 2021 年 12 月 1 日起,非西欧地区不推荐使用除 UiPath 文档 OCR、表单提取程序、智能表单提取程序和智能关键词分类器之外的所有公共端点。
发行日期:2021 年 12 月 13 日
已在端点的表单提取程序 + 智能表单提取程序 + 智能关键字分类器中发布 | v21.10
发行日期:2020 年 11 月 10 日
已在端点和数据提取 ML 包中发布 | v20.10.4
新特性和改进功能
日本发票的新模型。
评估管道现在也会返回“分类”字段的指标。
支持 Microsoft Read OCR 版本 3。
改进了日期格式/解析,以检测日/月/年与月/日/年格式。
改进了小数点和千分号检测功能,以进行正确的数字解析。
所有 AI Fabric 版本均支持 CPU 训练。
id-no
内容类型的字段的解析。
仅支持训练“分类”字段(不包含“常规”字段或“列”字段)。
最大允许字段数已从 32 增加到 40。
报告“列”字段的置信度。
已知问题
class
、break
、from
、finally
、global
、None
等。请注意,此列表并不详尽,因为 class <pkg-name>
和 import <pkg-name>
使用了包名称。
- v24.9.1
- UiPath Document Understanding OCR
- v24.7
- UiPath 文档 OCR
- v24.4.4
- 数据提取
- v24.4.3
- Document Understanding 和数据提取
- v24.4.2
- 印度发票和端点
- v24.4.1
- Document Understanding、日本发票和端点
- v24.4.0
- 文档分类器和数据提取
- v24.3.2
- Document Understanding OCR 端点
- v24.2.1
- Document Understanding OCR 端点
- v24.2.0
- 数据提取
- Document Classifier
- v23.10.4
- 数据提取
- v23.10.3
- Document Understanding、数据提取和端点
- v23.10.2
- Document Understanding 和数据提取
- v23.10.0
- Document Understanding、数据提取和端点
- UiPath Document Understanding OCR
- v23.7.0
- Document Understanding 和数据提取
- v23.6.0
- Document Understanding 和端点
- v23.4.1
- Document Understanding、数据提取和端点
- v23.4.5
- Document Understanding
- v23.4.2
- Document Understanding
- v23.4.0
- Document Understanding、数据提取和端点
- 文档分类器和端点
- v23.2.0
- Document Understanding、数据提取和端点
- v23.1.0
- 文档分类器和端点
- v22.12.2
- 端点
- v22.11.0
- Document Understanding、数据提取和端点
- v22.10.2
- 端点
- v22.10.0
- Document Understanding、数据提取和端点
- UiPath 文档 OCR
- v22.6.1-preview
- Document Understanding、数据提取和端点
- v22.6.0-preview
- Document Understanding 和数据提取
- v22.5.2
- Document Understanding 和数据提取
- v22.5.1
- Document Understanding、文档分类器、数据提取
- v22.5.0
- AI Center Cloud、数据提取
- v22.4.3
- Document Understanding 和数据提取
- v22.4.2
- Document Understanding、文档分类器、数据提取
- v22.4.1
- AI Center Cloud、数据提取
- v22.4.0
- Document Understanding、文档分类器、数据提取
- v22.2.3
- UiPath Document Understanding OCR
- v22.1.6
- Document Understanding、文档分类器、数据提取
- v22.1.4
- Document Understanding、文档分类器、数据提取
- v21.10.11
- 数据提取
- v21.10.9
- 数据提取
- 数据提取和端点
- v21.10.5
- UiPath 文档 OCR 端点
- v21.10.1
- UiPath 文档 OCR 的 数据提取和端点
- v21.10
- 表单提取程序、智能表单提取程序和智能关键字分类器端点
- v21.7
- 用于手写识别的数据提取和端点
- v21.6.3
- 端点中的 UiPath 文档 OCR
- v21.5.5
- 数据提取和端点
- v21.5.3
- 数据提取和端点
- v21.4.7
- 数据提取和端点
- v21.4.5
- 数据提取和端点
- v21.4
- 用于手写识别和文档分类器的数据提取和端点
- v21.1.8
- 数据提取和端点
- v20.11.3
- 数据提取
- v20.10.4
- 数据提取和端点