- Document Understanding 发行说明
- ML 包和公共端点发行说明
- 常规 ML 包和公共端点更新
- ML 包和公共端点版本历史记录

Document Understanding 发行说明
常规 ML 包和公共端点更新
发行说明:2025 年 6 月 23 日
此更新对我们的光学字符识别 (OCR) 引擎进行了一系列改进,旨在提高更广泛的输入样式的准确性和可靠性:
-
更好的手写检测功能。
-
更清晰地区分等宽字体中的“O”和“0”。
-
改进了对点矩阵打印文本的识别。
这些改进提高了各种文档类型的可靠性。
发行说明:2025 年 5 月 19 日
现在,您也可以通过 API、“智能 OCR”和“Document Understanding”活动使用“日本收据”文档类型。这适用于日本地区的所有租户。
发行日期:2025 年 4 月 11 日
随着新的替代方案和改进的解决方案的发布,我们删除了对开箱即用模型的支持,包括 UiPath Document Understanding OCR 和 OCR_CPU、数据提取 ML 包和 DocumentClassifier。
下表描述了删除计划。
特性或功能 | 移除公布日期 | 移除日期: | 注意 |
---|---|---|---|
版本低于 2023.4 的开箱即用 ML 包 | 2025 年 4 月 | 2025 年 4 月 | 我们建议使用最新版本的开箱即用 ML 包。 |
有关弃用的更多信息,请查看概述指南中的弃用时间线。
发布日期:2024 年 11 月 28 日
我们很高兴宣布发布改进的中国发票和日本发票端点。基于新的 UiPath LLM,即 UiPath DocPath 的新生成端点提高了准确性和性能。
发布日期:2024 年 10 月 3 日
我们很高兴宣布,UiPath 最新的 OCR 引擎UiPath 扩展语言 OCR现已正式发布。新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显著改进,尤其是在中文、日语和韩语方面。此外,它可以处理泰语、越南语、印度的所有主要语言以及使用西里尔字母的语言和希腊语的文档。
UiPath 扩展语言 OCR 当前仅可用作公共端点。
发布日期:2024 年 9 月 17 日
此版本提高了基于 UiPath DocPath(新的 UiPath LLM)的模型的准确性和性能。此外,以下模型现在也基于 UiPath DocPath:
- 709
- 941x
- 1040x
- 3949
- 3949a
发行日期:2024 年 7 月 8 日
自 2025 年 1 月起,我们将弃用 UiPath 中文、日语、韩语 OCR。我们建议改用 UiPath 扩展语言 OCR。
查看“弃用时间线”页面,详细了解即将弃用和删除的内容。
发布日期:2024 年 6 月 12 日
我们很高兴宣布发布改进的发票和收据端点。基于新的 UiPath LLM,即 UiPath DocPath 的新生成功能提高了准确性和性能。
- 709
- 941x
- 1040x
- 3949a
- 9465
- 中国发票
- 希伯来语发票
- 日本发票
查看发行说明,以了解未来的公告。
发行日期:2024 年 5 月 29 日
我们很高兴宣布将发布改进的端点,用于开箱即用的预训练 ML 包。基于新的 UiPath™ LLM,即 UiPath DocPath 的新生成功能提高了准确性和性能。
- 709
- 941x
- 1040x
- 3949a
- 9465
- 发票
- 中国发票
- 希伯来语发票
- 日本发票
- 收据
查看发行说明,以了解未来的公告。
发行日期:2024 年 3 月 28 日
我们很高兴宣布,UiPath 最新 OCR 引擎 UiPath 扩展语言 OCR 现已推出公开预览版。新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显著改进,尤其是在中文、日语和韩语方面。此外,它可以处理泰语、越南语、印度的所有主要语言以及使用西里尔字母的语言和希腊语的文档。
UiPath 扩展语言 OCR 当前仅可用作公共端点。
发行日期:2023 年 4 月 27 日
ML 包版本 v23.4 及更高版本现在拥有使用冻结主干进行训练的选项。对于 400 页以下的小型或低多样性训练集,这种新方法的训练速度更快,并且效果更好。您可以使用官方文档中记录的新训练管道环境变量覆盖此行为。
发布日期:2022 年 11 月 29 日
我们宣布即将弃用澳大利亚发票预训练 ML 包。我们建议改用发票 ML 包。您可以在此处找到更多相关详细信息。
- 增强的字符识别功能
- 可通过 API 和活动使用的收据日本文档类型
- 删除版本低于 2023.4 的开箱即用模型
- 删除版本低于 2023.4 的开箱即用模型
- UiPath Document OCR 公共端点版本
- 改进
- UiPath DocPath 公共端点 版本
- 新的文档类型
- 基于 UiPath DocPath 的中国发票和日本发票的公共 端点
- 日本发票改进
- 发布日本发票公共端点
- 改进
- 发布新的日本发票公共 端点
- 改进
- UiPath 扩展语言 OCR 正式发布
- 基于 UiPath™ DocPath 的新公共端点
- UiPath DocPath 上改进的性能和加入的新模型端点
- 模型端点重定向到旧一代
- 预览模型已删除
- 弃用 UiPath 中文、日语、韩语 OCR
- 基于 UiPath™ DocPath 的发票和收据公共端点
- 基于 DocPath 的公共端点
- UiPath 扩展语言 OCR(公共预览版)
- 冻结的主干训练
- 已弃用澳大利亚发票
- ML 分类端点公开预览
- UiPath 中文、日语、韩语 OCR 版本
- 端点
- 数据提取 ML 包