- Document Understanding 发行说明
- ML 包和公共端点发行说明
- 常规 ML 包和公共端点更新
- ML 包和公共端点版本历史记录
常规 ML 包和公共端点更新
Release date: 3 October 2024
We are excited to announce that our latest OCR engine, UiPath Extended Languages OCR, is now in general availability. The new OCR is capable of digitizing documents in over 200 languages, bringing a significant improvement over its predecessor, especially in regards to Chinese, Japanese, and Korean. Additionally, it can process documents in Thai, Vietnamese, all major languages from India, as well as languages using the Cyrilic alphabet, and Greek.
UiPath 扩展语言 OCR 当前仅可用作公共端点。
Release date: 17 September 2024
此版本提高了基于UiPath DocPath (新的 UiPath LLM)的模型的准确性和性能。 此外,以下模型现在也基于 UiPath DocPath:
- 709
- 941x
- 1040x
- 3949
- 3949a
发行日期:2024 年 7 月 8 日
自 2025 年 1 月起,我们将弃用 UiPath 中文、日语、韩语 OCR。我们建议改用 UiPath 扩展语言 OCR。
查看“弃用时间线”页面,详细了解即将弃用和删除的内容。
发布日期:2024 年 6 月 12 日
我们很高兴宣布发布改进的发票和收据端点。基于新的 UiPath LLM,即 UiPath DocPath 的新生成功能提高了准确性和性能。
- 709
- 941x
- 1040x
- 3949a
- 9465
- 中国发票
- 希伯来语发票
- 日本发票
查看发行说明,以了解未来的公告。
发行日期:2024 年 5 月 29 日
我们很高兴宣布将发布改进的端点,用于开箱即用的预训练 ML 包。基于新的 UiPath™ LLM,即 UiPath DocPath 的新生成功能提高了准确性和性能。
- 709
- 941x
- 1040x
- 3949a
- 9465
- 发票
- 中国发票
- 希伯来语发票
- 日本发票
- 收据
查看发行说明,以了解未来的公告。
发行日期:2024 年 3 月 28 日
我们很高兴宣布,UiPath 最新 OCR 引擎 UiPath 扩展语言 OCR 现已推出公开预览版。新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显著改进,尤其是在中文、日语和韩语方面。此外,它可以处理泰语、越南语、印度的所有主要语言以及使用西里尔字母的语言和希腊语的文档。
UiPath 扩展语言 OCR 当前仅可用作公共端点。
发行日期:2023 年 4 月 27 日
ML 包版本 v23.4 及更高版本现在拥有使用冻结主干进行训练的选项。对于 400 页以下的小型或低多样性训练集,这种新方法的训练速度更快,并且效果更好。您可以使用官方文档中记录的新训练管道环境变量覆盖此行为。
发布日期:2022 年 11 月 29 日
我们宣布即将弃用澳大利亚发票预训练 ML 包。我们建议改用发票 ML 包。您可以在此处找到更多相关详细信息。
- UiPath Extended Languages OCR in general availability
- 基于UiPath™ DocPath 的新公共端点
- Improved performance and new model endpoints enrolled on UiPath DocPath
- 模型端点重定向到年老代
- 预览模型已删除
- 弃用 UiPath 中文、日语、韩语 OCR
- 基于 UiPath™ DocPath 的发票和收据公共端点
- 基于 DocPath 的公共端点
- UiPath 扩展语言 OCR(公共预览版)
- 冻结的主干训练
- 已弃用澳大利亚发票
- ML 分类端点公开预览
- UiPath 中文、日语、韩语 OCR 版本
- 端点
- 数据提取 ML 包