- 概述
- 入门指南
- 活动
- Insights 仪表板
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 709 - ML 包
- 941x - ML 包
- 9465 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 工资单 - ML 包
- 护照 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 流量限制
- OCR 配置
- 管道
- OCR 服务
- 支持的语言
- 深度学习
- 许可
Document Understanding 用户指南
具有 OCR 功能的 ML 包
通过将具有 OCR 功能的 ML 包合并到工作流中,在您使用Document Understanding TM时优化结果并简化工作。
这是一个不可重新训练的模型,可与UiPath 文档 OCR引擎活动一起使用,作为“数字化文档”活动的一部分。 要使用此模型,首先必须将 ML 技能设为公开,以便将 URL 复制粘贴到UiPath™ Document OCR 引擎活动中。
您可以在 GPU 或 CPU 上运行 UiPath 文档 OCR,两种情况下的准确性相同,GPU 上的预测比 CPU 上的快。
UiPath Document OCR 需要访问 https://du.uipath.com/metering 上的 Document Understanding 计量服务器,如果 ML 技能在内部部署 AI Center 常规部署上运行。内部部署 AI Center 离线部署不需要互联网访问。
此 ML 包的部署方式与 UiPathDocumentOCR ML 包相同,但有以下区别:
- 它针对在 CPU 上运行进行了优化,因此在工作流中运行时速度提高了 3-4 倍,并且将其导入 Document Manager 时速度提高了 5-10 倍
- 准确性略低于 UiPathDocumentOCR ML 包,但类似于 UiPath.DocumentUnderstanding.OCR.LocalServer Studio 包
- 由于速度更快,因此在没有 GPU 的情况下,当文档很大(每个文档超过 20 页)时,也建议使用 CPU,这是理想的选择。
UiPath 扩展语言 OCR 能够处理 200 多种语言的文档,尤其是中文、韩语、越南语、泰语、主要的印度语言以及使用西里尔语或希腊字母的语言。
您可以在配置时将此端点的 URL 用于 UiPath 扩展语言 OCR 活动,也可以直接在 Document Understanding 项目中使用。
在 Document Understanding 框架中可用作端点,仅 CPU。您可以在配置时将此端点的 URL 用于中文、日语和韩语的 OCR 活动,或直接在 Document Manager 会话中使用。