- 概述
 - 入门指南
 - 活动
 - Insights 仪表板
 - Document Understanding 流程
 - 快速入门教程
 - 框架组件
 - ML 包
- 概述
 - Document Understanding - ML 包
 - DocumentClassifier - ML 包
 - 具有 OCR 功能的 ML 包
 - 1040 - ML 包
 - 1040 附表 C - ML 包
 - 1040 附表 D - ML 包
 - 1040 附表 E - ML 包
 - 1040x - ML 包
 - 3949a - ML 包
 - 4506T - ML 包
 - 709 - ML 包
 - 941x - ML 包
 - 9465 - ML 包
 - ACORD125 - ML 包
 - ACORD126 - ML 包
 - ACORD131 - ML 包
 - ACORD140 - ML 包
 - ACORD25 - ML 包
 - 银行对账单 - ML 包
 - 提单 - ML 包
 - 公司注册证书 - ML 包
 - 原产地证书 - ML 包
 - 检查 - ML 包
 - 儿童产品证书 - ML 包
 - CMS1500 - ML 包
 - 欧盟符合性声明 - ML 包
 - 财务报表 (Financial statements) - ML 包
 - FM1003 - ML 包
 - I9 - ML 包
 - ID Cards - ML 包
 - Invoices - ML 包
 - InvoicesAustralia - ML 包
 - 中国发票 - ML 包
 - 希伯来语发票 - ML 包
 - 印度发票 - ML 包
 - 日本发票 - ML 包
 - 装运发票 - ML 包
 - 装箱单 - ML 包
 - 工资单 - ML 包
 - 护照 - ML 包
 - 采购订单 - ML 包
 - 收据 - ML 包
 - 汇款通知书 - ML 包
 - UB04 - ML 包
 - 水电费账单 - ML 包
 - 车辆所有权证明 - ML 包
 - W2 - ML 包
 - W9 - ML 包
 
- 其他开箱即用的 ML 包
 - 公共端点
 - 流量限制
 - OCR 配置
 
 - 管道
 - OCR 服务
 - 支持的语言
 - 深度学习
 - 数据与安全性
 - 许可
 

Document Understanding 用户指南
通过将具有 OCR 功能的 ML 包合并到工作流中,在您使用 Document UnderstandingTM 时优化结果并简化工作。
这是一个不可重新训练的模型,可与“UiPath 文档 OCR 引擎”活动一起使用,作为“数字化文档”活动的一部分。要使用此模型,首先必须将 ML 技能设为公开,以便将 URL 复制粘贴到 UiPath™ 文档 OCR 引擎活动中。
您可以在 GPU 或 CPU 上运行 UiPath 文档 OCR,两种情况下的准确性相同,GPU 上的预测比 CPU 上的快。
UiPath Document OCR 需要访问 https://du.uipath.com/metering 上的 Document Understanding 计量服务器,如果 ML 技能在内部部署 AI Center 常规部署上运行。内部部署 AI Center 离线部署不需要互联网访问。
此 ML 包的部署方式与 UiPathDocumentOCR ML 包相同,但有以下区别:
- 它针对在 CPU 上运行进行了优化,因此在工作流中运行时速度提高了 3-4 倍,使用它将文档其导入 Document Manager 时速度提高了 5-10 倍
 - 准确性略低于 UiPathDocumentOCR ML 包,但类似于 UiPath.DocumentUnderstanding.OCR.LocalServer Studio 包
 - 由于速度更快,因此在没有 GPU 的情况下,当文档很大(每个文档超过 20 页)时,也建议使用 CPU,这是理想的选择。
 
UiPath 扩展语言 OCR 能够处理 200 多种语言的文档,尤其是中文、韩语、越南语、泰语、主要的印度语言以及使用西里尔语或希腊字母的语言。
您可以在配置时将此端点的 URL 用于 UiPath 扩展语言 OCR 活动,也可以直接在 Document Understanding 项目中使用。
在 Document Understanding 框架中可用作端点,仅 CPU。您可以在配置时将此端点的 URL 用于中文、日语和韩语的 OCR 活动,或直接在 Document Manager 会话中使用。