- 概述
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 4506T - ML 包
- 990 - ML 包 - 预览
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 护照 - ML 包
- 工资单 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 硬件要求
- 管道
- Document Manager
- OCR 服务
- OCR 服务
- 深度学习
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 许可
- Activities (活动)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding 用户指南
OCR 服务
关于 OCR 服务
OCR 服务用于以下目的:
- At data labeling time, when importing documents into Document Manager. The engines available for this step are UiPath® Document OCR, Google Cloud Vision OCR, and Microsoft Read OCR.
- 此操作是在运行期间从 RPA 工作流调用模型时进行的。此步骤可用的引擎是与 UiPath RPA 平台集成的所有引擎,以及 Microsoft OCR(旧版)、Microsoft Project Oxford OCR 和 Tesseract。
In production, we recommend calling the OCR using the Digitize Document activity in your workflow and passing the Document Object Model as input to the activity calling the ML model. For this purpose, you need to use the Machine Learning Extractor activity (Official feed).
为便于测试,您也可以直接在 AI Center(“设置”窗口)中配置 OCR,但对于生产部署不建议这样做。
在 Document Manager 和 AI Center Document Understanding™ ML 包中配置 OCR 服务
下表显示了如何在 Document Manager 和 AI Center 中配置 6 种受支持的 OCR 引擎类型。
ocr.method 参数对应于 AI Center 的“ML 包创建”视图中的“OCR 引擎”下拉列表。
| OCR 引擎 | OCR 方法 | OCR 密钥 | OCR URL |
|---|---|---|---|
| UiPath | UiPath Document OCR (Cloud and On-Premises) UiPathDocumentOCR_CPU(On-Premises) OCR for Chinese, Japanese, Korean (Cloud and On-Premises) | Automation Suite API Key* Enterprise Plan | 部署 UiPath Document OCR 后生成的 ML 技能 URL。 |
| Google Cloud Vision OCR | GCP 控制台 API 密钥 | https://vision.googleapis.com/v1/images:annotate | |
| Microsoft Read 2.0 内部部署 | Microsoft Read OCR | 无 | http://<IP_addr>:<port_number>/vision/v2.0/read/core/Analyze |
| Microsoft Read 2.0 Azure | Microsoft Read OCR | 来自 Azure 门户的资源的 API 密钥 | <Azure_resource_Endpoint>/vision/v2.0/read/core/asyncBatchAnalyze |
| Microsoft Read 3.2 内部部署 | Microsoft Read OCR | 无 | http://<IP_addr>:<port_number>/vision/v3.2/read/analyze |
| Microsoft Read 3.2 Azure | Microsoft Read OCR | 来自 Azure 门户的资源的 API 密钥 | <Azure_resource_Endpoint>/vision/v3.2/read/analyze |
*If you consume services or endpoints from an Automation CloudTM environment (for example, du.uipath.com/ocr or du.uipath.com/ie/invoices) while you are using a deployment type other than Automation Cloud, such as Automation Suite offline, you need to add the API key from an Automation Cloud account. Make sure that you use the Automation Cloud API Key for public endpoints, and the Automation Suite API Key for endpoints hosted within Automation Suite.