document-understanding
latest
false
- 概述
- 入门指南
- Activities (活动)
- Insights 仪表板
- Document Understanding 流程
- 快速入门教程
- 框架组件
- 模型详细信息
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 709 - ML 包
- 941x - ML 包
- 9465 - ML 包
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 工资单 - ML 包
- 护照 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 流量限制
- OCR 配置
- 管道
- OCR 服务
- 支持的语言
- 深度学习
- 数据与安全性
- 许可和计费逻辑
Document Understanding 传统用户指南
上次更新日期 2026年5月7日
当原生内容不可用时,可在数字化组件中使用 OCR 引擎来识别文件中的文本。
备注:
需要处理的图像的分辨率范围应为:
- 最小值:50 x 50 像素
- 最大值:9000 x 9000 像素
以下是一系列 OCR 引擎,您可以根据需要在整个 Document Understanding TM框架中进行选择。
| OCR 引擎 | 活动包 | 日志文件夹中的调试日志格式 | 报告置信度 |
|---|---|---|---|
| UiPath 扩展语言 OCR | UiPath.OCR.Activities | ${date:format=yyyy-MM-dd} | ✅ |
| UiPath 文档 OCR | UiPath.OCR.Activities | ${date:format=yyyy-MM-dd} | ✅ |
| 中文、日语和韩语 OCR | UiPath.Core.Activities.CjkOCR | ${date:format=yyyy-MM-dd} | ✅ |
| OmniPage OCR | UiPath.OmniPage.Activities | ${date:format=yyyy-MM-dd} | ✅ |
| Google Cloud Vision OCR | UiPath.UIAutomation.Activities | ${date:format=yyyy-MM-dd} | ❌ 如果“检测模式”设置为“文本检测” (默认) ✅ 如果“检测模式”设置为“文档文本检测” |
| Microsoft Azure 计算机视觉 OCR | UiPath.UIAutomation.Activities | ${date:format=yyyy-MM-dd} | ❌ 如果未选择“使用读取 API” (默认)(默认) ✅ 如果已选择“使用读取 API” |
| Microsoft OCR | UiPath.UIAutomation.Activities | ${date:format=yyyy-MM-dd} | ❌ |
| Tesseract OCR | UiPath.UIAutomation.Activities | ${date:format=yyyy-MM-dd} | ✅ |