document-understanding
2023.4
false
- 概述
 - Document Understanding 流程
 - 快速入门教程
 - 框架组件
 - ML 包
- 概述
 - Document Understanding - ML 包
 - DocumentClassifier - ML 包
 - 具有 OCR 功能的 ML 包
 - 1040 - ML 包
 - 4506T - ML 包
 - 990 - ML 包 - 预览
 - ACORD125 - ML 包
 - ACORD126 - ML 包
 - ACORD131 - ML 包
 - ACORD140 - ML 包
 - ACORD25 - ML 包
 - 银行对账单 - ML 包
 - 提单 - ML 包
 - 公司注册证书 - ML 包
 - 原产地证书 - ML 包
 - 检查 - ML 包
 - 儿童产品证书 - ML 包
 - CMS1500 - ML 包
 - 欧盟符合性声明 - ML 包
 - 财务报表 (Financial statements) - ML 包
 - FM1003 - ML 包
 - I9 - ML 包
 - ID Cards - ML 包
 - Invoices - ML 包
 - InvoicesAustralia - ML 包
 - 中国发票 - ML 包
 - 印度发票 - ML 包
 - 日本发票 - ML 包
 - 装运发票 - ML 包
 - 装箱单 - ML 包
 - 护照 - ML 包
 - 工资单 - ML 包
 - 采购订单 - ML 包
 - 收据 - ML 包
 - 汇款通知书 - ML 包
 - 水电费账单 - ML 包
 - 车辆所有权证明 - ML 包
 - W2 - ML 包
 - W9 - ML 包
 
- 其他开箱即用的 ML 包
 - 公共端点
 - 硬件要求
 
 - 管道
 - Document Manager
 - OCR 服务
 - 深度学习
 - 部署在 Automation Suite 中的 Document Understanding
 - 在 AI Center 独立版中部署的 Document Understanding
 - 许可
 - 活动
- UiPath.Abbyy.Activities
 - UiPath.AbbyyEmbedded.Activities
 - UiPath.DocumentProcessing.Contracts
 - UiPath.DocumentUnderstanding.ML.Activities
 - UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
 - UiPath.Intelligent OCR.Activities
 - UiPath.OCR.Activities
 - UiPath.OCR.Contracts
 - UiPath.OmniPage.Activities
 - UiPath.PDF.Activities
 
 
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。

Document Understanding 用户指南
上次更新日期 2025年10月22日
数字化是指从给定的传入文件中获取机器可读文本的过程,以便机器人能够理解其中的内容并采取相应行动。对于需要通过 Document UnderstandingTM 框架处理的文件,这是要应用的第一个步骤。
数字化步骤有两个输出:
- 已处理文件中的文本,存储在字符串变量中;以及
 - 文件的文档对象模型 - JSON 对象,其中包含名称、内容类型、文本长度、页数等基本信息,还有各种详细信息,例如页面旋转、检测到的语言、文件中每个字词的内容和坐标。
 
在文档处理框架中,使用“数字化文档”活动执行数字化。
什么不是数字化
尽管相关,但数字化步骤并非 OCR。
在许多情况下,需要处理的文件是原生 PDF 文件(未扫描),无需使用 OCR 即可由机器人以编程方式读取文件。
何时在数字化中使用 OCR
作为配置的一部分,“数字化文档”活动需要选择 OCR 引擎,以便可以在需要时使用,但仅对以下文件执行 OCR:
- 图像文件
                        
- 支持的图像格式为 .png、.jpe、.jpg、.jpeg、.tiff、.tif、.bmp
 - 对于多页 TIFF 文件,则对每一页应用 OCR
 
 - 以下 PDF 页面:
                        
- 不会公开任何计算机可读内容
 - 其中包含覆盖页面很大一部分的图像。
 
 
注意:以下数字化限制适用:
                     
                  
                  - 文件大小限制为 160 MB。
 - 每个文档最多包含 500 页。
 
如果“数字化文档”活动配置为将“强制应用 OCR”标志设为 "True",则仍应用 OCR。通常建议在以下情况下使用此选项:大部分文件似乎都包含原生内容,但原生读取的内容与用户在这些文件中看到的内容并不相符。
如何选择 OCR 引擎
由于每个用例都有其自身的特殊性,因此强烈建议使用不同的设置测试所有可用的 OCR 引擎,以确定哪个引擎最适合您的项目。另一个建议是要特别注意 OCR 引擎的参数,例如Profile、Scale、Language 等(可能因引擎而异),以便为每个用例确定最佳设置。