- 概述
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 709 - ML 包
- 941x - ML 包
- 9465 - ML 包
- 990 - ML 包 - 预览
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 护照 - ML 包
- 工资单 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 硬件要求
- 管道
- Document Manager
- OCR 服务
- 支持的语言
- 深度学习
- Insights 仪表板
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 许可
- Activities (活动)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding 用户指南
Document Understanding 活动
With DocumentUnderstanding.Activities, you can manage documents using a unified approach, by storing every information from the Document UnderstandingTM process within a Document Data object. Moreover, DocumentUnderstanding.Activities is integrated with Modern projects, enabling reusability.
已知限制
我们知道 DocumentUnderstanding.Activities 当前包存在的限制,计划很快会将其解决。以下功能尚不可用:
- 支持拆分文档。
- 业务规则。
- 训练模型。
- 支持来自未部署自动化租户的模型。
- 支持 Automation Suite。
1. 处理文档
处理文档涉及准备用于提取的 PDF 文件。通过 Document Understanding 活动,您可以:
- 提取文本、图像、特定页面或合并多个 PDF。
- 更改已加密 PDF 文档的密码
要通过 Document Understanding 活动处理 PDF 文件,请使用以下活动:
2. 提取数据
Use the Extract Document Data activity to:
- 从保存为文档数据对象的输入文件中提取数据。
- 将提取结果存储到同一个文档数据对象中。
Document Data is a resource that serves both as an input and output variable, within your Document Understanding workflows. The Document Data object holds all the necessary information about a single document. If you classify a document, the object includes the Document Type. If you extract data, the object contains the corresponding extracted fields. Irrespective of the activity, Document Data consistently contains the document's text and DOM (Document Object Model).
Provide the file as input only the first time you use Extract Document Data. The output, known as Document Data, should be reused throughout the workflow to prevent re-digitizing the same file, which costs 1 AI Unit per page.
Visit Document Data for more details.
3. 对数据进行分类
Use the Classify Document activity to:
- 从各种分类模型中进行选择。
- 将分类数据输出到文档数据对象中。
4. 正在验证数据
文档流程的验证步骤是指发送已处理的文档,以供 Action Center 中的团队成员进行验证。您还可以使用以下活动在 Action Center 中配置验证文档的流程:
| 活动 | 描述 |
|---|---|
| 创建验证任务 | 创建一个验证操作以暂停工作流,直到完成为止。 |
| 等待验证任务然后继续 | 暂停操作,直到验证完成,然后自动继续。 |
| 创建验证任务并等待 | 在 Action Center 中创建操作以可视化和修改提取结果,并暂停工作流,直到操作完成。 |
| 创建分类验证任务 | 创建操作以验证已分类的文档数据,而无需等待其完成。 |
| 创建分类验证任务然后等待 | 创建操作以验证已分类数据,并等待其完成,然后再继续工作流。 |
| 等待分类验证任务然后继续 | 等待分类验证操作完成,然后再继续工作流。 |