UiPath Documentation
document-understanding
2024.10
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

上次更新日期 2026年4月6日

Document Understanding 活动

With DocumentUnderstanding.Activities, you can manage documents using a unified approach, by storing every information from the Document UnderstandingTM process within a Document Data object. Moreover, DocumentUnderstanding.Activities is integrated with Modern projects, enabling reusability.

已知限制

我们知道 DocumentUnderstanding.Activities 当前包存在的限制,计划很快会将其解决。以下功能尚不可用:

  • 支持拆分文档。
  • 业务规则。
  • 训练模型。
  • 支持来自未部署自动化租户的模型。
  • 支持 Automation Suite。

1. 处理文档

处理文档涉及准备用于提取的 PDF 文件。通过 Document Understanding 活动,您可以:

  • 提取文本、图像、特定页面或合并多个 PDF。
  • 更改已加密 PDF 文档的密码

要通过 Document Understanding 活动处理 PDF 文件,请使用以下活动:

活动描述
设置 PDF 密码更改指定 PDF 文件的密码。
合并 PDF联接文件对象集合。
获取 PDF 页数提供 PDF 文件中的总页数。
提取 PDF 文本从 PDF 文档中提取文本。
提取 PDF 图像该活动提取在 PDF 文件中找到的所有图像。
提取 PDF 页面范围从 PDF 文档中提取指定范围的页面。

2. 提取数据

Use the Extract Document Data activity to:

  • 从保存为文档数据对象的输入文件中提取数据。
  • 将提取结果存储到同一个文档数据对象中。

Document Data is a resource that serves both as an input and output variable, within your Document Understanding workflows. The Document Data object holds all the necessary information about a single document. If you classify a document, the object includes the Document Type. If you extract data, the object contains the corresponding extracted fields. Irrespective of the activity, Document Data consistently contains the document's text and DOM (Document Object Model).

Provide the file as input only the first time you use Extract Document Data. The output, known as Document Data, should be reused throughout the workflow to prevent re-digitizing the same file, which costs 1 AI Unit per page.

Visit Document Data for more details.

3. 对数据进行分类

Use the Classify Document activity to:

  • 从各种分类模型中进行选择。
  • 将分类数据输出到文档数据对象中。

4. 正在验证数据

文档流程的验证步骤是指发送已处理的文档,以供 Action Center 中的团队成员进行验证。您还可以使用以下活动在 Action Center 中配置验证文档的流程:

活动描述
创建验证任务创建一个验证操作以暂停工作流,直到完成为止。
等待验证任务然后继续暂停操作,直到验证完成,然后自动继续。
创建验证任务并等待在 Action Center 中创建操作以可视化和修改提取结果,并暂停工作流,直到操作完成。
创建分类验证任务创建操作以验证已分类的文档数据,而无需等待其完成。
创建分类验证任务然后等待创建操作以验证已分类数据,并等待其完成,然后再继续工作流。
等待分类验证任务然后继续等待分类验证操作完成,然后再继续工作流。

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新