document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
上次更新日期 2024年12月18日

Document Understanding 活动

With DocumentUnderstanding.Activities, you can manage documents using a unified approach, by storing every information from the Document UnderstandingTM process within a Document Data object. Moreover, DocumentUnderstanding.Activities is integrated with Modern projects, enabling reusability.

已知限制

我们知道 DocumentUnderstanding.Activities 当前包存在的限制,计划很快会将其解决。以下功能尚不可用:

  • 支持拆分文档。
  • 业务规则。
  • 训练模型。
  • 支持来自未部署自动化租户的模型。
  • 支持 Automation Suite。

以下各部分使用 Document Understanding 活动介绍 Document Understanding 流程的每个阶段。

1. 处理文档

处理文档涉及准备用于提取的 PDF 文件。通过 Document Understanding 活动,您可以:

  • 提取文本、图像、特定页面或合并多个 PDF。
  • 更改已加密 PDF 文档的密码

要通过 Document Understanding 活动处理 PDF 文件,请使用以下活动:

活动描述
设置 PDF 密码更改指定 PDF 文件的密码。
合并 PDF联接文件对象集合。
获取 PDF 页数提供 PDF 文件中的总页数。
提取 PDF 文本从 PDF 文档中提取文本。
提取 PDF 图像该活动提取在 PDF 文件中找到的所有图像。
提取 PDF 页面范围从 PDF 文档中提取指定范围的页面。

2. 提取数据

使用“提取文档数据”活动执行以下操作:

  • 从保存为文档数据对象的输入文件中提取数据。
  • 将提取结果存储到同一个文档数据对象中。

文档数据是在 Document Understanding 工作流中充当输入变量和输出变量的资源。文档数据对象保存有关单个文档的所有必要信息。如果您对文档进行分类,则对象包括文档类型。如果提取数据,则对象将包含相应的提取字段。无论何种活动,文档数据都会一致地包含文档的文本和 DOM(文档对象模型)。

仅在您首次使用“提取文档数据”时提供文件作为输入。应在整个工作流中重复使用输出(称为“文档数据”),以防止对同一个文件重新进行数字化,这会导致每页消耗 1 个 AI Unit。

有关更多详细信息,请访问文档数据

3. 对数据进行分类

使用“分类文档”活动执行以下操作:

  • 从各种分类模型中进行选择。
  • 将分类数据输出到文档数据对象中。

4. 正在验证数据

文档流程的验证步骤是指发送已处理的文档,以供 Action Center 中的团队成员进行验证。您还可以使用以下活动在 Action Center 中配置验证文档的流程:

活动描述
创建验证任务创建一个验证操作以暂停工作流,直到完成为止。
等待验证任务然后继续暂停操作,直到验证完成,然后自动继续。
创建验证任务并等待在 Action Center 中创建操作以可视化和修改提取结果,并暂停工作流,直到操作完成。
创建分类验证任务创建操作以验证已分类的文档数据,而无需等待其完成。
创建分类验证任务然后等待创建操作以验证已分类数据,并等待其完成,然后再继续工作流。
等待分类验证任务然后继续等待分类验证操作完成,然后再继续工作流。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。