document-understanding
2021.10
false
UiPath logo, featuring letters U and I in white
不在支持范围内

Document Understanding 用户指南

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
上次更新日期 2024年11月11日

验证站点

重要提示:如果您使用的是 Intel Xe GPU验证站点未正确显示,我们建议将图形驱动程序更新到最新版本。有关详细信息,请参阅此页面

验证站点是一个用户界面,可用于验证和更正使用 Document Understanding 框架从文档中提取的数据。

验证站点管理

验证站点既可作为独立工具使用,也可与 Orchestrator/Automation Cloud Orchestrator 集成。

此外,还可通过呈现验证站点用作 Attended 活动,也可通过创建文档验证操作等待文档验证操作并继续用作 Action Center 中的一个操作类型,作为 Orchestrator 任务的一部分。

文档验证要求

需要提供特定的输入,以便验证站点可以正常运行。要将验证站点配置为有人值守的活动,至少需要以下输入:

  • 提供处理文档所需的分类。可以使用分类管理器向导在工作流中直接创建,也可以使用“加载分类”活动加载。应将其作为 DocumentTaxonomy 变量提供。
  • 提供要验证的文件的文档路径
  • 为文件提供文档对象模型,您可以将其作为“数字化文档”活动的输出来获取。
  • 提供文件的文档文本,您可以将其作为同一“数字化文档”活动的输出来获取。
  • 提供“自动提取结果”,该结果是机器人自动提取的数据,现在需要人工验证。这是“数据提取作用域”活动的输出。

    注意:如果“自动提取结果”属性字段中未提供任何变量,或提供的变量中未发布任何分类,则“验证站点”将在全手动处理模式下打开。

将验证站点作为有人值守的活动

您可以在工作流中的任何位置使用“显示验证站点”活动。

只有当需要处理的文件在执行流程的计算机本地可用时,有人值守的活动才会起作用。

在运行时,系统将打开一个窗口,其中显示“验证站点”,用户可以进行任何交互。

Action Center 中的验证站点

通过在 On-Prem Orchestrator 或其 Automation Cloud Orchestrator 副本中创建可在 Action Center 中添加文档验证操作的编排流程来提高生产力。此操作可减少您在本地存储文档、在每个人类操作的计算机上安装一个机器人或让机器人等待人类用户完成验证的需求。

此方法要求您将机器人连接到 Orchestrator,并在 UiPath Studio 中构建类型为“编排流程”的项目。项目准备就绪后,您就可以将其发布到 Orchestrator。您可以在此处找到有关此流程的更多信息。

在使用 UiPath Orchestrator 运行项目时,您需要使用“创建文档验证操作”和“等待文档验证操作并继续”活动,原因在于您可以通过这种方式在执行自动操作的无人值守机器人与可以从 Action Center(内部部署或云端)接收操作的知识工人之间建立联系。

在这种情况下,UiPath Orchestrator 的 Action Center 中会直接显示验证站点用户界面,但其功能与作为有人值守活动运行时相同。

使用“验证站点”

验证站点是一款功能强大的工具,让用户可以查看和更正从文件中自动提取的数据,或手动处理文件以进行数据提取。

打开验证站点后,系统会显示所有提取的信息以及正在处理的文件:



验证站点中显示的字段正是在工作流中所使用的分类中定义的字段。

文档视图部分

验证站点的右侧区域包含原始文档的交互式版本,可以在其中选择文本或文档部分,并且可以根据数字化流程的输出单击文字。

此区域还包含用于“放大和缩小”、“选择和旋转”页面、“搜索文档”或“切换到文本视图”的选项。



以下是“验证站点”屏幕右侧的可用选项:

选项

描述

在文档的文本视图和图像视图之间切换。

放大文档。

重置文档的缩放级别。仅当存在先前已放大或缩小文档的情况,才启用此选项。

缩小文档。

顺时针旋转当前页面。

  • docs image - 令牌
  • docs image - 自定义区域
  • docs image - 选择

在图像视图中设置选择模式

  • docs image - 文本
  • docs image - 令牌

在文本视图中设置选择模式

在验证站点使用的文档结果之间启动搜索。

显示验证站点支持的所有可用键盘快捷方式。

以下是如何使用“切换”、“放大”、“缩小”和“重置缩放比例”选项的示例:



要放大或缩小,您还可以按住 Ctrl 键并滚动鼠标滚轮:按住 Ctrl 键并向上滚动可查看文档的特定部分;按住 Ctrl 键并向下滚动可查看文档的较大部分。

以下示例说明了“旋转”选项:



图像视图中可见的区域选择如下所示:



相应地,请查看文本视图中的区域选择:



下一个示例说明了如何使用“搜索”选项:



有许多键盘快捷方式可用来优化与“验证站点”的人工交互。我们建议您尽量使用。您可以在“键盘快捷键”弹出窗口中查看这些快捷方式。

快捷方式

描述

n

移至下一个字段

p

移至上一个字段

f v

将值标记为已验证

f c

更改提取的值

f z

还原为上一个值

f a

添加其他值

f s

在建议之间切换

Esc

  • Exits edit mode (for Fields and Tables)
  • Collapses the derived parts (for Fields)
  • Deselects a line or Exits table selection mode (for Table Selection)

Del

  • 删除选定的值(对于字段)
  • 删除选定的行(用于表格选择)

d +

放大

d -

缩小

d 0

重置缩放比例

d r

顺时针旋转页面

d t

切换文本模式

/

启动搜索

d s

更改选择模式

移至右侧单元格

移至左侧单元格

移至顶部单元格

移至底部单元格

t v

将单元格标记为已验证

t c

更改提取的单元格

t z

还原为上一个单元格值

t DEL

删除选定的单元格

s

将选定的行向左移动

s

将选定的行向右移动

s

上移选定的行

s

下移选定的行

s d

复制选定的行

s v

选择垂直行

s f

选择水平行

s a

通过鼠标移动自动检测行

s t

手动工具选择 - 移动并删除行

?

打开键盘快捷方式列表

!

将文档报告为异常

CTRL Enter

保存所有数据

CTRL DEL

放弃所有当前更改

1 2 3 4 5 6 7 8 9 q w e r y u i o a g h j k l b m @ # $ % ^ & ***** ( ) [ ] { **

  • Assigns values to a field
  • Selects the corresponding field

可视化可用的键盘快捷方式:



数据提取部分

左侧区域会显示您为当前验证选择的文档类型。您可在其中选择每个元素的状态,并将其与文档中的相应文字或区域相关联。



您可以使用字段快捷方式为字段分配值或在字段之间切换。将值分配给字段后,系统会根据所选字段的颜色高亮显示该字段。



对于分配的值,表格字段中会显示一个文档裁剪结果。这有助于更好地定位从中提取值的区域,还可以通过将其与文档裁剪结果进行比较来再次检查值。



备注:

“文档类型”是一个特殊字段,您可以根据需要执行以下操作:

  • 如果提取结果包含一个文档类型,并且该文档类型正确无误,则无需执行任何操作。
  • 如果提取结果中包含一个文档类型,并且该文档类型有误,则您必须选择正确的文档类型,并从文档中提供相关证据。
  • 如果未提供提取结果,并且分类中仅有一种文档类型,则预选该文档类型,但这需要证明。
  • 如果未提供提取结果,并且分类中存在多种文档类型,则您必须手动选择所需的文档类型,并为此提供证据。

所有包含信息的字段都有一个“选项”下拉菜单,可通过单击 按钮获取此菜单。下拉列表变为可见,显示多个编辑选项。



菜单包含以下选项:

  • 更改提取的值 - 使用手动选择的值更改自动提取的值。仅当从文档中选择一个或多个与原始值不同的值时,此字段才处于活动状态。
  • 还原为上一个值 - 将字段的值重置为其上一个状态。仅当存在先前已更改或删除某个值的情况时,此选项才处于活动状态。
  • 标记为缺失 - 如果文档中没有信息,则将字段标记为缺失。


选择模式

使用验证站点向导时,有几种选择文本的方法。使用这些方法,您可以快速浏览整个文档,并轻松选择所需的字词来验证字段。

以下是所有可用选择选项的列表:

  • 选择一个单词 - 单击所需的单词。
  • 选择连续的单词 - 单击第一个单词,然后按住 Shift 键并单击范围中的最后一个单词。
  • 选择多个不同的单词 - 单击第一个单词,然后按住 CTRL 键并单击其余所需的单词。
  • 合并多个选择 - 单击第一个单词,然后按住 Shift 键并单击范围中的最后一个单词作为第一个选择,然后按住 CTRL 键并单击以添加另一个范围,直到完成选择。
  • 区域选择 - 进行选择并选择选择类型:
    • 令牌 docs image - 选择所选区域中的所有单词。
    • 自定义区域 docs image - 仅捕获区域,而不捕获其中的文字。

其他选项

编辑字段的值 - 将鼠标悬停在字段上,单击值,然后添加所需的输入,以更改字段的内容。



选项 - 将字段还原为先前状态。单击此选项后退一步,这意味着如果您对该字段进行了多次更改,则可能需要多次单击才能返回到某个值。仅当存在先前已修改或删除某个值的情况时,此字段才处于活动状态。



选项 - 使用“自定义区域”或“令牌”选项向字段添加值。当在文档中进行选择并且与字段中的选择不同时,该按钮才可用。始终可以对多值字段进行选择,并且仅当该字段没有值时才可以对单值字段进行选择。



选项 - 确认字段中包含的信息。确认后,复选框将变为蓝色,如该图标所示

验证站点的界面是交互式的,这意味着在左侧选择字段时,右侧会高亮显示该字段,从而将焦点移至该字段上。



这也适用于文本视图:



选项 - 用于选择文档中的其他值并将其添加到特定字段。



选项 - 使您能够向字段添加值,而无需从文档中引用。



表格字段 - 单元格级别处理

您可以在下面找到表格字段所有可用选项的说明:

图标

描述

指示文档中表格的区域。

打开包含以下选项的下拉列表:

  • “还原为上一个值”- 返回到上一个值。只有在先前修改过表格数据后,此选项才会处于活动状态。
  • “删除值”- 将表格字段标记为缺失。

选中后,确认数据准确性。

缺少字段值时启用。

更改或删除初始提取值后启用。选中后,它将恢复先前的值。

删除值,在本例中为现有表格。

所有表格字段都有一个下拉菜单,其中包含以下选项:

  • 更改提取的值 - 从文档中选择一个新值并替换初始值。仅当新选择的值与原始选择不同时,此字段才可用。
  • 还原为上一个值 - 将实际值替换为上一个值。此字段仅在更改初始值时才会处于活动状态。
  • 标记为缺失 - 如果文档中没有信息,则将字段标记为缺失。

每行末尾的下拉菜单包含以下选项:

  • 将其设为表格标头 - 转换表格标头中的选定行。该行不再显示在表格正文中,但只要选择了标头的字段,就可以将信息可视化。
  • 在上方插入行 - 允许您在所选行上方添加新行。该行将自动添加到表格中,但所有字段都标记为“未提取”。您必须从文档中手动选择值,并使用“添加提取的值”选项进行添加。下方示例说明了如何使用此选项:



  • 在下方插入行 - 应用与“在上方插入行”选项相同的原则,唯一的区别是将行插入实际选择的下方而不是上方。
  • 删除行 - 删除选定的行。

使用“提取新表格”选项时,您可以通过启用“提取标头”功能,从文档中选择信息,或将现有行之一转换为表格的标头来定义表格标头。

  • 提取新表格”选项处于活动状态后,通过启用“提取标头”功能来提取具有已定义标头的表格



  • 通过将自己定位在标头上并从表格中选择等效项来确认表格的标头。选择值后,从下拉菜单中单击“更改提取的值”



  • 将自己定位在某一行上,从下拉菜单中选择“将其设为表格标头”选项,即可将现有行转换为表格标头



表格字段 - 表格级别处理

可以直接从“验证站点”向导中手动选择和定义表格。如果未选择任何表格,或者您对自动选择不满意,则可以使用第一行末尾的下拉菜单中的可用选项。

备注:

如果未提取表格单元格的值,则可以通过进入“选择模式”,选择“自定义区域”选项并标记表格单元格区域,手动将值添加到该表格单元格中。

“提取新表格”和“从此处提取行”选项使用相同的功能,并使您能够定义新值。

  • 提取新表格 - 用新选择的表格替换现有表格。您需要标记所有行和列。请记住,第一行将成为表格的标头。
  • 从此处提取行 - 启用自定义选择工具,并使您可以手动选择新行并将其添加到当前所选行的下方。选择新行的区域后,您必须定义每一列。您可以使用下表中显示的可用选项来执行此操作。
  • 高亮显示行 - 在表格中高亮显示选定的行。
  • 高亮显示表格 - 高亮显示整个提取的表格区域。



    • 删除所有行 - 删除现有表格。

      图标

      函数

      删除所选内容中的所有可见行。

      从所选内容中仅删除选定的行。

      在所选内容中启用水平行。

      在所选内容中启用垂直行。

      使您能够使用鼠标调整行的方向。

      启用行的选择、重新排列和删除。

您可以在下面看到一个有关如何提取新表格行以及如何使用可用选项的示例。附加行时,“提取标头”功能不可用。



以下是使用“提取新表格”选项提取新表格的方法:



您可以单击“保存新表格”按钮以自动确认所有字段,也可以通过单击“否”按钮拒绝该操作,返回到表格选择,然后手动确认每个字段。

注意:如果要保存提取字段为空或没有提取字段的表格,则这些字段会自动标记为缺失。

值格式和语言设置

使用“数字”、“日期”和“地址”字段,您可以查看并更正特定值的格式化(解析后)部分。可编辑部分如下:

字段类型

可编辑的格式化部分

数字

日期

Address

  • 地址行 1
  • 地址行 2
  • 地址行 3
  • 城市
  • 州/县/省
  • 国家/地区
  • 邮政编码

名称

  • 名字
  • 中间名
  • 姓氏

当您提取或更正任何这些类型字段的值时,验证站点会尝试自动将该值解析为其格式化的组件。

语言设置显示在文档中检测到的流行语言,也就是在数字化过程中所识别的语言。这使验证站点能够根据文档的语言更准确地解析数字和日期。您可以使用下拉菜单来更改语言设置。



这样,当您手动提取或更改日期或数字值时,验证站点将首先尝试根据所选语言设置所选字符串的格式,如果解析不成功,则回退到英语(美国)。格式设置功能仅适用于值的已设置格式且可编辑的部分,不适用于原始字符串值。

为确保实现最佳的自动格式化值检测,我们建议您检查检测到的语言,并在必要时进行更正。

报告异常

您可以选择将文档报告为异常。如果发生这种情况,“呈现验证站点”将引发异常,RPA 工作流应捕获并单独处理该异常。异常消息显示由用户填写的异常原因。

以下是将文档报告为异常的方法:



数据确认和验证

您可以选择手动或自动确认所有字段。对于手动确认,您需要选中每个字段的复选框。如果未手动确认复选框,则单击“保存”按钮后会自动完成此过程,然后通过单击“继续并保存”按钮来确认操作。

验证站点底部提供以下选项:

按钮

函数

保存已确认的字段。

保存并关闭表格选择区域。仅当表格字段处于活动状态时,该按钮才会启用。

将文档报告为异常。

仅在并非所有值都手动确认时启用。选择后,系统会自动确认并保存所有数据。

未对表格进行任何更改时启用。

对表格进行更改后启用。

在用户单击“消除”后启用。放弃对表格所做的所有更改。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。