activities
latest
false
Document Understanding 活动
Last updated 2024年8月30日

呈现验证站点

UiPath.IntelligentOCR.Activities.ValidationStation.PresentValidationStation

描述

打开验证站点,能够帮助用户检查并更正文档分类和数据自动提取结果。

项目兼容性

Windows - Legacy | Windows

创建文档验证操作

配置

属性面板
常见
  • “显示名称”- 活动的显示名称。
输入
  • 自动提取结果 - 自动生成的提取结果,存储在 ExtractionResult 专有变量中。如果将变量添加到该字段,则“验证站点”会显示自动提取结果,以供您检查并作出修改。如果该字段留空,则“验证站点”不会包含任何自动提取的数据。此字段仅支持 ExtractionResult 变量。
  • 文档对象模型 - 要用于验证文档的文档对象模型。此模型存储在 Document 变量中,可以从“数字化文档”活动中检索。请访问数字化文档,了解如何实现此目的。此字段仅支持 Document 变量。
  • “文档路径”- 要验证的文档的路径。此字段仅支持字符串和字符串变量。
    注意:该属性字段支持的文件类型包括“.png”、“.gif”、“.jpe”、“.jpg”、“.jpeg”、“.tiff”、“.tif”、“.bmp”和“.pdf”。
  • 文档文本 - 文档本身的文本,存储在字符串变量中。可以从“数字化文档”活动中检索此值。请访问数字化文档,了解如何实现此目的。此字段仅支持字符串和 String 变量。
  • “分类”- 要处理的文档的分类,存储在 DocumentTaxonomy 变量中。此字段仅支持 DocumentTaxonomy 变量。
其他
  • “字段验证可信度百分比”- 设置呈现验证站点时要使用的可信度上限分数。
  • “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
  • 显示相关页面范围” - 如果选中,则仅显示提取结果中提到的页面范围,并隐藏范围之外的页面。
输出
  • 已验证的提取结果 - 人工验证流程的提取结果,存储在 ExtractionResult 变量中。
    重要提示:如果您使用的是 Intel Xe GPU 且验证站点未正确显示,我们建议将图形驱动程序更新到最新版本。有关更多信息,请访问 Intel 支持

使用“验证站点”

验证站点可让您查看和更正从文件中自动提取的数据,或手动处理文件以进行数据提取。打开验证站点后,系统会显示所有提取的信息以及正在处理的文件。

图 1. 验证站点概览

验证站点概览

验证站点中显示的字段正是在工作流中所使用的分类中定义的字段。

文档视图

验证站点的右侧区域包含原始文档的交互式版本,可以在其中选择文本或文档部分,并且可以根据数字化流程的输出单击文字。 此区域还包含用于“放大和缩小”、“选择和旋转”页面、“搜索文档”或“切换到文本视图”的选项。

图 2. 交互式“验证站点”右侧区域概览

交互式“验证站点”右侧区域概览

下表显示了“验证站点”屏幕右侧的选项,以及使用这些选项可以执行的操作。

表 1.验证站点中的可用选项及其说明

选项

描述

更多选项

显示验证站点支持的所有可用键盘快捷方式。
  • 键盘快捷方式 - 键盘快捷方式
  • 隐藏 - 隐藏提取的令牌
  • 切换 - 从左到右切换面板侧

图像视图

在文档的文本视图和图像视图之间切换。
  • 图像视图 - 图像视图
  • 文本视图 - 纯文本视图

text - 文本

注意:仅在“仅文本视图”选项处于“活动”状态时才能处于活动状态
在文本视图中设置选择模式:
  • text - 文本
  • 令牌 - 令牌

令牌

在图像视图中设置选择模式:
  • 令牌 - 令牌
  • 自定义区域 - 自定义区域
  • 选择 - 选中后选择

rotate

顺时针旋转当前页面。
注意:旋转 ”选项仅在“ 图像”视图中可用。

搜索

在验证站点使用的文档结果之间启动搜索。

重置

重置文档的缩放级别。仅当存在先前已放大或缩小文档的情况,才启用此选项。

放大

放大文档。

缩小

缩小文档。

备注:

要放大或缩小,您还可以按住 Ctrl 键并滚动鼠标滚轮:按住 Ctrl 键并向上滚动可查看文档的特定部分;按住 Ctrl 键并向下滚动可查看文档的较大部分。

与“验证站点”中的文档交互

本节介绍如何使用可用选项与分类站点中的文档进行交互。

要使用图像视图中的“自定义区域”选项选择文档的一部分,请执行以下操作:
  1. 确保已选中“图像视图”。
  2. 选择“令牌”,然后选择“自定义区域”。
  3. 在文档中选择所需区域。
  4. 转到文档的“更多选项”(位于左侧),然后选择是否要“更改引用”或“删除引用”。
    图 3. 显示如何在图像视图中执行选择的动图

    显示如何在图像视图中执行选择的动图

与在图像视图中使用“自定义区域”选项选择文档的一部分类似,您可以在文本视图中执行相同的操作。唯一的区别是,您需要确保选择“文本视图”。

图 4. 显示如何在文本视图中执行选择的动图

显示如何在文本视图中执行选择的动图

键盘快捷方式

您可以使用键盘快捷方式来优化与“验证站点”的交互。我们建议您尽量使用。您可以在“键盘快捷键”弹出窗口中查看它们。

要开始使用键盘快捷方式,请转到“更多选项”,选择“键盘快捷方式”,然后选择“切换键盘快捷方式”。

下表显示了所有可用的键盘快捷方式及其相应的说明。

表 2. 验证站点键盘快捷方式及其说明

快捷方式

描述

n

移至下一个字段

p

移至上一个字段

f v

将值标记为已验证

f c

更改提取的值

f z

还原为上一个值

f a

添加其他值

f s

在建议之间切换

Esc

Exits edit mode (for Fields and Tables)

  • Collapses the derived parts (for Fields)
  • 取消选择行(用于表格选择)
  • 退出表格选择模式(用于表格选择)
  • 请勿保存未确认的字段

Del

  • 删除选定的值(对于字段)
  • 删除选定的行(用于表格选择)

CTRL SHIFT ENTER

保存未确认的字段

CTRL SHIFT S

将数据另存为草稿

Alt p

切换 PDF 查看器焦点

d +

放大

d -

缩小

d 0

重置缩放比例

d r

顺时针旋转页面

d t

切换文本模式

/

启动搜索

d s

更改选择模式

d a

清除所选择的绘制锚点

d h

切换提取的令牌

s

右移所选行

s

左移所选行

s

上移所选行

s

下移所选行

s d

复制所选行

s v

垂直行

s f

水平行

s a

通过移动鼠标自动检测

s t

手形工具 - 移动并删除行

?

此屏幕

!

将文档记录为异常

CTRL ENTER

保存数据

CTRL DEL

放弃所有当前更改

向右箭头键

移至右侧单元格

向左箭头键

移至左侧单元格

向上箭头

移至顶部单元格

向下箭头

移至底部单元格

t v

将单元格标记为已验证

t c

更改提取的单元格

t z

还原为上一个单元格值

t d

放弃表格中的更改

t DEL

删除选定的单元格

t ESC

关闭表格编辑器

1 2 3 4 5 6 7 8 9 q w e r y a g h j k l z x c v m @ # $ % ^ & *** ( ) [ ] {

  • 使用与每个字段关联的键为其分配值(字母不区分大小写)。
  • 如果未进行选择,请使用同一个键将焦点移至某个字段。
  • o 键经保留用于“文档类型”字段分配。
图 5. 显示导航到“键盘快捷方式”弹出窗口的动图

显示导航到“键盘快捷方式”弹出窗口的动图

在“验证站点”的右侧区域中选择“更多选项”,然后选择“隐藏提取的令牌”,以查看整洁的视图面板并隐藏高亮显示的提取令牌。

图 6. 显示选中了“隐藏提取的令牌”选项的动图

显示选中了“隐藏提取的令牌”选项的动图

数据提取部分

左侧区域会显示您为当前验证选择的文档类型。您可在其中选择每个元素的状态,并将其与文档中的相应文字或区域相关联。

提取的信息的可信度可以通过 OCR提取显示。

OCR 置信 度级别由工作流中用于提取的 OCR 引擎提供。 如果使用的 OCR 未报告任何置信度级别,则显示 N/A 而不是百分比。

提取可信度 ”级别由工作流中使用的提取程序指定。

置信度分数应仅用于指导目的。 您可以通过手动验证数据来提高置信度分数。

将置信度可视化的另一种方法是根据您设置的阈值进行筛选。为此,请选择“使用选定的置信度级别筛选字段”,然后调整要筛选的置信度级别。

图 7. 根据置信度级别筛选字段

根据置信度级别筛选字段

如果您更改特定字段的引用,则每个字段的 OCR 置信度级别会单独更改。

您可以使用字段快捷方式为字段分配值或在字段之间切换。将值分配给字段后,系统会根据所选字段的颜色高亮显示该字段。

对于分配的值,表格字段中会显示一个文档裁剪结果。这有助于更好地定位从中提取值的区域,还可以通过将其与文档裁剪结果进行比较来再次检查值。

备注:

“文档类型”字段是一个特殊字段,您可以在以下情况下对其执行操作:

  • 如果提取结果包含一个文档类型,并且该文档类型正确无误,则无需执行任何操作。
  • 如果提取结果中包含一个文档类型,并且该文档类型有误,则您必须选择正确的文档类型,并从文档中提供相关证据。
  • 如果未提供提取结果,并且分类中仅有一种文档类型,则预选该文档类型,但这需要证明。
  • 如果未提供提取结果,并且分类中存在多种文档类型,则您必须手动选择所需的文档类型,并为此提供证据。

自动提取的字段具有同样以颜色进行编码的置信度百分比,旨在帮助您检测需要帮助的字段。

置信度分为四个级别:

  • 低于 50%,颜色编码为红色。
  • 介于 50% 和 85% 之间,以黄色表示。
  • 介于 86% 和 99% 之间,以浅绿色表示。
  • 100%,以绿色表示。

    要提高置信度,您可以通过手动选择信息来验证信息。手动选择文档的一部分后,为提取的字段选择“选项”,然后选择“更改提取的值”。

    图 8. 手动更改提取的字段值的操作

    手动更改提取的字段值的操作

所有包含信息的字段都有一个“选项”options下拉菜单,可通过选择来访问此菜单。下拉列表变为可见,显示多个编辑选项。

“选项”options菜单包含以下选项:

  • 更改提取的值 - 使用手动选择的值更改自动提取的值。仅当从文档中选择一个或多个与原始值不同的值时,此字段才处于活动状态。
  • 还原为上一个值 - 将字段的值重置为其上一个状态。仅当存在先前已更改或删除某个值的情况时,此选项才处于活动状态。
  • 标记为缺失 - 如果文档中没有信息,则将字段标记为缺失。
选择模式

使用验证站点向导时,有几种选择文本的方法。使用这些方法,您可以快速浏览整个文档,并轻松选择所需的字词来验证字段。

以下是所有可用选择选项的列表:

  • 选择一个单词 - 选择所需的单词。
  • 选择连续的单词 - 选择第一个单词,然后按住 Shift 键并选择范围中的最后一个单词。
  • 选择多个不同的单词 - 选择第一个单词,然后按住 CTRL 键并选择其余所需的单词。
  • 合并多个选择 - 选择第一个单词,然后按住 Shift 键并选择范围中的最后一个单词作为第一个选择,然后按住 CTRL 键并选择以添加另一个范围,直到完成选择。
  • 区域选择 - 进行选择并选择选择类型:
    • 令牌令牌 - 选择所选区域中的所有单词。
    • 自定义区域自定义区域 - 仅捕获区域,而不捕获其中的文字。
    • 选中后选择选中后选择 - 使用单独的单词选择整个区域,由您决定选择的类型。
其他选项
  • 注释 - 仅当在“分类管理器”中启用了该特定字段的验证程序注释时,才会显示此字段。根据其配置方式,可以为以下内容:
    • 此为文本字段,您可以在其中添加与该字段相关的注释,例如选择某个值的原因或者是否应执行任何额外检查。
    • 无法编辑的文本。
    • 单选按钮形式的几个选项,您可以根据情况从中选择一个单选按钮。
    提示:查看“UiPath.DocumentProcessing.Contracts”部分的“提取结果类”页面,详细了解与验证程序注释相关的两种方法:GetFieldValidatorNotes(<fieldId>)SetFieldValidatorNotes(<fieldId>, <validatorNote>)
  • 编辑字段的值 - 选择字段,选择值,然后添加所需的输入,以更改字段的内容。
  • “撤消”docs image选项 - 将字段还原为先前状态。选择一次此选项,会后退一步,这意味着如果您对该字段进行了多次更改,则可能需要多次单击才能返回到某个值。仅当存在先前已修改或删除某个值的情况时,此字段才处于活动状态。
  • “添加”docs image选项 - 使用“自定义区域”或“令牌”选项向字段添加值。当在文档中进行选择并且与字段中的选择不同时,该选项才可用。始终可以对多值字段进行选择,并且仅当该字段没有值时才可以对单值字段进行选择。首先选择文档的该部分,然后选择“添加”选项。
  • “验证”验证选项 - 确认字段中包含的信息。一旦确认,“已验证”标签将添加到字段中。

    手动验证字段后,您仍然可以通过选择“提取置信度”检查该字段的原始值。此功能仅适用于提取置信度。

    图 9. 选择“提取置信度”

    选择“提取置信度”

验证站点的界面是交互式的,这意味着在左侧选择字段时,右侧会高亮显示该字段,从而将焦点移至该字段上。

  • “添加额外”添加额外选项 - 用于选择文档中的其他值并将其添加到特定字段。
  • “添加”添加选项 - 使您能够向字段添加值,而无需从文档中引用。
表格字段 - 单元格级别处理

对于工作流中使用的 OCR 和提取程序,提取的可信度可用于每个提取的单元格。 从验证站点的左上方在它们之间切换。

下表显示了表格字段的可用选项及其说明。

表 3. 可用于表格字段的选项及其描述

图标

描述

menu

指示文档中表格的区域。

表格提取工具

创建新表格,打开表格提取工具。

options

打开包含以下选项的下拉列表:

  • “还原为上一个值”- 返回到上一个值。只有在先前修改过表格数据后,此选项才会处于活动状态。
  • “删除值”- 将表格字段标记为缺失。

复选框

选中后,确认数据准确性。

添加

缺少字段值时启用。

undo

更改或删除初始提取值后启用。选中后,它将恢复先前的值。

缺少

将字段标记为缺失。

所有表格字段都有一个下拉菜单,其中包含以下选项:

  • 更改提取的值 - 从文档中选择一个新值并替换初始值。仅当新选择的值与原始选择不同时,此字段才可用。
  • 还原为上一个值 - 将实际值替换为上一个值。此字段仅在更改初始值时才会处于活动状态。
  • 标记为缺失 - 如果文档中没有信息,则将字段标记为缺失。

下表显示了每行末尾的可用下拉菜单选项。

表 4. 下拉菜单选项及其描述

图标

描述

页眉

转换表格标头中的选定行。该行不再显示在表格正文中,但只要选择了标头的字段,就可以将信息可视化。

select

高亮显示选定行。

自定义区域

提取新行并将其放置在选定行的下方。 它启用自定义选择工具,并为您提供手动选择新行的可能性。 选择新行的区域后,您必须定义每一列。 为此,请使用下表中提供的可用选项。

在上方添加行

在选定行上方插入一个新的空行。该行将自动添加到表格中,但所有字段都标记为未提取。您必须从文档中手动选择值,并使用添加提取的值

在下方插入行

应用与在上方插入行选项相同的原则,唯一的区别是将行插入实际选择的下方而不是上方。

删除

删除行。

编辑或审核表格中的字段后,确认框的外观会更改。 要确认数据,您必须选中该框。

注意: 表格的整体置信度是其中单元格的最低置信度。
表格字段 - 表格级别处理

可以直接从“验证站点”向导中手动选择和定义表格。如果未选择任何表格,或者您对自动选择不满意,则可以使用第一行末尾的下拉菜单中的可用选项。

备注:
  • 如果未提取表格单元格的值,则可以通过选择置信度并标记表格单元格区域,手动将值添加到该表格单元格中。
  • 提取新表格从此处提取行选项使用相同的功能,并使您能够定义新值。

表格标头中几乎没有其他可用选项。您可以使用它们提取新表格,高亮显示现有表格或仅从中提取行,或删除整个表格。下表显示了可用选项及其说明:

表 5. 表格标头选项及其说明

图标

描述

自定义区域

用新选择的表格替换现有表格。您需要标记所有行和列。请记住,第一行将成为表格的标头。

表格

高亮显示整个提取的表格区域。

select

高亮显示表格中的选定行。

删除全部

删除现有表格。

使用提取新表格选项时,您可以通过启用提取标头功能,来定义表格标头。从文档中选择信息,或将一个现有行转换为表格的标头,也可以定义标头。

下表显示了“提取新表格”选项的可用功能及其说明。

表 6.“提取新表格”选项及其说明

图标

函数

删除行

删除所选内容中的所有可见行。

删除选择

从所选内容中仅删除选定的行。

水平行

在所选内容中启用水平行。

垂直行

在所选内容中启用垂直行。

自动检测

使您能够使用鼠标调整行的方向。

手动工具

启用行的选择、重新排列和删除。

您可以选择“保存新表格”以自动确认所有字段,也可以通过选择“关闭”拒绝该操作,返回到表格选择,然后手动确认每个字段。

注意:如果要保存提取字段为空或没有提取字段的表格,则这些字段会自动标记为缺失。
值格式和语言设置

使用“数字”、“日期”和“地址”字段,您可以查看并更正特定值的格式化(解析后)部分。下表显示了每种字段类型的可编辑部分。

表 7. 每种字段类型的可编辑部分

字段类型

可编辑的格式化部分

数字

值(最多八位小数)

日期

地址

  • 地址行 1
  • 地址行 2
  • 地址行 3
  • 城市
  • 州/县/省
  • 国家/地区
  • 邮政编码

名称

  • 名字
  • 中间名
  • 姓氏

当您提取或更正任何这些类型字段的值时,验证站点会尝试自动将该值解析为其格式化的组件。

语言设置显示在文档中检测到的流行语言,也就是在数字化过程中所识别的语言。这使验证站点能够根据文档的语言更准确地解析数字和日期。您可以使用下拉菜单来更改语言设置。

这样,当您手动提取或更改日期或数字值时,验证站点将首先尝试根据所选语言设置所选字符串的格式,如果解析不成功,则回退到英语(美国)。格式设置功能仅适用于值的已设置格式且可编辑的部分,不适用于原始字符串值。

为确保实现最佳的自动格式化值检测,我们建议您检查检测到的语言,并在必要时进行更正。

报告异常

您可以选择将文档报告为异常。如果发生这种情况,“呈现验证站点”将引发异常,RPA 工作流应捕获并单独处理该异常。异常消息显示由用户填写的异常原因。

选择“报告异常”,然后填写“原因”字段,最后选择“确认”以保存异常。

数据确认和验证

您可以选择手动或自动确认所有字段。对于手动确认,您需要选中每个字段的复选框。如果未手动确认复选框,则单击“保存”按钮后会自动完成此过程,然后通过单击“继续并保存”按钮来确认操作。

下表显示了“验证站点”底部用于数据确认和验证的可用选项及其功能。

表 8. 数据验证和确认选项

按钮

函数

保存已确认的字段

保存已确认的字段。

保存并关闭

保存并关闭表格选择区域。仅当表格字段处于活动状态时,该按钮才会启用。

报告异常

将文档报告为异常。

继续并保存

仅在并非所有值都手动确认时启用。选择后,系统会自动确认并保存所有数据。

dismiss

未对表格进行任何更改时启用。

放弃更改

对表格进行更改后启用。

放弃更改

在用户单击“消除”后启用。放弃对表格所做的所有更改。

有关如何使用和自定义验证站点的更多信息,请访问验证站点

Document Understanding 集成

显示验证站点活动是 Document Understanding 解决方案的一部分。如需了解详情,请访问 Document Understanding 指南

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。