UiPath Documentation
activities
latest
false
重要 :
请注意,此内容已使用机器翻译进行了部分本地化。 新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 活动

上次更新日期 2026年4月27日

传统验证站点

验证站点可让您查看和更正从文件中自动提取的数据,或手动处理文件以进行数据提取。打开验证站点后,系统会显示所有提取的信息以及正在处理的文件。

图 1.验证站点概览

验证站点概览

验证站点中显示的字段正是在工作流中所使用的分类中定义的字段。

文档视图

验证站点的右侧区域包含原始文档的交互式版本,可以在其中选择文本或文档部分,并且可以根据数字化流程的输出单击文字。 此区域还包含用于“放大和缩小”、“选择和旋转”页面、“搜索文档”或“切换到文本视图”的选项。

图 2. 交互式“验证站点”右侧区域概览

交互式“验证站点”右侧区域概览

下表显示了“验证站点”屏幕右侧的选项,以及使用这些选项可以执行的操作。

表 1.验证站点中的可用选项及其说明

选项

描述

更多选项

显示验证站点支持的所有可用键盘快捷方式。
  • 键盘快捷方式 - 键盘快捷方式
  • 隐藏 - 隐藏提取的令牌
  • 切换 - 从左到右切换面板侧

图像视图

在文档的文本视图和图像视图之间切换。
  • 图像视图 - 图像视图
  • 文本视图 - 纯文本视图

text - 文本

注意:仅在“仅文本视图”选项处于“活动”状态时才处于“活动”状态

在文本视图中设置选择模式:
  • text - 文本
  • 令牌 - 令牌

令牌

在图像视图中设置选择模式:
  • 令牌 - 令牌
  • 自定义区域 - 自定义区域
  • 选择 - 选中后选择

rotate

顺时针旋转当前页面。

注意: “旋转”选项仅在“图像”视图中可用。

搜索

在验证站点使用的文档结果之间启动搜索。

重置

重置文档的缩放级别。仅当存在先前已放大或缩小文档的情况,才启用此选项。

放大

放大文档。

缩小

缩小文档。

备注:

要放大或缩小,您还可以按住 Ctrl 键并滚动鼠标滚轮:按住 Ctrl 键并向上滚动可查看文档的特定部分;按住 Ctrl 键并向下滚动可查看文档的较大部分。

与“验证站点”中的文档交互

本节介绍如何使用可用选项与分类站点中的文档进行交互。

要使用图像视图中的“自定义区域”选项选择文档的一部分,请执行以下操作:

  1. 确保已选中“图像视图”

  2. 选择“令牌” ,然后选择“自定义区域”

  3. 在文档中选择所需区域。

  4. 转到文档的“更多选项”(位于左侧),然后选择是否要“更改引用”“删除引用”

    图 3. 显示如何在图像视图中执行选择的动图

    显示如何在图像视图中执行选择的动图

与在图像视图中使用“自定义区域”选项选择文档的一部分类似,您可以在文本视图中执行相同的操作。唯一的区别是,您需要确保选择“文本视图”

图 4. 显示如何在文本视图中使用自定义区域的动图

显示如何在文本视图中使用自定义区域选择的动图

键盘快捷方式

您可以使用键盘快捷方式来优化与“验证站点”的交互。我们建议您尽量使用。您可以在“键盘快捷键”弹出窗口中查看它们。

要开始使用键盘快捷方式,请转到“更多选项” ,选择“键盘快捷方式” ,然后选择“切换键盘快捷方式”

下表显示了所有可用的键盘快捷方式及其相应的说明。

表 2. 验证站点键盘快捷方式及其说明
 

描述

n

移至下一个字段

p

移至上一个字段

f v

将值标记为已验证

f c

更改提取的值

f z

还原为上一个值

f a

添加其他值

f s

在建议之间切换

Esc

Exits edit mode (for Fields and Tables)

  • Collapses the derived parts (for Fields)
  • 取消选择行(用于表格选择)
  • 退出表格选择模式(用于表格选择)
  • 请勿保存未确认的字段

Del

  • 删除选定的值(对于字段)
  • 删除选定的行(用于表格选择)

CTRL SHIFT回车键

保存未确认的字段

CTRL SHIFT S

将数据另存为草稿

Alt p

切换 PDF 查看器焦点

d +

放大

d -

缩小

d 0

重置缩放比例

d r

顺时针旋转页面

d t

切换文本模式

/

启动搜索

d s

更改选择模式

d a

清除所选择的绘制锚点

d h

切换提取的令牌

s

右移所选行

s

左移所选行

s

上移所选行

s

下移所选行

s d

复制所选行

s v

垂直行

s f

水平行

s a

通过移动鼠标自动检测

s t

手形工具 - 移动并删除行

?

此屏幕

!

将文档记录为异常

CTRL /Enter

保存数据

CTRL DEL

放弃所有当前更改

向右箭头键

移至右侧单元格

向左箭头键

移至左侧单元格

向上箭头

移至顶部单元格

向下箭头

移至底部单元格

t v

将单元格标记为已验证

t c

更改提取的单元格

t z

还原为上一个单元格值

t d

放弃表格中的更改

t DEL

删除选定的单元格

t ESC

关闭表格编辑器

TE

提取新表格

1 2 3 4 5 6 7 8 9 q w e r y a g h j k l z x c vm @ # $ % ^ & *** ( ) [ ] { {

  • 使用与每个字段关联的键为其分配值(字母不区分大小写)。
  • 如果未进行选择,请使用同一个键将焦点移至某个字段。
  • o 键经保留用于“文档类型”字段分配。

图 5. 显示导航到“键盘快捷方式”弹出窗口的动图

显示导航到“键盘快捷方式”弹出窗口的动图

在“验证站点”的右侧区域中选择“菜单” ,然后选择“隐藏提取的令牌” ,即可查看干净的视图面板并隐藏提取的令牌的高亮显示。

图 6.显示选中了“隐藏提取的令牌”选项的动图

显示选中了“隐藏提取的令牌”选项的动图

数据提取部分

左侧区域会显示您为当前验证选择的文档类型。您可在其中选择每个元素的状态,并将其与文档中的相应文字或区域相关联。

The confidence level of the extracted information can be displayed by OCR or Extraction.

The OCR Confidence level is given by the OCR engine used for extraction in the workflow. If the used OCR doesn't report any confidence levels, then N/A is displayed instead of percentages.

The Extraction Confidence level is given by the extractor used in the workflow.

置信度分数应仅用于指导目的。 您可以通过手动验证数据来提高置信度分数。

将置信度可视化的另一种方法是根据您设置的阈值进行筛选。为此,请选择“使用选定的置信度级别筛选字段” ,然后调整要筛选的置信度级别。

图 7. 根据置信度级别筛选字段

根据置信度级别筛选字段

如果您更改特定字段的引用,则每个字段的 OCR 置信度级别会单独更改。

您可以使用字段快捷方式为字段分配值或在字段之间切换。将值分配给字段后,系统会根据所选字段的颜色高亮显示该字段。

对于分配的值,表格字段中会显示一个文档裁剪结果。这有助于更好地定位从中提取值的区域,还可以通过将其与文档裁剪结果进行比较来再次检查值。

备注:

“文档类型”字段是一个特殊字段,您可以在以下情况下对其执行操作:

  • 如果提取结果包含一个文档类型,并且该文档类型正确无误,则无需执行任何操作。
  • 如果提取结果中包含一个文档类型,并且该文档类型有误,则您必须选择正确的文档类型,并从文档中提供相关证据。
  • 如果未提供提取结果,并且分类中仅有一种文档类型,则预选该文档类型,但这需要证明。
  • 如果未提供提取结果,并且分类中存在多种文档类型,则您必须手动选择所需的文档类型,并为此提供证据。

自动提取的字段具有同样以颜色进行编码的置信度百分比,旨在帮助您检测需要帮助的字段。

置信度分为四个级别:

  • 低于 50%,颜色编码为红色。

  • 介于 50% 和 85% 之间,以黄色表示。

  • 介于 86% 和 99% 之间,以浅绿色表示。

  • 100%,以绿色表示。要提高置信度,您可以通过手动选择信息来验证信息。手动选择文档的一部分后,为提取的字段选择“选项” ,然后选择“更改提取的值”

    图 8. 手动更改提取的字段值的操作

    手动更改提取的字段值的操作

所有包含信息的字段都有一个“选项”options下拉菜单,单击即可访问。下拉列表变为可见,显示多个编辑选项。

选项options菜单包含以下选项:

  • 更改提取的值 - 使用手动选择的值更改自动提取的值。仅当从文档中选择一个或多个与原始值不同的值时,此字段才处于活动状态。
  • 还原为上一个值 - 将字段的值重置为其上一个状态。仅当存在先前已更改或删除某个值的情况时,此选项才处于活动状态。
  • 标记为缺失 - 如果文档中没有信息,则将字段标记为缺失。
选择模式

使用验证站点向导时,有几种选择文本的方法。使用这些方法,您可以快速浏览整个文档,并轻松选择所需的字词来验证字段。

以下是所有可用选择选项的列表:

  • 选择一个单词 - 选择所需的单词。
  • 选择连续的单词 - 选择第一个单词,然后按住 Shift 键并选择范围中的最后一个单词。
  • 选择多个不同的单词 - 选择第一个单词,然后按住 CTRL 键并选择其余所需的单词。
  • 合并多个选择 - 选择第一个单词,然后按住 Shift 键并选择范围中的最后一个单词作为第一个选择,然后按住 CTRL 键并选择以添加另一个范围,直到完成选择。
  • 区域选择 - 进行选择并选择选择类型:
    • 令牌令牌 - 选择所选区域中的所有单词。
    • 自定义区域自定义区域 - 仅捕获区域,而不捕获其中的文字。
    • 选中后选择选中后选择 - 使用单独的单词选择整个区域,由您决定选择的类型。
其他选项
  • 注释- 仅当在“分类管理器”中启用了该特定字段的验证程序注释时,才会显示此字段。根据其配置方式,可以为以下内容:

    • 此为文本字段,您可以在其中添加与该字段相关的注释,例如选择某个值的原因或者是否应执行任何额外检查。
    • 无法编辑的文本。
    • 单选按钮形式的几个选项,您可以根据情况从中选择一个单选按钮。
      提示:

      查看“UiPath.DocumentProcessing.Contracts” 部分的“提取结果类” 页面,详细了解与验证程序注释相关的两种方法:GetFieldValidatorNotes(<fieldId>)SetFieldValidatorNotes(<fieldId>, <validatorNote>)

    备注:

    要查看哪些版本将在 Action Center 中包含验证程序说明,请参阅版本 6.19.0 的发布说明

  • 编辑字段的值 - 选择字段,选择值,然后添加所需的输入,以更改字段的内容。

  • 撤消文档图像选项 - 将字段还原为先前状态。选择一次此选项,会后退一步,这意味着如果您对该字段进行了多次更改,则可能需要多次单击才能返回到某个值。仅当存在先前已修改或删除某个值的情况时,此字段才处于活动状态。

  • 添加文档图像选项 - 使用自定义区域令牌选项向字段添加值。当在文档中进行选择并且与字段中的选择不同时,该选项才可用。始终可以对多值字段进行选择,并且仅当该字段没有值时才可以对单值字段进行选择。首先选择文档的该部分,然后选择“添加”选项。

  • 验证验证选项 - 确认字段中包含的信息。一旦确认, “已验证”标签将添加到字段中。手动验证字段后,您仍然可以通过选择提取置信度来检查该字段的原始值。此功能仅适用于提取置信度。

    图 9. 选择“提取置信度”

    选择“提取置信度”

验证站点的界面是交互式的,这意味着在左侧选择字段时,右侧会高亮显示该字段,从而将焦点移至该字段上。

  • 添加额外参数添加额外选项 - 用于选择文档中的其他值并将其添加到特定字段。
  • 添加添加选项 - 使您能够向字段添加值,而无需从文档中引用。
表格字段 - 单元格级别处理

对于工作流中使用的 OCR 和提取程序,提取的可信度可用于每个提取的单元格。 从验证站点的左上方在它们之间切换。

下表显示了表格字段的可用选项及其说明。

表 3. 可用于表格字段的选项及其描述
 

描述

menu

指示文档中表格的区域。

表格提取工具

创建新表格,打开表格提取工具。

options

打开包含以下选项的下拉列表:

  • Revert to previous value - Returns to the previous value. It is active only if the table's data has been previously altered.
  • Remove value - Marks the table field as missing.

复选框

选中后,确认数据准确性。

添加

缺少字段值时启用。

undo

更改或删除初始提取值后启用。选中后,它将恢复先前的值。

缺少

将字段标记为缺失。

所有表格字段都有一个下拉菜单,其中包含以下选项:

  • 更改提取的值 - 从文档中选择一个新值并替换初始值。仅当新选择的值与原始选择不同时,此字段才可用。
  • 还原为上一个值 - 将实际值替换为上一个值。此字段仅在更改初始值时才会处于活动状态。
  • 标记为缺失 - 如果文档中没有信息,则将字段标记为缺失。

下表显示了每行末尾的可用下拉菜单选项。

表 4. 下拉菜单选项及其描述

描述
页眉转换表格标头中的选定行。该行不再显示在表格正文中,但只要选择了标头的字段,就可以将信息可视化。
select高亮显示选定行。
自定义区域提取新行并将其放置在选定行的下方。 它启用自定义选择工具,并为您提供手动选择新行的可能性。 选择新行的区域后,您必须定义每一列。 为此,请使用下表中提供的可用选项。
在上方添加行Inserts a new empty row above the selected one. The row is automatically added to the table, except that all fields are marked as Not extracted. You have to manually select the value from the document and add it by using the Add extracted value option.
在下方插入行Applies the same principle as for the Insert row above option, the only difference being that the row is inserted below and not above the actual selection.
删除删除行。

a中的所有字段旁边都有一个确认框。要确认数据,您必须选中每个相应的框。

备注:

The overall confidence of the table is the lowest confidence from the cells within.

表格字段 - 表格级别处理

可以直接从“验证站点”向导中手动选择和定义表格。如果未选择任何表格,或者您对自动选择不满意,则可以使用第一行末尾的下拉菜单中的可用选项。

备注:
  • 如果未提取表格单元格的值,则可以通过选择提取置信度并标记表格单元格区域,手动将值添加到该表格单元格中。
  • “提取新表格”和“从此处提取行”选项使用相同的功能,并使您能够定义新值。

表格标头中几乎没有其他可用选项。您可以使用它们提取新表格,高亮显示现有表格或仅从中提取行,或删除整个表格。下表显示了可用选项及其说明:

表 5. 表格标头选项及其说明

描述
自定义区域用新选择的表格替换现有表格。您需要标记所有行和列。请记住,第一行将成为表格的标头。
表格高亮显示整个提取的表格区域。
select高亮显示表格中的选定行。
删除全部删除现有表格。

Define the table header while using the Extract new table option by enabling the Extract header function. Selecting the information from the document, or transforming one of the existing rows into the table's header can also define the header.

下表显示了“提取新表格”选项的可用功能及其说明。

表 6.“提取新表格”选项及其说明

函数
删除行删除所选内容中的所有可见行。
删除选择从所选内容中仅删除选定的行。
水平行在所选内容中启用水平行。
垂直行在所选内容中启用垂直行。
自动检测使您能够使用鼠标调整行的方向。
手动工具启用行的选择、重新排列和删除。
备注:

如果要保存提取字段为空或没有提取字段的表格,则这些字段会自动标记为缺失。

值格式和语言设置

使用“数字”、“日期”和“地址”字段,您可以查看并更正特定值的格式化(解析后)部分。下表显示了每种字段类型的可编辑部分。

表 7. 每种字段类型的可编辑部分
 

可编辑的格式化部分

数字

值(最多八位小数)

日期

Address

  • 地址行 1
  • 地址行 2
  • 地址行 3
  • 城市
  • 州/县/省
  • 国家/地区
  • 邮政编码

名称

  • 名字
  • 中间名
  • 姓氏

当您提取或更正任何这些类型字段的值时,验证站点会尝试自动将该值解析为其格式化的组件。

语言设置显示在文档中检测到的流行语言,也就是在数字化过程中所识别的语言。这使验证站点能够根据文档的语言更准确地解析数字和日期。您可以使用下拉菜单来更改语言设置。

这样,当您手动提取或更改日期或数字值时,验证站点将首先尝试根据所选语言设置所选字符串的格式,如果解析不成功,则回退到英语(美国)。格式设置功能仅适用于值的已设置格式且可编辑的部分,不适用于原始字符串值。

为确保实现最佳的自动格式化值检测,我们建议您检查检测到的语言,并在必要时进行更正。

报告异常

您可以选择将文档报告为异常。如果发生这种情况,“呈现验证站点”将引发异常,RPA 工作流应捕获并单独处理该异常。异常消息显示由用户填写的异常原因。

选择“报告异常” ,然后填写“原因”字段,最后选择“确认”以保存异常。

数据确认和验证

您可以选择手动或自动确认表格的所有字段。对于手动确认,您需要选中每个字段的复选框。如果未手动确认复选框,则单击“保存”按钮后会自动完成此过程,然后通过单击“继续并保存”按钮来确认操作。

下表显示了“验证站点”底部用于数据确认和验证的可用选项及其功能。

表 8. 数据验证和确认选项

选项函数
无效单元格跳至表格中的每个无效单元格。
未确认的单元格跳至表格中每个未确认的单元格。
确认所有单元格确认表格中的所有单元格。
完成保存表格验证。如果表格不仅仅是包含有效和已确认的单元格,您可以选择“完成”以部分保存表格。
报告异常将文档报告为异常。
继续并保存仅在并非文档中的所有值都手动确认时启用。选择后,系统将自动确认并保存所有数据和字段。

有关如何使用和自定义“验证站点”的更多信息,请访问“验证站点”

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新