UiPath Documentation
activities
latest
false
重要 :
请注意,此内容已使用机器翻译进行了部分本地化。 新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 活动

上次更新日期 2026年4月22日

紧凑型验证站点

验证站点可让您查看和更正从文件中自动提取的数据,或手动处理文件以进行数据提取。打开验证站点后,系统会显示所有提取的信息以及正在处理的文件。

备注:

使用“紧凑”显示模式时,将忽略字段验证置信度 %

Figure 1. Overview of the Compact Validation Station

精简版“验证站点”概述

验证站点中显示的字段正是在工作流中所使用的分类中定义的字段。

文档视图

验证站点的右侧区域包含原始文档的交互式版本,可以在其中选择文本或文档部分,并且可以根据数字化流程的输出选择文字。此区域还包含用于缩放、选择和旋转页面、搜索文档或切换到文本视图的选项。

Figure 2. Overview of the right area of the Validation Station that is interactive

交互式“验证站点”右侧区域概览

下表显示了“验证站点”屏幕交互式部分的选项,以及您可以使用这些选项执行的操作。

Table 1. Available options in the Validation Station and their descriptions

选项

描述

更多选项

显示验证站点支持的所有可用键盘快捷方式。
  • 键盘快捷方式 - 键盘快捷方式
  • 隐藏 - 隐藏提取的令牌
  • 切换 - 从左到右切换面板侧

图像视图

Note: Active except for Communications Mining Validation Actions.

在文档的文本视图和图像视图之间切换。
  • 图像视图 - 图像视图
  • 文本视图 - 纯文本视图

text - 文本

Note: Active only when viewing the document in Text mode. This setting does not apply to Communications Mining Validation Actions.

在文本视图中设置选择模式:
  • text - 文本
  • 令牌 - 令牌

令牌

在图像视图中设置选择模式:
  • 令牌 - 令牌
  • 自定义区域 - 自定义区域
  • 选择 - 选中后选择

rotate

顺时针旋转当前页面。

Note: The Rotate option is available only in Image view .

搜索

在验证站点使用的文档结果之间启动搜索。

重置

重置文档的缩放级别。仅当存在先前已放大或缩小文档的情况,才启用此选项。

放大

放大文档。

缩小

缩小文档。

备注:

To zoom in or out, you can also use the CTRL + scroll mouse wheel combination : CTRL+scroll up to view a specific section of the document; CTRL+scroll down to view a larger section of the document.

与“验证站点”中的文档交互

本节介绍如何使用可用选项与“验证站点”中的文档进行交互。

要使用图像视图中的“自定义区域”选项选择文档的一部分,请执行以下操作:

  1. Ensure that Image view is selected.

  2. Select Selection mode and then select Custom area.

  3. 在文档中选择所需区域。

  4. Go to the document's more options, and choose if you want to Change extracted value or Revert to previous value.

    Figure 3. Animated image showing how to perform selection in image view

    显示如何在图像视图中执行选择的动图

Similarly to how you select a part of the document using the custom area option within the image view, you do the same within the text view. The only difference is that you ensure that Text view is selected.

Figure 4. Animated image showing how use the custom area selection in text view

显示如何在文本视图中使用自定义区域选择的动图

键盘快捷方式

You can use keyboard shortcuts to optimize the interaction with the Validation Station. You can view them in the Keyboard Shortcuts pop-up.

To start using keyboard shortcuts, go to Menu, select Show available keyboard shortcuts, and then select Toggle keyboard shortcuts.

下表显示了所有可用的键盘快捷方式及其相应的说明。

Table 2. Validation Station keyboard shortcuts and their descriptions
 

描述

n

移至下一个字段

p

移至上一个字段

f v

将值标记为已验证

f c

更改提取的值

f z

还原为上一个值

f a

添加其他值

f s

在建议之间切换

Esc

Exits edit mode (for Fields and Tables)

  • Collapses the derived parts (for Fields)
  • 取消选择行(用于表格选择)
  • 退出表格选择模式(用于表格选择)
  • 请勿保存未确认的字段

Del

  • 删除选定的值(对于字段)
  • 删除选定的行(用于表格选择)

CTRLSHIFTENTER

保存未确认的字段

CTRLSHIFTS

将数据另存为草稿

Altp

切换 PDF 查看器焦点

d +

放大

d -

缩小

d 0

重置缩放比例

d r

顺时针旋转页面

d t

切换文本模式

/

启动搜索

d s

更改选择模式

d a

清除所选择的绘制锚点

d h

切换提取的令牌

s

右移所选行

s

左移所选行

s

上移所选行

s

下移所选行

s d

复制所选行

s v

垂直行

s f

水平行

s a

通过移动鼠标自动检测

s t

手形工具 - 移动并删除行

?

此屏幕

!

将文档记录为异常

CTRLENTER

保存数据

CTRLDEL

放弃所有当前更改

向右箭头键

移至右侧单元格

向左箭头键

移至左侧单元格

向上箭头

移至顶部单元格

向下箭头

移至底部单元格

t v

将单元格标记为已验证

t c

更改提取的单元格

t z

还原为上一个单元格值

t d

放弃表格中的更改

t DEL

删除选定的单元格

t ESC

关闭表格编辑器

TE

提取新表格

123456789qweryaghjklzxcvm@#$%^&*** ()[]{

  • 使用与每个字段关联的键为其分配值(字母不区分大小写)。
  • 如果未进行选择,请使用同一个键将焦点移至某个字段。
  • The o key is reserved for the Document Type field assignment.

Select Menu in the right area of the Validation Station, and then select Hide extracted tokens to have a clean view panel and hide the highlights of the extracted tokens.

Figure 5. Animated image showing the selection of the Hide extracted tokens option

显示选中了“隐藏提取的令牌”选项的动图

数据提取部分

验证站点中显示文档类型及其相应字段的区域,可用于选择每个元素的状态,并将其链接到文档中的相应词语或区域。

The confidence level of the extracted information is displayed for each document field. Hover over the circle next to the extracted value, to view the Extraction confidence and OCR confidence values:

  • The OCR Confidence level is given by the OCR engine used for extraction in the workflow. If the used OCR doesn't report any confidence levels, then N/A is displayed instead of percentages.
  • The Extraction Confidence level is given by the extractor used in the workflow.

置信度分数应仅用于指导目的。 您可以通过手动验证数据来提高置信度分数。

备注:

The OCR confidence level changes individually, for each field, if you alter the extracted value of a certain field.

您可以使用字段快捷方式为字段分配值或在字段之间切换。将值分配给字段后,系统会根据所选字段的颜色高亮显示该字段。

对于分配的值,表格字段中会显示一个文档裁剪结果。这有助于更好地定位从中提取值的区域,还可以通过将其与文档裁剪结果进行比较来再次检查值。

备注:

The Document Type field is a special field that you can act upon in the following scenarios:

  • 如果提取结果包含一个文档类型,并且该文档类型正确无误,则无需执行任何操作。
  • 如果提取结果中包含一个文档类型,并且该文档类型有误,则您必须选择正确的文档类型,并从文档中提供相关证据。
  • 如果未提供提取结果,并且分类中仅有一种文档类型,则预选该文档类型,但这需要证明。
  • 如果未提供提取结果,并且分类中存在多种文档类型,则您必须手动选择所需的文档类型,并为此提供证据。

自动提取的字段具有同样以颜色进行编码的置信度百分比,旨在帮助您检测需要帮助的字段。

置信度分为四个级别:

  • 低于 50%,颜色编码为红色。
  • 介于 50% 和 85% 之间,以黄色表示。
  • 介于 86% 和 99% 之间,以浅绿色表示。
  • 100%, color coded in green. To increase the confidence level, you can validate the information by manually selecting it. After you manually select a part of the document, select Options for an extracted field, and then select Change extracted value.

All fields that contain information have an Options options dropdown menu that can be accessed by selecting it. A drop-down list becomes visible, displaying multiple editing options.

The Optionsoptions menu includes the following options:

  • 更改提取的值 - 使用手动选择的值更改自动提取的值。仅当从文档中选择一个或多个与原始值不同的值时,此字段才处于活动状态。
  • 还原为上一个值 - 将字段的值重置为其上一个状态。仅当存在先前已更改或删除某个值的情况时,此选项才处于活动状态。
  • 标记为缺失 - 如果文档中没有信息,则将字段标记为缺失。
备注:

Compact mode adjusts to the available screen space and the placement of the divider between the fields and document view sections. If sufficient space is available, it displays values inline with the field information. However, if space is limited, it will only display the field information. Adjust the width of the field area by dragging and dropping the divider as needed.

选择模式

使用验证站点向导时,有几种选择文本的方法。使用这些方法,您可以快速浏览整个文档,并轻松选择所需的字词来验证字段。

以下是所有可用选择选项的列表:

  • Select one word - Select the desired word.
  • Select consecutive words - Select the first word, then SHIFT+select the last word from range.
  • Select multiple disparate words - Select the first word, then CTRL+select the rest of the desired words.
  • Combine multiple selections - Select the first word, then SHIFT+select the last word from a range for the first selection, then hold CTRL+select and SHIFT+select to add another range, until you've completed your selections.
  • 区域选择 - 进行选择并选择选择类型:
    • 令牌令牌 - 选择所选区域中的所有单词。
    • 自定义区域自定义区域 - 仅捕获区域,而不捕获其中的文字。
    • 选中后选择选中后选择 - 使用单独的单词选择整个区域,由您决定选择的类型。
其他选项
  • Notes - This is only displayed if Validator notes for that certain field were enabled in Taxonomy Manager. Depending on how it was configured, it can be the following:

    • 此为文本字段,您可以在其中添加与该字段相关的注释,例如选择某个值的原因或者是否应执行任何额外检查。
    • 无法编辑的文本。
    • 单选按钮形式的几个选项,您可以根据情况从中选择一个单选按钮。
      提示:

      Check the ExtractionResult Class page from the UiPath.DocumentProcessing.Contracts section for more information on the two methods related to validator notes, GetFieldValidatorNotes(<fieldId>) and SetFieldValidatorNotes(<fieldId>, <validatorNote>).

  • Edit the field's value - Changes the content of a field by selecting that field, selecting the value, and adding the desired input.

  • The Undo文档图像 option - Reverts the field to its prior state. Selecting this one time takes you one step back, meaning that if you had several changes on that field, multiple clicks might be required for returning to a certain value. This field is active only when a value was previously modified or deleted.

  • The 文档图像Add value option - Adds a value to the field by using the Custom area or Tokens selection. The option becomes available when a selection is made in the document and differs from the one in the field. The selection can be made for multi-value fields at all times, and for single-value fields only if no value is present for that field. First select the part of the document and then the Add value option.

  • The Validation验证 option - Confirms the information included into the field. Once confirmed, a Validated tag is added to the field. Once a field is manually validated, you can still check the original value of that field by selecting the Extraction confidence level. This functionality is available only for Extraction confidence level.

    Figure 6. The OCR and Extraction confidence levels

    OCR 和提取的置信度级别

验证站点的界面是交互式的,这意味着在左侧选择字段时,右侧会高亮显示该字段,从而将焦点移至该字段上。

  • The Add Extra 添加额外 option - Enables you to select and add additional values from the document to a specific field.
  • The Add 添加 option - Enables you to add a value to a field without requiring reference from the document.
表格字段 - 单元格级别处理

工作流中使用的 OCR 和提取程序的置信度级别可用于每个提取的单元格。

下表描述了表格字段的可用选项。

Table 3. Options available for a table field and their descriptions
 

描述

menu

指示文档中表格的区域。

表格提取工具

创建新表格,打开表格提取工具。

options

打开包含以下选项的下拉列表:

  • Revert to previous value - Returns to the previous value. It is active only if the table's data has been previously altered.
  • Remove value - Marks the table field as missing.

复选框

选中后,确认数据准确性。

添加

缺少字段值时启用。

undo

更改或删除初始提取值后启用。选中后,它将恢复先前的值。

缺少

将字段标记为缺失。

所有表格字段都有一个下拉菜单,其中包含以下选项:

  • 更改提取的值 - 从文档中选择一个新值并替换初始值。仅当新选择的值与原始选择不同时,此字段才可用。
  • 还原为上一个值 - 将实际值替换为上一个值。此字段仅在更改初始值时才会处于活动状态。
  • 标记为缺失 - 如果文档中没有信息,则将字段标记为缺失。

下表显示了每行末尾的可用下拉菜单选项。

Table 4. Dropdown menu options and their descriptions

描述
页眉转换表格标头中的选定行。该行不再显示在表格正文中,但只要选择了标头的字段,就可以将信息可视化。
select高亮显示选定行。
自定义区域提取新行并将其放置在选定行的下方。 它启用自定义选择工具,并为您提供手动选择新行的可能性。 选择新行的区域后,您必须定义每一列。 为此,请使用下表中提供的可用选项。
在上方添加行Inserts a new empty row above the selected one. The row is automatically added to the table, except that all fields are marked as Not extracted. You have to manually select the value from the document and add it by using the Add extracted value option.
在下方插入行Applies the same principle as for the Insert row above option, the only difference being that the row is inserted below and not above the actual selection.
删除删除行。

编辑或审核表格中的字段后,确认框的外观会更改。 要确认数据,您必须选中该框。

备注:

The overall confidence of the table is the lowest confidence from the cells within.

表格字段 - 表格级别处理

可以直接从“验证站点”向导中手动选择和定义表格。如果未选择任何表格,或者您对自动选择不满意,则可以使用第一行末尾的下拉菜单中的可用选项。

备注:
  • If the Value of a table cell is not extracted, you can manually add a value into that table cell, by going into the document view. Select the Custom area selection mode, and mark the cell area which wasn't extracted. Then select Add extracted value in the table cell where you want to extract this value.
  • “提取新表格”和“从此处提取行”选项使用相同的功能,并使您能够定义新值。

表格标头中几乎没有其他可用选项。您可以使用它们提取新表格,高亮显示现有表格或仅从中提取行,或删除整个表格。下表显示了可用选项及其说明:

Table 5. Table header options and their descriptions

描述
自定义区域用新选择的表格替换现有表格。您需要标记所有行和列。请记住,第一行将成为表格的标头。
表格高亮显示整个提取的表格区域。
select高亮显示表格中的选定行。
删除全部删除现有表格。

Define the table header while using the Extract new table option by enabling the Extract header function. Selecting the information from the document, or transforming one of the existing rows into the table's header can also define the header.

The following table shows the available functions of the Extract new table option and their descriptions.

Table 6. The Extract new table options and their descriptions

函数
删除行删除所选内容中的所有可见行。
删除选择从所选内容中仅删除选定的行。
水平行在所选内容中启用水平行。
垂直行在所选内容中启用垂直行。
自动检测使您能够使用鼠标调整行的方向。
手动工具启用行的选择、重新排列和删除。

You can select Save new table to automatically confirm all fields or you can deny the operation by selecting Close, return to the table selection, and manually confirm each field.

备注:

如果要保存提取字段为空或没有提取字段的表格,则这些字段会自动标记为缺失。

值格式和语言设置

使用“数字”、“日期”和“地址”字段,您可以查看并更正特定值的格式化(解析后)部分。将值分配给“数字”或“日期”字段时,系统会自动解析该字段,并在相应的提取值条目中显示生成的值。

当您提取或更正任何这些类型字段的值时,验证站点会尝试自动将该值解析为其格式化的组件。

语言设置显示在文档中检测到的流行语言,也就是在数字化过程中所识别的语言。这使验证站点能够根据文档的语言更准确地解析数字和日期。您可以使用下拉菜单来更改语言设置。

这样,当您手动提取或更改日期或数字值时,验证站点将首先尝试根据所选语言设置所选字符串的格式,如果解析不成功,则回退到英语(美国)。格式设置功能仅适用于值的已设置格式且可编辑的部分,不适用于原始字符串值。

为确保实现最佳的自动格式化值检测,请检查检测到的语言,并在必要时进行更正。

报告异常

您可以选择将文档报告为异常。如果发生这种情况,“呈现验证站点”将引发异常,RPA 工作流应捕获并单独处理该异常。异常消息显示由用户填写的异常原因。

Select Report Exception, then fill in the Reason field, and select Confirm, to save the exception.

数据确认和验证

您可以选择手动或自动确认所有字段。对于手动确认,您需要选中每个字段的复选框。如果未手动确认复选框,则单击“保存”按钮后会自动完成此过程,然后通过单击“继续并保存”按钮来确认操作。

下表显示了“验证站点”中可用于数据确认和验证的选项及其功能。

Table 7. Data validation and confirmation options

选项函数
There are invalid cells跳至表格中的每个无效单元格。
There are unconfirmed cells跳至表格中每个未确认的单元格。
确认所有单元格确认表格中的所有单元格。
完成Save your table validation. If a table does not have only valid and confirmed cells, you can select Done to partially save it.
报告异常将文档报告为异常。
继续并保存仅在并非文档中的所有值都手动确认时启用。选择后,系统将自动确认并保存所有数据和字段。

Visit Validation station for more information about how to use and customize the Validation Station.

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新