- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- 基本数据点类 - 预览
- 提取结果处理程序类 - 预览
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 传统验证站点
- 紧凑型验证站点
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式

Document Understanding 活动
紧凑型验证站点
验证站点可让您查看和更正从文件中自动提取的数据,或手动处理文件以进行数据提取。打开验证站点后,系统会显示所有提取的信息以及正在处理的文件。
使用“紧凑”显示模式时,将忽略字段验证置信度 % 。
Figure 1. Overview of the Compact Validation Station

验证站点中显示的字段正是在工作流中所使用的分类中定义的字段。
文档视图
验证站点的右侧区域包含原始文档的交互式版本,可以在其中选择文本或文档部分,并且可以根据数字化流程的输出选择文字。此区域还包含用于缩放、选择和旋转页面、搜索文档或切换到文本视图的选项。
Figure 2. Overview of the right area of the Validation Station that is interactive

下表显示了“验证站点”屏幕交互式部分的选项,以及您可以使用这些选项执行的操作。
| 选项 | 描述 |
|---|---|
|
| 显示验证站点支持的所有可用键盘快捷方式。
|
|
Note: Active except for Communications Mining Validation Actions. | 在文档的文本视图和图像视图之间切换。
|
|
Note: Active only when viewing the document in Text mode. This setting does not apply to Communications Mining Validation Actions. | 在文本视图中设置选择模式:
|
|
| 在图像视图中设置选择模式:
|
|
| 顺时针旋转当前页面。 Note: The Rotate option is available only in Image view . |
|
| 在验证站点使用的文档结果之间启动搜索。 |
|
| 重置文档的缩放级别。仅当存在先前已放大或缩小文档的情况,才启用此选项。 |
|
| 放大文档。 |
|
| 缩小文档。 备注: To zoom in or out, you can also use the CTRL + scroll mouse wheel combination : CTRL+scroll up to view a specific section of the document; CTRL+scroll down to view a larger section of the document. |
与“验证站点”中的文档交互
本节介绍如何使用可用选项与“验证站点”中的文档进行交互。
要使用图像视图中的“自定义区域”选项选择文档的一部分,请执行以下操作:
-
Ensure that Image view is selected.
-
Select Selection mode and then select Custom area.
-
在文档中选择所需区域。
-
Go to the document's more options, and choose if you want to Change extracted value or Revert to previous value.
Figure 3. Animated image showing how to perform selection in image view

Similarly to how you select a part of the document using the custom area option within the image view, you do the same within the text view. The only difference is that you ensure that Text view is selected.
Figure 4. Animated image showing how use the custom area selection in text view

键盘快捷方式
You can use keyboard shortcuts to optimize the interaction with the Validation Station. You can view them in the Keyboard Shortcuts pop-up.
To start using keyboard shortcuts, go to Menu, select Show available keyboard shortcuts, and then select Toggle keyboard shortcuts.
下表显示了所有可用的键盘快捷方式及其相应的说明。
| 描述 | |
|---|---|
| n | 移至下一个字段 |
| p | 移至上一个字段 |
| f v | 将值标记为已验证 |
| f c | 更改提取的值 |
| f z | 还原为上一个值 |
| f a | 添加其他值 |
| f s | 在建议之间切换 |
| Esc | Exits edit mode (for Fields and Tables)
|
| Del |
|
| CTRLSHIFTENTER | 保存未确认的字段 |
| CTRLSHIFTS | 将数据另存为草稿 |
| Altp | 切换 PDF 查看器焦点 |
| d + | 放大 |
| d - | 缩小 |
| d 0 | 重置缩放比例 |
| d r | 顺时针旋转页面 |
| d t | 切换文本模式 |
| / | 启动搜索 |
| d s | 更改选择模式 |
| d a | 清除所选择的绘制锚点 |
| d h | 切换提取的令牌 |
| s ↑ | 右移所选行 |
| s ← | 左移所选行 |
| s ↑ | 上移所选行 |
| s ↓ | 下移所选行 |
| s d | 复制所选行 |
| s v | 垂直行 |
| s f | 水平行 |
| s a | 通过移动鼠标自动检测 |
| s t | 手形工具 - 移动并删除行 |
| ? | 此屏幕 |
| ! | 将文档记录为异常 |
| CTRLENTER | 保存数据 |
| CTRLDEL | 放弃所有当前更改 |
| 向右箭头键 → | 移至右侧单元格 |
| 向左箭头键 ← | 移至左侧单元格 |
| 向上箭头 ↑ | 移至顶部单元格 |
| 向下箭头 ↓ | 移至底部单元格 |
| t v | 将单元格标记为已验证 |
| t c | 更改提取的单元格 |
| t z | 还原为上一个单元格值 |
| t d | 放弃表格中的更改 |
| t DEL | 删除选定的单元格 |
| t ESC | 关闭表格编辑器 |
| TE | 提取新表格 |
| 123456789qweryaghjklzxcvm@#$%^&*** ()[]{ |
|
Select Menu in the right area of the Validation Station, and then select Hide extracted tokens to have a clean view panel and hide the highlights of the extracted tokens.
Figure 5. Animated image showing the selection of the Hide extracted tokens option

数据提取部分
验证站点中显示文档类型及其相应字段的区域,可用于选择每个元素的状态,并将其链接到文档中的相应词语或区域。
The confidence level of the extracted information is displayed for each document field. Hover over the circle next to the extracted value, to view the Extraction confidence and OCR confidence values:
- The OCR Confidence level is given by the OCR engine used for extraction in the workflow. If the used OCR doesn't report any confidence levels, then N/A is displayed instead of percentages.
- The Extraction Confidence level is given by the extractor used in the workflow.
置信度分数应仅用于指导目的。 您可以通过手动验证数据来提高置信度分数。
The OCR confidence level changes individually, for each field, if you alter the extracted value of a certain field.
您可以使用字段快捷方式为字段分配值或在字段之间切换。将值分配给字段后,系统会根据所选字段的颜色高亮显示该字段。
对于分配的值,表格字段中会显示一个文档裁剪结果。这有助于更好地定位从中提取值的区域,还可以通过将其与文档裁剪结果进行比较来再次检查值。
The Document Type field is a special field that you can act upon in the following scenarios:
- 如果提取结果包含一个文档类型,并且该文档类型正确无误,则无需执行任何操作。
- 如果提取结果中包含一个文档类型,并且该文档类型有误,则您必须选择正确的文档类型,并从文档中提供相关证据。
- 如果未提供提取结果,并且分类中仅有一种文档类型,则预选该文档类型,但这需要证明。
- 如果未提供提取结果,并且分类中存在多种文档类型,则您必须手动选择所需的文档类型,并为此提供证据。
自动提取的字段具有同样以颜色进行编码的置信度百分比,旨在帮助您检测需要帮助的字段。
置信度分为四个级别:
- 低于 50%,颜色编码为红色。
- 介于 50% 和 85% 之间,以黄色表示。
- 介于 86% 和 99% 之间,以浅绿色表示。
- 100%, color coded in green. To increase the confidence level, you can validate the information by manually selecting it. After you manually select a part of the document, select Options for an extracted field, and then select Change extracted value.
All fields that contain information have an Options
dropdown menu that can be accessed by selecting it. A drop-down list becomes visible, displaying multiple editing options.
The Options
menu includes the following options:
- 更改提取的值 - 使用手动选择的值更改自动提取的值。仅当从文档中选择一个或多个与原始值不同的值时,此字段才处于活动状态。
- 还原为上一个值 - 将字段的值重置为其上一个状态。仅当存在先前已更改或删除某个值的情况时,此选项才处于活动状态。
- 标记为缺失 - 如果文档中没有信息,则将字段标记为缺失。
Compact mode adjusts to the available screen space and the placement of the divider between the fields and document view sections. If sufficient space is available, it displays values inline with the field information. However, if space is limited, it will only display the field information. Adjust the width of the field area by dragging and dropping the divider as needed.
选择模式
使用验证站点向导时,有几种选择文本的方法。使用这些方法,您可以快速浏览整个文档,并轻松选择所需的字词来验证字段。
以下是所有可用选择选项的列表:
- Select one word - Select the desired word.
- Select consecutive words - Select the first word, then SHIFT+select the last word from range.
- Select multiple disparate words - Select the first word, then CTRL+select the rest of the desired words.
- Combine multiple selections - Select the first word, then SHIFT+select the last word from a range for the first selection, then hold CTRL+select and SHIFT+select to add another range, until you've completed your selections.
- 区域选择 - 进行选择并选择选择类型:
- 令牌
- 选择所选区域中的所有单词。 - 自定义区域
- 仅捕获区域,而不捕获其中的文字。 - 选中后选择
- 使用单独的单词选择整个区域,由您决定选择的类型。
- 令牌
其他选项
-
Notes - This is only displayed if Validator notes for that certain field were enabled in Taxonomy Manager. Depending on how it was configured, it can be the following:
- 此为文本字段,您可以在其中添加与该字段相关的注释,例如选择某个值的原因或者是否应执行任何额外检查。
- 无法编辑的文本。
- 单选按钮形式的几个选项,您可以根据情况从中选择一个单选按钮。
提示:
Check the ExtractionResult Class page from the UiPath.DocumentProcessing.Contracts section for more information on the two methods related to validator notes,
GetFieldValidatorNotes(<fieldId>)andSetFieldValidatorNotes(<fieldId>, <validatorNote>).
-
Edit the field's value - Changes the content of a field by selecting that field, selecting the value, and adding the desired input.
-
The Undo
option - Reverts the field to its prior state. Selecting this one time takes you one step back, meaning that if you had several changes on that field, multiple clicks might be required for returning to a certain value. This field is active only when a value was previously modified or deleted. -
The
Add value option - Adds a value to the field by using the Custom area or Tokens selection. The option becomes available when a selection is made in the document and differs from the one in the field. The selection can be made for multi-value fields at all times, and for single-value fields only if no value is present for that field. First select the part of the document and then the Add value option. -
The Validation
option - Confirms the information included into the field. Once confirmed, a Validated tag is added to the field. Once a field is manually validated, you can still check the original value of that field by selecting the Extraction confidence level. This functionality is available only for Extraction confidence level.Figure 6. The OCR and Extraction confidence levels

验证站点的界面是交互式的,这意味着在左侧选择字段时,右侧会高亮显示该字段,从而将焦点移至该字段上。
- The Add Extra
option - Enables you to select and add additional values from the document to a specific field. - The Add
option - Enables you to add a value to a field without requiring reference from the document.
表格字段 - 单元格级别处理
工作流中使用的 OCR 和提取程序的置信度级别可用于每个提取的单元格。
下表描述了表格字段的可用选项。
| 描述 | |
|---|---|
|
| 指示文档中表格的区域。 |
|
| 创建新表格,打开表格提取工具。 |
|
| 打开包含以下选项的下拉列表:
|
|
| 选中后,确认数据准确性。 |
|
| 缺少字段值时启用。 |
|
| 更改或删除初始提取值后启用。选中后,它将恢复先前的值。 |
|
| 将字段标记为缺失。 |
所有表格字段都有一个下拉菜单,其中包含以下选项:
- 更改提取的值 - 从文档中选择一个新值并替换初始值。仅当新选择的值与原始选择不同时,此字段才可用。
- 还原为上一个值 - 将实际值替换为上一个值。此字段仅在更改初始值时才会处于活动状态。
- 标记为缺失 - 如果文档中没有信息,则将字段标记为缺失。
下表显示了每行末尾的可用下拉菜单选项。
Table 4. Dropdown menu options and their descriptions
| 描述 | |
|---|---|
![]() | 转换表格标头中的选定行。该行不再显示在表格正文中,但只要选择了标头的字段,就可以将信息可视化。 |
![]() | 高亮显示选定行。 |
![]() | 提取新行并将其放置在选定行的下方。 它启用自定义选择工具,并为您提供手动选择新行的可能性。 选择新行的区域后,您必须定义每一列。 为此,请使用下表中提供的可用选项。 |
![]() | Inserts a new empty row above the selected one. The row is automatically added to the table, except that all fields are marked as Not extracted. You have to manually select the value from the document and add it by using the Add extracted value option. |
![]() | Applies the same principle as for the Insert row above option, the only difference being that the row is inserted below and not above the actual selection. |
![]() | 删除行。 |
编辑或审核表格中的字段后,确认框的外观会更改。 要确认数据,您必须选中该框。
The overall confidence of the table is the lowest confidence from the cells within.
表格字段 - 表格级别处理
可以直接从“验证站点”向导中手动选择和定义表格。如果未选择任何表格,或者您对自动选择不满意,则可以使用第一行末尾的下拉菜单中的可用选项。
- If the Value of a table cell is not extracted, you can manually add a value into that table cell, by going into the document view. Select the Custom area selection mode, and mark the cell area which wasn't extracted. Then select Add extracted value in the table cell where you want to extract this value.
- “提取新表格”和“从此处提取行”选项使用相同的功能,并使您能够定义新值。
表格标头中几乎没有其他可用选项。您可以使用它们提取新表格,高亮显示现有表格或仅从中提取行,或删除整个表格。下表显示了可用选项及其说明:
Table 5. Table header options and their descriptions
| 描述 | |
|---|---|
![]() | 用新选择的表格替换现有表格。您需要标记所有行和列。请记住,第一行将成为表格的标头。 |
![]() | 高亮显示整个提取的表格区域。 |
![]() | 高亮显示表格中的选定行。 |
![]() | 删除现有表格。 |
Define the table header while using the Extract new table option by enabling the Extract header function. Selecting the information from the document, or transforming one of the existing rows into the table's header can also define the header.
The following table shows the available functions of the Extract new table option and their descriptions.
Table 6. The Extract new table options and their descriptions
| 函数 | |
|---|---|
![]() | 删除所选内容中的所有可见行。 |
![]() | 从所选内容中仅删除选定的行。 |
![]() | 在所选内容中启用水平行。 |
![]() | 在所选内容中启用垂直行。 |
![]() | 使您能够使用鼠标调整行的方向。 |
![]() | 启用行的选择、重新排列和删除。 |
You can select Save new table to automatically confirm all fields or you can deny the operation by selecting Close, return to the table selection, and manually confirm each field.
如果要保存提取字段为空或没有提取字段的表格,则这些字段会自动标记为缺失。
值格式和语言设置
使用“数字”、“日期”和“地址”字段,您可以查看并更正特定值的格式化(解析后)部分。将值分配给“数字”或“日期”字段时,系统会自动解析该字段,并在相应的提取值条目中显示生成的值。
当您提取或更正任何这些类型字段的值时,验证站点会尝试自动将该值解析为其格式化的组件。
语言设置显示在文档中检测到的流行语言,也就是在数字化过程中所识别的语言。这使验证站点能够根据文档的语言更准确地解析数字和日期。您可以使用下拉菜单来更改语言设置。
这样,当您手动提取或更改日期或数字值时,验证站点将首先尝试根据所选语言设置所选字符串的格式,如果解析不成功,则回退到英语(美国)。格式设置功能仅适用于值的已设置格式且可编辑的部分,不适用于原始字符串值。
为确保实现最佳的自动格式化值检测,请检查检测到的语言,并在必要时进行更正。
报告异常
您可以选择将文档报告为异常。如果发生这种情况,“呈现验证站点”将引发异常,RPA 工作流应捕获并单独处理该异常。异常消息显示由用户填写的异常原因。
Select Report Exception, then fill in the Reason field, and select Confirm, to save the exception.
数据确认和验证
您可以选择手动或自动确认所有字段。对于手动确认,您需要选中每个字段的复选框。如果未手动确认复选框,则单击“保存”按钮后会自动完成此过程,然后通过单击“继续并保存”按钮来确认操作。
下表显示了“验证站点”中可用于数据确认和验证的选项及其功能。
Table 7. Data validation and confirmation options
| 选项 | 函数 |
|---|---|
| There are | 跳至表格中的每个无效单元格。 |
| There are | 跳至表格中每个未确认的单元格。 |
| 确认所有单元格 | 确认表格中的所有单元格。 |
| 完成 | Save your table validation. If a table does not have only valid and confirmed cells, you can select Done to partially save it. |
![]() | 将文档报告为异常。 |
![]() | 仅在并非文档中的所有值都手动确认时启用。选择后,系统将自动确认并保存所有数据和字段。 |
Visit Validation station for more information about how to use and customize the Validation Station.

- 键盘快捷方式
- 隐藏提取的令牌
- 从左到右切换面板侧 
- 纯文本视图
- 文本
- 令牌
- 自定义区域
- 选中后选择 























