- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- 基本数据点类 - 预览
- 提取结果处理程序类 - 预览
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 传统验证站点
- 紧凑型验证站点
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式

Document Understanding 活动
紧凑型验证站点
验证站点可让您查看和更正从文件中自动提取的数据,或手动处理文件以进行数据提取。打开验证站点后,系统会显示所有提取的信息以及正在处理的文件。
使用“紧凑”显示模式时,将忽略字段验证置信度 % 。
图 1.紧凑型验证站点概览

验证站点中显示的字段正是在工作流中所使用的分类中定义的字段。
文档视图
验证站点的右侧区域包含原始文档的交互式版本,可以在其中选择文本或文档部分,并且可以根据数字化流程的输出选择文字。此区域还包含用于缩放、选择和旋转页面、搜索文档或切换到文本视图的选项。
图 2. 交互式“验证站点”右侧区域概览

下表显示了“验证站点”屏幕交互式部分的选项,以及您可以使用这些选项执行的操作。
| 选项 | 描述 |
|---|---|
|
| 显示验证站点支持的所有可用键盘快捷方式。
|
|
注意:处于活动状态,但 Communications Mining 验证操作除外。 | 在文档的文本视图和图像视图之间切换。
|
|
注意:仅在以文本模式查看文档时处于活动状态。此设置不适用于 Communications Mining 验证操作。 | 在文本视图中设置选择模式:
|
|
| 在图像视图中设置选择模式:
|
|
| 顺时针旋转当前页面。 注意: “旋转”选项仅在“图像”视图中可用。 |
|
| 在验证站点使用的文档结果之间启动搜索。 |
|
| 重置文档的缩放级别。仅当存在先前已放大或缩小文档的情况,才启用此选项。 |
|
| 放大文档。 |
|
| 缩小文档。 备注: 要放大或缩小,您还可以按住 Ctrl 键并滚动鼠标滚轮:按住 Ctrl 键并向上滚动可查看文档的特定部分;按住 Ctrl 键并向下滚动可查看文档的较大部分。 |
与“验证站点”中的文档交互
本节介绍如何使用可用选项与“验证站点”中的文档进行交互。
要使用图像视图中的“自定义区域”选项选择文档的一部分,请执行以下操作:
-
确保已选中“图像视图” 。
-
选择“选择模式” ,然后选择“自定义区域” 。
-
在文档中选择所需区域。
-
转到文档的“更多选项”,然后选择是否要“更改提取的值”或“还原为上一个值” 。
图 3. 显示如何在图像视图中执行选择的动图

与在图像视图中使用“自定义区域”选项选择文档的一部分类似,您可以在文本视图中执行相同的操作。唯一的区别是,您需要确保选择“文本视图” 。
图 4. 显示如何在文本视图中使用自定义区域的动图

键盘快捷方式
您可以使用键盘快捷方式来优化与“验证站点”的交互。您可以在“键盘快捷键”弹出窗口中查看它们。
要开始使用键盘快捷方式,请转到“菜单” ,选择“显示可用的键盘快捷方式” ,然后选择“切换键盘快捷方式” 。
下表显示了所有可用的键盘快捷方式及其相应的说明。
| 描述 | |
|---|---|
| n | 移至下一个字段 |
| p | 移至上一个字段 |
| f v | 将值标记为已验证 |
| f c | 更改提取的值 |
| f z | 还原为上一个值 |
| f a | 添加其他值 |
| f s | 在建议之间切换 |
| Esc | Exits edit mode (for Fields and Tables)
|
| Del |
|
| CTRL SHIFT回车键 | 保存未确认的字段 |
| CTRL SHIFT S | 将数据另存为草稿 |
| Alt p | 切换 PDF 查看器焦点 |
| d + | 放大 |
| d - | 缩小 |
| d 0 | 重置缩放比例 |
| d r | 顺时针旋转页面 |
| d t | 切换文本模式 |
| / | 启动搜索 |
| d s | 更改选择模式 |
| d a | 清除所选择的绘制锚点 |
| d h | 切换提取的令牌 |
| s ↑ | 右移所选行 |
| s ← | 左移所选行 |
| s ↑ | 上移所选行 |
| s ↓ | 下移所选行 |
| s d | 复制所选行 |
| s v | 垂直行 |
| s f | 水平行 |
| s a | 通过移动鼠标自动检测 |
| s t | 手形工具 - 移动并删除行 |
| ? | 此屏幕 |
| ! | 将文档记录为异常 |
| CTRL /Enter | 保存数据 |
| CTRL DEL | 放弃所有当前更改 |
| 向右箭头键 → | 移至右侧单元格 |
| 向左箭头键 ← | 移至左侧单元格 |
| 向上箭头 ↑ | 移至顶部单元格 |
| 向下箭头 ↓ | 移至底部单元格 |
| t v | 将单元格标记为已验证 |
| t c | 更改提取的单元格 |
| t z | 还原为上一个单元格值 |
| t d | 放弃表格中的更改 |
| t DEL | 删除选定的单元格 |
| t ESC | 关闭表格编辑器 |
| TE | 提取新表格 |
| 1 2 3 4 5 6 7 8 9 q w e r y a g h j k l z x c vm @ # $ % ^ & *** ( ) [ ] { { |
|
在“验证站点”的右侧区域中选择“菜单” ,然后选择“隐藏提取的令牌” ,即可查看干净的视图面板并隐藏提取的令牌的高亮显示。
图 5. 显示选中了“隐藏提取的令牌”选项的动图

数据提取部分
验证站点中显示文档类型及其相应字段的区域,可用于选择每个元素的状态,并将其链接到文档中的相应词语或区域。
系统将为每个文档字段显示所提取信息的置信度级别。将鼠标悬停在提取值旁边的圆圈上,以查看“提取置信度”和“OCR 置信度”值:
- The OCR Confidence level is given by the OCR engine used for extraction in the workflow. If the used OCR doesn't report any confidence levels, then N/A is displayed instead of percentages.
- The Extraction Confidence level is given by the extractor used in the workflow.
置信度分数应仅用于指导目的。 您可以通过手动验证数据来提高置信度分数。
如果更改某个字段的提取值,则每个字段的 OCR 置信度级别将单独更改。
您可以使用字段快捷方式为字段分配值或在字段之间切换。将值分配给字段后,系统会根据所选字段的颜色高亮显示该字段。
对于分配的值,表格字段中会显示一个文档裁剪结果。这有助于更好地定位从中提取值的区域,还可以通过将其与文档裁剪结果进行比较来再次检查值。
“文档类型”字段是一个特殊字段,您可以在以下情况下对其执行操作:
- 如果提取结果包含一个文档类型,并且该文档类型正确无误,则无需执行任何操作。
- 如果提取结果中包含一个文档类型,并且该文档类型有误,则您必须选择正确的文档类型,并从文档中提供相关证据。
- 如果未提供提取结果,并且分类中仅有一种文档类型,则预选该文档类型,但这需要证明。
- 如果未提供提取结果,并且分类中存在多种文档类型,则您必须手动选择所需的文档类型,并为此提供证据。
自动提取的字段具有同样以颜色进行编码的置信度百分比,旨在帮助您检测需要帮助的字段。
置信度分为四个级别:
- 低于 50%,颜色编码为红色。
- 介于 50% 和 85% 之间,以黄色表示。
- 介于 86% 和 99% 之间,以浅绿色表示。
- 100%,以绿色表示。要提高置信度,您可以通过手动选择信息来验证信息。手动选择文档的一部分后,为提取的字段选择“选项” ,然后选择“更改提取的值” 。
所有包含信息的字段都有一个“选项”
下拉菜单,单击即可访问。下拉列表变为可见,显示多个编辑选项。
选项
菜单包含以下选项:
- 更改提取的值 - 使用手动选择的值更改自动提取的值。仅当从文档中选择一个或多个与原始值不同的值时,此字段才处于活动状态。
- 还原为上一个值 - 将字段的值重置为其上一个状态。仅当存在先前已更改或删除某个值的情况时,此选项才处于活动状态。
- 标记为缺失 - 如果文档中没有信息,则将字段标记为缺失。
紧凑模式会根据可用的屏幕空间以及字段与文档视图部分之间的分隔线位置进行调整。如果可用空间充足,则会与字段信息内联显示值。但是,如果空间有限,则仅会显示字段信息。根据需要拖放分隔线,调整字段区域的宽度。
选择模式
使用验证站点向导时,有几种选择文本的方法。使用这些方法,您可以快速浏览整个文档,并轻松选择所需的字词来验证字段。
以下是所有可用选择选项的列表:
- 选择一个单词 - 选择所需的单词。
- 选择连续的单词 - 选择第一个单词,然后按住 Shift 键并选择范围中的最后一个单词。
- 选择多个不同的单词 - 选择第一个单词,然后按住 CTRL 键并选择其余所需的单词。
- 合并多个选择 - 选择第一个单词,然后按住 Shift 键并选择范围中的最后一个单词作为第一个选择,然后按住 CTRL 键并选择以添加另一个范围,直到完成选择。
- 区域选择 - 进行选择并选择选择类型:
- 令牌
- 选择所选区域中的所有单词。 - 自定义区域
- 仅捕获区域,而不捕获其中的文字。 - 选中后选择
- 使用单独的单词选择整个区域,由您决定选择的类型。
- 令牌
其他选项
-
注释- 仅当在“分类管理器”中启用了该特定字段的验证程序注释时,才会显示此字段。根据其配置方式,可以为以下内容:
- 此为文本字段,您可以在其中添加与该字段相关的注释,例如选择某个值的原因或者是否应执行任何额外检查。
- 无法编辑的文本。
- 单选按钮形式的几个选项,您可以根据情况从中选择一个单选按钮。
-
编辑字段的值 - 选择字段,选择值,然后添加所需的输入,以更改字段的内容。
-
撤消
选项 - 将字段还原为先前状态。选择一次此选项,会后退一步,这意味着如果您对该字段进行了多次更改,则可能需要多次单击才能返回到某个值。仅当存在先前已修改或删除某个值的情况时,此字段才处于活动状态。 -
此字段
“添加值选项” - 使用“自定义区域”或“令牌”选项向字段添加值。当在文档中进行选择并且与字段中的选择不同时,该选项才可用。始终可以对多值字段进行选择,并且仅当该字段没有值时才可以对单值字段进行选择。首先选择文档的该部分,然后选择“添加值”选项。 -
验证
选项 - 确认字段中包含的信息。一旦确认, “已验证”标签将添加到字段中。手动验证字段后,您仍然可以通过选择提取置信度来检查该字段的原始值。此功能仅适用于提取置信度。图 6.OCR 和提取置信度

验证站点的界面是交互式的,这意味着在左侧选择字段时,右侧会高亮显示该字段,从而将焦点移至该字段上。
- 添加额外参数
选项 - 用于选择文档中的其他值并将其添加到特定字段。 - 添加
选项 - 使您能够向字段添加值,而无需从文档中引用。
表格字段 - 单元格级别处理
工作流中使用的 OCR 和提取程序的置信度级别可用于每个提取的单元格。
下表描述了表格字段的可用选项。
| 描述 | |
|---|---|
|
| 指示文档中表格的区域。 |
|
| 创建新表格,打开表格提取工具。 |
|
| 打开包含以下选项的下拉列表:
|
|
| 选中后,确认数据准确性。 |
|
| 缺少字段值时启用。 |
|
| 更改或删除初始提取值后启用。选中后,它将恢复先前的值。 |
|
| 将字段标记为缺失。 |
所有表格字段都有一个下拉菜单,其中包含以下选项:
- 更改提取的值 - 从文档中选择一个新值并替换初始值。仅当新选择的值与原始选择不同时,此字段才可用。
- 还原为上一个值 - 将实际值替换为上一个值。此字段仅在更改初始值时才会处于活动状态。
- 标记为缺失 - 如果文档中没有信息,则将字段标记为缺失。
下表显示了每行末尾的可用下拉菜单选项。
表 4. 下拉菜单选项及其描述
| 描述 | |
|---|---|
![]() | 转换表格标头中的选定行。该行不再显示在表格正文中,但只要选择了标头的字段,就可以将信息可视化。 |
![]() | 高亮显示选定行。 |
![]() | 提取新行并将其放置在选定行的下方。 它启用自定义选择工具,并为您提供手动选择新行的可能性。 选择新行的区域后,您必须定义每一列。 为此,请使用下表中提供的可用选项。 |
![]() | Inserts a new empty row above the selected one. The row is automatically added to the table, except that all fields are marked as Not extracted. You have to manually select the value from the document and add it by using the Add extracted value option. |
![]() | Applies the same principle as for the Insert row above option, the only difference being that the row is inserted below and not above the actual selection. |
![]() | 删除行。 |
编辑或审核表格中的字段后,确认框的外观会更改。 要确认数据,您必须选中该框。
The overall confidence of the table is the lowest confidence from the cells within.
表格字段 - 表格级别处理
可以直接从“验证站点”向导中手动选择和定义表格。如果未选择任何表格,或者您对自动选择不满意,则可以使用第一行末尾的下拉菜单中的可用选项。
- 如果未提取表格单元格的值,则可以进入文档视图,手动将值添加到该表格单元格中。选择“自定义区域”选择模式,并标记未提取的单元格区域。然后,在要从中提取此值的表格单元格中选择“添加提取的值” 。
- “提取新表格”和“从此处提取行”选项使用相同的功能,并使您能够定义新值。
表格标头中几乎没有其他可用选项。您可以使用它们提取新表格,高亮显示现有表格或仅从中提取行,或删除整个表格。下表显示了可用选项及其说明:
表 5. 表格标头选项及其说明
| 描述 | |
|---|---|
![]() | 用新选择的表格替换现有表格。您需要标记所有行和列。请记住,第一行将成为表格的标头。 |
![]() | 高亮显示整个提取的表格区域。 |
![]() | 高亮显示表格中的选定行。 |
![]() | 删除现有表格。 |
Define the table header while using the Extract new table option by enabling the Extract header function. Selecting the information from the document, or transforming one of the existing rows into the table's header can also define the header.
下表显示了“提取新表格”选项的可用功能及其说明。
表 6.“提取新表格”选项及其说明
| 函数 | |
|---|---|
![]() | 删除所选内容中的所有可见行。 |
![]() | 从所选内容中仅删除选定的行。 |
![]() | 在所选内容中启用水平行。 |
![]() | 在所选内容中启用垂直行。 |
![]() | 使您能够使用鼠标调整行的方向。 |
![]() | 启用行的选择、重新排列和删除。 |
您可以选择“保存新表格”以自动确认所有字段,也可以通过选择“关闭” 、返回到表格选择并手动确认每个字段来拒绝该操作。
如果要保存提取字段为空或没有提取字段的表格,则这些字段会自动标记为缺失。
值格式和语言设置
使用“数字”、“日期”和“地址”字段,您可以查看并更正特定值的格式化(解析后)部分。将值分配给“数字”或“日期”字段时,系统会自动解析该字段,并在相应的提取值条目中显示生成的值。
当您提取或更正任何这些类型字段的值时,验证站点会尝试自动将该值解析为其格式化的组件。
语言设置显示在文档中检测到的流行语言,也就是在数字化过程中所识别的语言。这使验证站点能够根据文档的语言更准确地解析数字和日期。您可以使用下拉菜单来更改语言设置。
这样,当您手动提取或更改日期或数字值时,验证站点将首先尝试根据所选语言设置所选字符串的格式,如果解析不成功,则回退到英语(美国)。格式设置功能仅适用于值的已设置格式且可编辑的部分,不适用于原始字符串值。
为确保实现最佳的自动格式化值检测,请检查检测到的语言,并在必要时进行更正。
报告异常
您可以选择将文档报告为异常。如果发生这种情况,“呈现验证站点”将引发异常,RPA 工作流应捕获并单独处理该异常。异常消息显示由用户填写的异常原因。
选择“报告异常” ,然后填写“原因”字段,然后选择“确认” ,以保存异常。
数据确认和验证
您可以选择手动或自动确认所有字段。对于手动确认,您需要选中每个字段的复选框。如果未手动确认复选框,则单击“保存”按钮后会自动完成此过程,然后通过单击“继续并保存”按钮来确认操作。
下表显示了“验证站点”中可用于数据确认和验证的选项及其功能。
表 7. 数据验证和确认选项
| 选项 | 函数 |
|---|---|
| 有 | 跳至表格中的每个无效单元格。 |
| 有 | 跳至表格中每个未确认的单元格。 |
| 确认所有单元格 | 确认表格中的所有单元格。 |
| 完成 | 保存表格验证。如果表格不仅仅是包含有效和已确认的单元格,您可以选择“完成”以部分保存表格。 |
![]() | 将文档报告为异常。 |
![]() | 仅在并非文档中的所有值都手动确认时启用。选择后,系统将自动确认并保存所有数据和字段。 |
有关如何使用和自定义“验证站点”的更多信息,请访问“验证站点” 。

- 键盘快捷方式
- 隐藏提取的令牌
- 从左到右切换面板侧 
- 纯文本视图
- 文本
- 令牌
- 自定义区域
- 选中后选择 























