- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- Document Understanding 数字化器
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
Document Understanding 活动
使用分类站点
“分类站点”用于执行、审核和更正文档分类信息。打开后,它将显示所有分类信息以及正在处理的文件。您可以使用“拆分文档”选项来组织文档。有关此功能的更多信息,请参阅本页的“其他选项”部分。
分类站点的右侧区域包含原始文档的交互式版本,可以在其中选择文本或文档部分,并且可以根据数字化流程的输出单击文字。 此区域还包含用于“放大和缩小”、“选择和旋转”页面、“搜索文档”或“切换到文本视图”的选项。
下表显示了分类站点屏幕右侧区域的可用选项及其说明。该区域允许您与文档交互并选择文档的各个部分。
选项 |
描述 |
---|---|
显示分类站点支持的所有可用键盘快捷方式,其中可能包括以下快捷方式:
| |
在文档的文本视图和图像视图之间切换:
| |
注意:仅在“仅文本视图”选项处于“活动”状态时才能处于活动状态
|
在文本视图中设置选择模式,包括以下选项:
|
在图像视图中设置选择模式,包括以下选项:
| |
| 顺时针旋转当前页面。 |
| 在分类站点使用的文档结果之间启动搜索。 |
|
重置文档的缩放级别。仅当存在先前已放大或缩小文档的情况,才启用此选项。 |
放大文档。 | |
缩小文档。
备注:
要放大或缩小,您还可以按住 Ctrl 键并滚动鼠标滚轮:按住 Ctrl 键并向上滚动可查看文档的特定部分;按住 Ctrl 键并向下滚动可查看文档的较大部分。 |
本节介绍如何使用可用选项与分类站点中的文档进行交互。
- 确保已选中“图像视图”。
- 选择“令牌”,然后选择“自定义区域”。
- 在文档中选择所需区域。
- 转到文档的“更多选项”(位于左侧),然后选择是否要“更改引用”或“删除引用”。
与在图像视图中使用“自定义区域”选项选择文档的一部分类似,您可以在文本视图中执行相同的操作。唯一的区别是,您需要确保选择“文本视图”。
有许多键盘快捷方式可用来优化与“分类站点”的人工交互。我们建议您尽量使用。您可以在“键盘快捷键”弹出窗口中查看这些快捷方式。
要开始使用键盘快捷方式,请转到“更多选项”,选择“键盘快捷方式”,然后选择“切换键盘快捷方式”。
以下列表显示了可用的键盘快捷方式及其相应的说明:
- 分类
- n:移至下一个字段;
- p:移至上一个字段;
- s:在所选页面之后拆分;
- h:高亮显示组引用;
- a:添加/更改引用;
- DEL:删除引用;
- m + 向上键 ↑:上移所有页面;
- m + 向下键 ↓:下移所有页面;
- 左、右箭头键 ←→ + 上、下箭头键 ↑↓:浏览页面
- 文档:
- d +:放大;
- d -:缩小;
- d 0:重置缩放比例;
- d r:顺时针旋转页面;
- dt:切换文本模式;
- d s:更改选择模式;
- d a:清除所选择的绘制锚点;
- /:启动搜索。
- 辅助功能:
- 左、右箭头键 → + 上、下箭头键 ↑↓:浏览字词,并创建或选择更多区域;
- Shift 和上、下、左、右箭头键:调整区域选择的大小;
- Enter:确认区域选择;
- Page Down Page Up:下一页或上一页;
- ESC:取消全选;
- Alt p:切换 PDF 查看器焦点。
- 常规:
- ?:此屏幕;
- /:将文档报告为异常;
- CTRL ENTER:保存分类;
- CTRL DEL:放弃所有当前更改。
分类字段受分类的影响,它们为您提供三种可能的情况:
- 如果针对文档给定部分提供的分类信息正确无误,则无需对该字段执行任何操作。
- 如果没有针对文档给定部分提供分类信息,则可以将其保留为未分类,或为其选择正确的文档类型。
- 如果针对文档给定部分(已分类或未分类、正确或不正确)提供的页面范围不完全准确(缺少页面或有额外页面),您可以通过将页面移至上面或下面部分来加以更正。
在屏幕左侧,您可以看到所有分类。您可以从文档类型下拉列表中为文档中任何给定的页面范围选择所需的文档类型(先前已在“分类”中定义)。将鼠标悬停在页面上,选择“选项”,然后从下拉列表中选择文档类型。
对文档类型选择“选项”,查看包含以下可用选项的下拉菜单:
- 添加引用 - 可以添加引用,以支持用户执行的文档类型选择。
注意:引用是文档中的一个令牌或令牌集合,可用作关键字来标识文档的类别。用户选择的引用通过“训练分类器作用域”添加到“关键字学习”文件中。图 6. 添加引用并高亮显示引用的操作
- 删除引用 - 删除先前为给定文档类型部分添加的引用。
图 7. 删除引用的操作
- 更改引用 - 将已有的引用更改为新引用。选择“更改引用”,然后选择文档的其他部分。
图 8. 更改引用的操作
- 上移所有页面 - 将整个页面部分上移至先前定义的文档类型,除第一个部分以外,所有部分的“选项”均处于活动状态。使用此选项将删除您正在操作的部分,从而将该页面范围与上一个页面范围统一。
图 9.上移所有页面的操作
- 下移所有页面 - 将整个页面部分下移至下一个定义的文档类型。除最后一个部分以外,所有部分中的“选项”均处于活动状态。使用此选项将删除您正在操作的部分,从而将该页面范围与下一个页面范围统一。
图 10. 下移所有页面的操作
- 拆分文档 - 标记新文档类型的开头,在此完成选择后将其移动到新文档类型部分的下面。
图 11. 拆分文档的操作
- 拖放 - 允许在各部分之间重新排列页面。只有在保持文档内顺序(页码应连续)的情况下,才能使用“拖放”选项重新排列页面。在文档中拖放页面来重新排列页面。
图 12. 重新排列文档页面的操作
- 删除引用 - 从特定页面中删除引用。在文档页面上选择“更多选项”,然后选择“删除引用”。
图 13. 删除引用的操作
- 高亮显示引用 - 在特定页面中高亮显示引用。在文档页面上选择“更多选项”,然后选择“高亮显示引用”。
图 14. 高亮显示引用的操作