- 概述
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 4506T - ML 包
- 990 - ML 包 - 预览
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 护照 - ML 包
- 工资单 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 硬件要求
- 管道
- Document Manager
- OCR 服务
- 深度学习
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 许可
- 活动
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding 用户指南
用户界面
Document Manager 界面包含以下面板:
- 管理栏
- 列字段
- 常规字段
- 分类字段
- 文档视图
显示在 Document Manager 中的页面顶部。
使您能够执行多项操作:在文档之间导航、删除/还原文档、搜索/筛选文档、运行 AI 模型预测以及导入和导出文档。
以下是管理栏中的可用项目:
项目 |
图标 |
描述 |
---|---|---|
导航 |
|
在与活动筛选器匹配的文档之间导航。 在两个箭头之间显示一个计数器。它显示了与活动搜索/筛选器匹配的文档总数和当前文档的编号。 |
搜索 |
|
有两项搜索功能:
|
删除/还原 |
|
删除或还原文档。已删除的文档位于“已删除”筛选器下。 |
导入 |
|
打开“导入数据”对话框。 |
导出 |
|
打开“导出文件”对话框。 |
文档名称和类型 |
不适用 |
当前处于活动状态的文档的名称及其类型。 文档分为三种类型:
训练文档和验证文档都是训练管道使用的训练数据集的一部分。 评估文档会被训练管道忽略,并且仅供 AI Center 中的评估管道使用。通过在“导入数据”对话框中选中“将此标记为评估集”复选框,即可将这些文档标记为评估文档。 |
下载 |
该选项位于文档名称旁边的下拉列表中。 单击图标可下载包含原始文档的 Zip 文件。除了原始文档外,还会下载由 Document Manager 内部转换为
.jpeg 图像的所有页面。
| |
永久删除 |
该选项位于文档名称旁边的下拉列表中。 永久删除单个文件。将从 AI Center 数据集中删除
.pdf 及其所有 .jpeg 图像,并从数据库中删除所有元数据。
单击此按钮时,系统会弹出一条消息,询问您是否确定要永久删除文档。单击“确定”以继续操作,或单击“取消”以返回到上一个屏幕。 | |
批次名称 |
不适用 |
当前批次的名称。 |
会话名称 |
不适用 |
当前会话的名称。 |
预测 |
运行 AI 模型预测并显示结果。 配置预加标签后,将在管理栏中启用该按钮。单击该按钮,以预标记当前文档。 | |
设置 |
配置 OCR 和预加标签设置,或者访问“如何…”面板。请参阅下方更多详细信息。 |
让我们更深入地了解“删除”和“永久删除”选项之间的区别。
- “删除”选项会删除文件,但不会将其完全从项目中删除。已删除的文件仍可以在“搜索”栏中的已删除筛选条件下找到,并可以使用“还原”选项进行还原。
-
“永久删除”选项将删除选定的文件,并且无法还原这些文件。
公开的搜索功能包含两个部分:
-
使用内置筛选器进行搜索:根据下拉菜单中提供的批次/类别选项筛选文档。
选择更多选项可进一步限制搜索范围。例如,如果选择“批量导入 1”和“已删除”,则只会返回在“批量导入 1”中导入且已删除的文档。
记下将始终返回空列表的组合:如果选择“批量导入 1”和“批量导入 2”,则永远不会返回文档,因为选择内容具有限制性,没有文档可以同时属于两个批次。
-
使用关键字在文档中搜索:此搜索栏会根据文本输入筛选信息。您必须在搜索栏中以自由文本形式输入关键字。搜索将在文档内容或文档名称中查找关键字。当字词相邻时,多词搜索会返回结果,但不包括它们之间的任何标点符号。
-
“在文档内搜索”:使您可以仅在当前文档中搜索文本的实例。搜索栏 位于屏幕左下方。
此设置仅适用于在 AI Center 中创建的文档类型(Data Manager 会话)。在 Document UnderstandingTM 中创建此设置时,此设置继承自“项目设置”。如果要在 Document UnderstandingTM, 中修改这些设置,请返回“项目”视图并打开左下角的“项目设置”。
基于云的选项包括:
- UiPath™ 文档 OCR -
https://du.uipath.com/ocr
; - 中文、日语和韩语 OCR
- 具有最广语言覆盖范围的 Google Cloud Vision OCR;
- 适用于读取日语文档的 Google Cloud Vision OCR(日语版);
- Microsoft Read OCR。
配置 OCR 时,需要 OCR 服务具有 URL。您可能会用到以下 URL:
- 公共 URL,例如
https://du.uipath.com/ocr
,或来自 Google Vision OCR 或 Microsoft Read OCR 的第三方 URL
所选 OCR 引擎的相应 API 密钥。例如,对于 UiPath Document OCR,您需要使用 Document Understanding API 密钥。对于 Document Manager Cloud 和 Document Manager On-Prem Online,它是必需的。对于 Document Manager On-Prem Air-gapped,它不是必需的。
有关更多信息,请查看“Cloud 和本地部署使用情况”页面。
如果您已经有一个模型可以提取一些需要加标签的字段,并且只有少量额外的字段需要手动加标签,则可以使用 Document Manager 的预加标签功能来节省时间。
预加标签合并预加标签端点(在“预加标签”设置中配置)的结果。
可用的选项如下:
预加标签要求 ML 模型具有 URL。查看您可以使用的以下 URL:
- 公共 URL,例如
https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders
。请访问公共端点,查看完整的端点列表。
- 已在本地部署的 AI Center 或 Cloud AI Center 中公开的 ML 技能 URL。
AI Unit/Document Understanding API 密钥。预加标签 API 密钥是技能所在组织的 Document Understanding 密钥。
Cloud Document Manager 和本地部署的 Online Document Manager 必须使用此密钥。对于本地部署的离线 Document Manager,此密钥是可选的。
“如何…”选项用于打开 Document Manager 帮助菜单。
在帮助菜单,您可以找到以下信息:
- Document Manager 版本。
- 指向此文档页面的“文档”链接。
- “标签控件”部分显示处理数据时要使用的控件。
- “文档快捷方式”部分显示用于执行各种操作(例如导航和用户界面缩放)的快捷方式。
- “配置”部分显示有关在安装过程中执行的实例配置的详细信息。
标签控件
命令 |
描述 |
---|---|
左键单击 | 选择复选框。如果与字段的热键一起使用,则会将所选信息分配给字段。 |
退格/删除 | 删除字段的标记值。 |
右击 | 显示 OCR 文本和当前标签。 |
Enter 或反斜杠 | 对跨越多行文本的表格行进行分组或取消分组。 |
文档快捷方式
快捷方式 |
描述 |
---|---|
Alt + 向左箭头/向右箭头 | 在文档之间导航。 |
Alt + Delete | 删除或恢复文档。 |
Ctrl + 滚动 | 通过放大或缩小更改文档缩放比例。 |
- 新建列字段
- 编辑字段
- 展开/折叠列字段值
有关列字段的更多详细信息,请参阅本节。
- 新建常规字段
- 编辑字段
有关常规字段的更多详细信息,请参阅本节。
- 新建分类字段
- 编辑字段
有关分类字段的更多详细信息,请参阅本节。
Ctrl
并滚动鼠标滚轮。
您可以通过选择文字框并按下相应的按键,将文档分配给某个字段,从而标记文档。您也可以右键单击文字框并验证提取的信息。
有关如何标记文档的更多详细信息,请访问此页面。
打开新的 Document Manager 会话或筛选器为空时,某些准则将显示在文档视图中:
此外,文档视图中还会显示加载失败: