- 概述
- 入门指南
- Activities (活动)
- Insights 仪表板
- Document Understanding 流程
- 快速入门教程
- 框架组件
- 模型详细信息
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 709 - ML 包
- 941x - ML 包
- 9465 - ML 包
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 工资单 - ML 包
- 护照 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 流量限制
- OCR 配置
- 管道
- OCR 服务
- 支持的语言
- 深度学习
- 数据与安全性
- 许可和计费逻辑
Document Understanding 传统用户指南
Forms AI 是 Document Understanding TM的一部分,可用于上传和处理具有标准布局和字段的结构化表单。
创建 Forms AI
Forms AI 是 Document Understanding 中第一个可用的提取方法。阅读有关如何在 Document Understanding 中新建项目的更多信息。
创建项目后,您需要按照后续步骤在项目中使用 Forms AI 创建文档类型。
- 打开项目。
- 选择“新建文档类型”按钮。
- 为您的文档类型添加名称。
如果要直接从 Document Understanding 训练文档分类器,则可以使用“一键分类”功能。
Fixed layout forms used with Forms AI can each have a maximum length of five pages.
将 Forms AI 转换为半结构化文档类型
您可以将 Forms AI 文档类型转换为半结构化文档类型。
将 Forms AI 文档类型转换为半结构化 (Document Manager) 文档类型时,您可以使用 Document Manager 中的所有可用功能
转换选项非常适合用于训练功能更强大的深度学习机器学习模型的复杂场景。
如何转换 Forms AI 会话
如果您决定将 Forms AI 会话转换为 Document Manager 会话,则可以选择两个选项。
从项目的文档类型列表中
您可以直接从项目的“文档类型”列表中转换文档类型。
访问要转换的文档类型的“开放式访问权限”菜单,然后单击“转换为半结构化”选项。系统将显示一个弹出窗口,要求您是否确认操作。
转换文档类型后,您将无法撤消 Actions。
从打开的 Forms AI 会话
打开已创建的 Forms AI 会话,以将其转换为半结构化会话。
From the opened session click the Access menu
then click the Convert to Semi-Structured option.
转换“文档类型”后,您将无法撤销该操作。如果项目没有 AI Center 链接,则不会显示“转换为半结构化”按钮。
导入文档
创建新的 Forms AI 后,系统将打开一个新窗口,要求您导入数据。您最少可以导入两个文档,最多可以导入二十个文档,每个文档最多包含五页。通过拖放或浏览来上传文件。
导入文档是将表单 AI 转换为半结构化 AI 文档类型的另一种方法。 如果您尝试上传超过 20 个文档,或者任何文档超过 20 页,则会显示一个选项。 屏幕上将显示一个弹出窗口,询问您是否要将 FormsAI 会话转换为半结构化会话。
还应检查自动提取的字段的内容类型准确性。例如,如果自动提取了“日期”字段,则内容类型应为“日期” 。应手动更正任何不准确之处。
Management bar
在页面顶部,您可以找到管理栏。您可以使用管理栏执行多项操作:在文档之间导航、删除/还原档、搜索/筛选文档、运行 AI 模型预测以及导入和导出文档。
以下是管理栏中的可用项目:
| 项目 | 图标 | 描述 |
|---|---|---|
| 导航 | 在与活动筛选器匹配的文档之间导航。在两个箭头之间显示一个计数器。它显示了与活动搜索/筛选器匹配的文档总数和当前文档的编号。 | |
| “搜索”和“在文档中搜索” | Search - initiate a search or filter the documents. Filter is also applied when exporting documents. You can filter by words from a document or by document names. Search in document - initiate a text search inside the document by clicking on the | |
| 删除/还原 | 删除或还原文档。已删除的文档位于“已删除”筛选器下。 | |
| 导入 | 打开“导入数据”对话框。 | |
| 导出 | 打开“导出文件”对话框。 | |
| 文档名称和类型 | 不适用 | 当前处于活动状态的文档的名称及其类型。 |
| 下载 | 该选项位于文档名称旁边的下拉列表中。 单击图标可下载包含原始文档的 Zip 文件。除了原始文档外,还会下载由 Document Manager 内部转换为 .jpeg 图像的所有页面。 | |
| 永久删除 | 该选项位于文档名称旁边的下拉列表中。永久删除单个文件。将从 AI Center 数据集中删除.pdf及其所有.jpeg图像,并从数据库中删除所有元数据。单击此按钮时,系统会弹出一条消息,询问您是否确定要永久删除文档。单击“确定”以继续操作,或单击“取消”以返回到上一个屏幕。 | |
| 预测 | 运行 AI 模型预测并显示结果。 配置预标记后,将在管理栏中启用该按钮。单击该按钮,以预标记当前文档。 目前,将“预测”选项与“公共端点”一起使用时,只能预标记文档的前 10 页。这是一个已知问题,正在修复中。但是,在 AI Center 中将“预测”选项与 ML 技能一起使用并不会施加这样的限制。 | |
| 发布 | 发布 Forms AI 提取程序并创建关联的链接,该链接可在项目的提取程序列表中找到。 | |
| 设置 | 配置 OCR 和预加标签设置,或者访问“如何…”面板。设置按钮有两个可用选项:
| |
| 会话 | 不适用 | 当前会话的名称,位于页面顶部, UiPath™ Document Understanding TM徽标旁边。 |
Let's go a little bit deeper in understanding the difference between Delete and Permanently Delete options.
- “删除”选项会删除文件,但不会将其从项目中永久删除。您仍可以在“搜索”栏中已删除的筛选条件下找到已删除的文件,并使用“还原”选项进行还原。
- The Permanently Delete option deletes the selected files without any possibility of restoring them.
The Settings button has two available options:
- “设置” - 您可以在其中配置 OCR 服务
- “如何… ”- 具有帮助菜单的作用
列字段
新建列字段
- Click
in the table section at the top of the page to add a new Column field. The Create Column Field window is displayed. - 在“输入唯一字段名称”字段中填写字段的唯一名称。该字段不接受大写字母。只能包含小写字母、数字、下划线
_和短划线-。 - 单击“确定”。
编辑列字段
Click the Edit field
button. The available options for column fields can be found in the table below.
| 选项 | 描述 |
|---|---|
| 字段名称 | 字段的唯一名称。 _ 和短划线 -。 |
| 内容类型 | 字段的内容类型:
|
| 快捷方式 | 字段的快捷键。允许使用一个或两个按键。 |
| 拆分项目 | 如果要将此字段用作表格中行项目或行之间的分隔符,请选中此复选框。出现此字段的任何行都会被视为表格中的新行项目或行。这通常用于发票行项目中的“行金额”字段。 |
单击“保存”以保存您的设置。
对表格行进行分组与 AI Center Document Manager 中的不同。此处,系统将根据每列字段上“拆分项目”复选框的状态自动对行进行分组。这仅适用于有包含多行文本的行的表格。在这种情况下,您必须选中每个表格行只有一行文本的任何字段上的“拆分项目”复选框。例如,在发票上,行项目金额是一个典型字段,您可以在其中选中“拆分项目”选项。在 Forms AI 中,您可以对表单执行相同的操作。
删除列字段
要删除列字段,请执行以下步骤:
- Click the Edit field
button corresponding to the column field you want to delete. - 单击“删除”按钮。
- 单击“确定”。
- 列字段及其关联的带标签数据将被删除。
字段
Create a new field
- Click
on the right pane in the Fields section. The Create a new regular field window is displayed. - 在“输入唯一字段名称”字段中填写字段的唯一名称。该字段不接受大写字母。只能包含小写字母、数字、下划线
_和短划线-。 - 单击“确定”。
删除所有字段
- Click
in the table section at the top of the page to delete all created fields. Use this function for deleting all fields, including Regular and Column fields, and all the labels on the documents in the current Document Type collection. This action cannot be undone. - Click the Delete button from the Delete all fields dialog box.
编辑字段
Click the Edit field
button. The available options for regular fields can be found in the table below.
| 选项 | 描述 |
|---|---|
| 字段名称 | 字段的唯一名称。 _ 和短划线 -。 |
| 内容类型 | 字段的内容类型:
|
| 快捷方式 | 字段的快捷键。允许使用一个或两个按键。 |
| 多行 | 常规 |
单击“保存”以保存您的设置。
删除常规字段
要删除常规字段,请执行以下步骤:
- Click the Edit field
button corresponding to the regular field you want to delete. - 单击“删除”按钮。
- 单击“确定”。
- 字段及其关联的带标签数据将被删除。
文档视图和标签
对于多页文档,您可以像在任何 PDF 查看器中一样自然地滚动页面。要放大或缩小,请使用 Ctrl 并滚动鼠标滚轮。
您可以通过选择文字框并按下相应的按键,将文档分配给某个字段,从而标记文档。您也可以右键单击文字框并验证提取的信息。
有关如何标记文档的更多详细信息,请访问此页面。
复选框
应为每个字段手动标记 Forms AI 中可用的复选框。也可以使用“列字段”选项标记表格中的复选框。在 Forms AI 中标记复选框时,应同时考虑选中和未选中的复选框。
您可以在此处找到有关如何标记复选框的更多详细信息。
您可以按照此处提供的步骤,选择将 Document Understanding 项目集成到 RPA 工作流中。