- 入门指南
- 框架组件
- AI Center 中的 Document Understanding
- 管道
- ML 包
- Data Manager
- OCR 服务
- 许可
- 参考
Document Understanding 用户指南
分类管理器
分类管理器可用于创建和编辑特定于当前自动化项目的分类文件。该分类文件包含由用户定义并按“组”和“类别”分类的文档类型。
您可以使用“加载分类”活动将分类文件转换为 .NET 数据类型,然后将其作为输入传递给以下活动:
只有在安装 v1.6.0 或更高版的 UiPath.IntelligentOCR.Activities 包作为项目依赖项后,才能访问分类管理器。包安装完成后,“向导”部分的功能区中会显示“分类管理器”按钮。
“分类管理器”窗口用于创建按组和类别分类的文档类型。首次在项目中打开“分类管理器”时,系统不会定义任何组、类别或文档类型。
第一步是为要创建的文档类型创建组和类别。您可以使用“任何组”下拉列表旁边的“添加组”按钮执行此操作。选择组名称后,可以使用“保存”按钮或按 Enter 键来保存该名称。
定义组后,“任何类别”下拉列表旁边便会显示“添加类别”按钮。您还可使用上述相同步骤创建类别。
您可以编辑已创建的任何组或类别的名称。这可以通过选择其中一个组或类别并单击“编辑组”按钮来完成。
您也可以删除组和类别。这可以通过单击“删除组”按钮来完成。系统将显示一个弹出窗口,要求您是否确认删除操作。单击“是”以批准该操作。
定义组和类别后,下一步是创建“文档类型”。单击“添加新文档类型”按钮,即可执行此操作。执行此操作后,系统会显示“文档类型详细信息”选项卡,该选项卡可用于选择名称、组、类别和文档类型代码,以及向文档类型添加字段。
单击“新建字段”按钮将显示“编辑字段”选项卡,该选项卡可用于选择字段的名称,指定它是否为多值(“为多值”)或是否允许处理文档中没有证据的值(“需要参考”),然后选择其类型。
可用的字段类型包括:
- 文本
- 数字
- “日期”- 选择此类型后,便可指定预期格式(可选)。
备注:
如果要添加预期格式,请使用符合 MSDN 的格式。
提取程序可能会使用此格式,并且在尝试将日期解析为日、月和年等组成部分时,“数据提取作用域”活动也会使用此格式。
- 名称
- Address
- 关键词
- “设置”- 选择此类型后,便可向字段添加多个值。
- 布尔值
- “表格”- 选择此类型后,便可编辑表格结构,其中包括添加列及编辑列名称和类型。
相应配置字段后,单击“保存”会关闭“编辑字段”选项卡,并将向“文档类型详情”选项卡添加该字段。您可以多次重复此操作,按需添加尽可能多的字段。
您可以在“文档类型详情”选项卡中单击所创建的字段以对其进行编辑,也可以使用光标悬停时在字段旁显示的按钮来删除这些字段并对其重新排序。
完成“文档类型”配置后,单击“保存”会关闭“文档类型详情”选项卡,并会在主选项卡中显示新创建的文档类型。
重复以上步骤即可创建多个组、类别和文档类型,您后续还可使用“按名称搜索”字段对其进行排序。
Group.Category.Document
。
taxonomy.json
文件中。创建“文档类型”后,只需关闭该向导即可保存更改。