订阅

UiPath Document Understanding

UiPath Document Understanding

分类管理器

The Taxonomy Manager can be used to create and edit a Taxonomy file specific to your current automation project. This Taxonomy file contains user-defined document types, sorted by Groups and Categories.

You can further use the Taxonomy file by converting it into a .NET data type with the Load Taxonomy activity, and then passing it as input for activities such as:

The Taxonomy Manager can be accessed only after installing a UiPath.IntelligentOCR.Activities package higher or equal to v1.6.0 as a dependency for your project. Once the package is installed, a Taxonomy Manager button appears on the Ribbon, in the Wizards section.

Using Taxonomy Manager

“分类管理器”窗口用于创建按组和类别分类的文档类型。首次在项目中打开“分类管理器”时,系统不会定义任何组、类别或文档类型。

第一步是为要创建的文档类型创建组和类别。您可以使用“任何组”下拉列表旁边的“添加组”按钮执行此操作。选择组名称后,可以使用“保存”按钮或按 Enter 键来保存该名称。

定义组后,“任何类别”下拉列表旁边便会显示“添加类别”按钮。您还可使用上述相同步骤创建类别。

You can Edit the name of any group or category that you have created. This can be done by selecting one of the groups or categories and clicking on the Edit Group button.

Groups and categories can also be deleted. This can be done by clicking on the Remove Group button. A popup is displayed asking you to confirm the deleting action. Click Yes to approve the action.

定义组和类别后,下一步是创建“文档类型”。单击“添加新文档类型”按钮,即可执行此操作。执行此操作后,系统会显示“文档类型详情”选项卡。该选项卡可用于选择名称、组、类别和文档类型代码,以及向文档类型添加字段。

Clicking the New Field button displays the Edit Field tab, which lets you choose a name for the field, specify whether it is multi-value (Is Multi-Value) or if it allows for values with no evidence in the document to be processed (Requires Reference), and choose its type.

The available field types are:

  • Text
  • 数字
  • “日期”- 选择此类型后,便可指定预期格式(可选)。

📘

Note:

If you want to add an expected format, use an MSDN-compliant format.
This format may be used by extractors and is used by the Data Extraction Scope activity when trying to parse a Date into its constituent Day, Month, and Year parts.

  • 名称
  • 地址
  • 关键词
  • “设置”- 选择此类型后,便可向字段添加多个值。
  • Boolean
  • “表格”- 选择此类型后,便可编辑表格结构,其中包括添加列及编辑列名称和类型。

相应配置字段后,单击“保存”会关闭“编辑字段”选项卡,并将向“文档类型详情”选项卡添加该字段。您可以多次重复此操作,按需添加尽可能多的字段。

您可以在“文档类型详情”选项卡中单击所创建的字段以对其进行编辑,也可以使用光标悬停时在字段旁显示的按钮来删除这些字段并对其重新排序。

完成“文档类型”配置后,单击“保存”会关闭“文档类型详情”选项卡,并会在主选项卡中显示新创建的文档类型。

重复以上步骤即可创建多个组、类别和文档类型,您后续还可使用“按名称搜索”字段对其进行排序。

保存某个文档类型后,系统将为其生成“文档类型 ID”。打开文档进行编辑时,系统将在“文档类型详情”选项卡中显示该 ID。“文档类型 ID”的结构类型为“Group.Category.Document”。

📘

Note:

您在“分类管理器”中所作的更改会自动保存到特定于当前项目的“taxonomy.json”文件中。创建“文档类型”后,只需关闭该向导即可保存更改。

3个月前更新


分类管理器


建议的编辑仅限用于 API 参考页面

You can only suggest edits to Markdown body content, but not to the API spec.