Document Understanding 用户指南

文档分类概述

文档分类是 Document Understanding ^TM框架中的一个组件，可帮助识别机器人正在处理的文件类型。

根据文件的内容和使用的分类方法，文件可分为一个或多个文档类型：

如果文件包含单个逻辑文档类型（例如，全部是发票或医疗记录），则应相应地配置分类组件并返回单一分类结果；
如果文件包含多种逻辑文档类型（例如，第 1 页到第 5 页是发票，接下来的 10 页是医疗记录，第 16 页到末尾是保险协议），则分类组件应返回多个分类结果，每个分类结果对应输入文件中右侧的页面范围。

分类时使用的文档类型是项目分类中定义的文档类型。

一方面，如果项目需要处理全部属于同一文档类型且始终作为每个文件一个实例显示的文件（例如，一个文件中有一份发票），则无需分类，可以完全跳过。

另一方面，如果项目要处理两个或多个文档类型（例如，工作流必须处理在处理前无法区分的“发票”和“医疗记录”），或者文件有时可能会包含两个或多个不同的文档类型（例如，一个文件包含 3 份发票），则强烈建议分类。

您可以通过“对文档范围进行分类”活动来完成分类。要对文档进行分类，您可以使用一个或多个分类器，这是因为作用域活动的作用是配置和执行一个或多个用于文档分类的算法，并提供简单统一的配置选项，满足您的所有需求。

简而言之，“对文档范围进行分类”的执行内容如下：

“对文档范围进行分类”允许您使用“配置分类器”向导对其进行配置。您可以自定义

请注意，在“对文档范围进行分类”中，分类器的顺序很重要：

根据用例的要求，您可以从多种分类方法（称为分类器）中选择。

分类器位于 UiPath.IntelligentOCR.Activities 或 UiPath.DocumentUnderstanding.ML.Activities 包中。

可用的分类器包括：

您总是可以使用公共文档处理合同来构建自己的分类器，因而能够实现任何适合自己用例的算法。

在此页面上

前一个文档分类

下一个对文档作用域进行分类的配置分类器向导