UiPath Documentation
document-understanding
2.2510
true
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

上次更新日期 2026年4月15日

文档分类概述

什么是文档分类

Document Classification is a component in the Document UnderstandingTM Framework that helps in identifying what types of files the robot is processing.

根据文件的内容和使用的分类方法,文件可分为一个或多个文档类型:

  • 如果文件包含单个逻辑文档类型(例如,全部是发票或医疗记录),则应相应地配置分类组件并返回单一分类结果;
  • 如果文件包含多种逻辑文档类型(例如,第 1 页到第 5 页是发票,接下来的 10 页是医疗记录,第 16 页到末尾是保险协议),则分类组件应返回多个分类结果,每个分类结果对应输入文件中右侧的页面范围。

分类时使用的文档类型是项目分类中定义的文档类型。

何时应使用文档分类

一方面,如果项目需要处理全部属于同一文档类型且始终作为每个文件一个实例显示的文件(例如,一个文件中有一份发票),则无需分类,可以完全跳过。

另一方面,如果项目要处理两个或多个文档类型(例如,工作流必须处理在处理前无法区分的“发票”和“医疗记录”),或者文件有时可能会包含两个或多个不同的文档类型(例如,一个文件包含 3 份发票),则强烈建议分类。

如何使用文档分类组件

Classification is done through the Classify Document Scope activity. To classify the documents, you can use one or more classifiers, as the scope activity has the role of configuring and executing one or more algorithms for document classification and of offering an easy, unitary configuration option for all your needs.

简而言之,“对文档范围进行分类”的执行内容如下:

  • 为所有分类器(分类算法)提供运行所需的必要配置。
  • 接受一个或多个分类器。
  • 允许在分类器级别进行文档类型筛选、分类映射和最低可信度阈值设置。
  • 无论分类来源如何,均以统一方式报告分类信息。

The Classify Document Scope allows you to configure it by using the Configure Classifiers wizard. You can customize

  • 从哪个分类器接受哪些文档类型,
  • 每个分类器可接受的给定结果的最低可信度阈值是多少,
  • 项目分类和分类器的内部分类(如有)之间在文档类型级别的分类映射是什么。

Please note that the order of the classifiers in the Classify Document Scope is important:

  • 按从左到右的优先顺序执行分类器;
  • 如果分类器返回的分类结果报告的是一个可接受的文档类型,并且其可信度阈值等于或大于为该分类器设置的最低可信度阈值,则接受该分类结果;
  • 仅使用之前的分类器未进行分类的页面范围执行分类器(因此可能在一次执行中多次调用)。

可用的分类器

根据用例的要求,您可以从多种分类方法(称为分类器)中选择。

Classifiers can be found in the UiPath.IntelligentOCR.Activities or UiPath.DocumentUnderstanding.ML.Activities packages.

可用的分类器包括:

您总是可以使用公共文档处理合同来构建自己的分类器,因而能够实现任何适合自己用例的算法。

  • 什么是文档分类
  • 何时应使用文档分类
  • 如何使用文档分类组件
  • 可用的分类器

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新