UiPath Documentation
document-understanding
2.2510
true
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

上次更新日期 2026年4月15日

智能关键词分类器

什么是智能关键字分类器

The Intelligent Keyword Classifier is a classifier that uses the word vector it learns from files of certain document types to perform document classification.

该算法围绕对相同文档类型重复内容的概念构建而成,其前提是文档类型包含一系列通常会在这些文档类型中出现的词,从而可以计算向量相似度。

将文件归入某一文档类型时,“智能关键字分类器”

  • 会查找与文件更相似的最接近的字词向量,
  • 会报告得分最高的文档类型,以及基本的匹配主字词。

“智能关键字分类器”还具有文件拆分功能,这意味着它可以针对给定文件、单独的页面范围报告多个类。

备注:

Unlike the Keyword Based Classifier, you do not need to manually select references in the document when training the Intelligent Keyword Classifier and any such references provided at training time will be ignored.

何时使用

在下列情况下,您应考虑使用此分类器:

  • 您的文件在单个文件中包含一个或多个文档类型
  • 就内容而言,您的文档类型相对容易区分。
备注:

Starting with version 6.9.0, the splitting performance for the Intelligent Keyword Classifier activity has been improved. For optimized splitting performance, use version 6.9.0 or higher.

特殊要求

You need to use your Automation CloudTM Document UnderstandingTM API Key, or host your own instance of the Intelligent Keyword Classifier in AI Center on-prem, to use this classifier.

如何训练

Place the Intelligent Keyword Classifier Trainer activity in a Train Classifiers Scope, and configure it accordingly.

在活动级别,我们无法在并行训练之间强制保持训练文件一致性。Document Understanding 流程提供了可用于解决此问题的两种方法。两者都包含流量控制:

  1. 锁文件(在流程中默认实现):使用 .lock 扩展名重命名文件,修改并保存文件,然后再次重命名文件以删除 .lock 扩展名
  2. 手动设置特殊队列:在 Orchestrator 中创建一个空队列,并集成项目中的两个活动

For more information on how to train a Classifier, check this page that describes the process of using the Manage Learning wizard.

  • 什么是智能关键字分类器
  • 何时使用
  • 特殊要求
  • 如何训练

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新