document-understanding
2024.10
false
Document Understanding 用户指南
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 2024年11月11日

智能关键词分类器

什么是智能关键字分类器

智能关键字分类器是一种分类器,它使用从某些文档类型的文件中学习的字词向量执行文档分类。

该算法围绕对相同文档类型重复内容的概念构建而成,其前提是文档类型包含一系列通常会在这些文档类型中出现的词,从而可以计算向量相似度。

将文件归入某一文档类型时,“智能关键字分类器”

  • 会查找与文件更相似的最接近的字词向量,
  • 会报告得分最高的文档类型,以及基本的匹配主字词。

“智能关键字分类器”还具有文件拆分功能,这意味着它可以针对给定文件、单独的页面范围报告多个类。

注意:与基于关键字的分类器不同,训练智能关键字分类器时,您不需要手动选择文档中的引用,并且在训练时提供的任何此类引用都将被忽略。

何时使用

在下列情况下,您应考虑使用此分类器:

  • 您的文件在单个文件中包含一个或多个文档类型
  • 就内容而言,您的文档类型相对容易区分。
注意:从版本 6.9.0 开始,“智能关键词分类器”活动的拆分性能已得到改进。为了优化拆分性能,请使用 6.9.0 或更高版本。

特殊要求

You need to use your Automation CloudTM Document UnderstandingTM API Key, or host your own instance of the Intelligent Keyword Classifier in AI Center on-prem, to use this classifier.

如何训练

将“智能关键字分类器训练器”活动放在“训练分类器作用域”中,并进行相应配置。

在活动级别,我们无法在并行训练之间强制保持训练文件一致性。Document Understanding 流程提供了可用于解决此问题的两种方法。两者都包含流量控制:

  1. 锁文件(在流程中默认实现):使用 .lock 扩展名重命名文件,修改并保存文件,然后再次重命名文件以删除 .lock 扩展名
  2. 手动设置特殊队列:在 Orchestrator 中创建一个空队列,并集成项目中的两个活动

有关如何训练分类器的更多信息,请查看此页面,其中描述了“管理学习”向导的使用过程。

  • 什么是智能关键字分类器
  • 何时使用
  • 特殊要求
  • 如何训练

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。