document-understanding
2023.4
false
UiPath logo, featuring letters U and I in white
Document Understanding 用户指南
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 2024年11月11日

智能关键词分类器

什么是智能关键字分类器

智能关键字分类器是一种分类器,它使用从某些文档类型的文件中学习的字词向量执行文档分类。

该算法围绕对相同文档类型重复内容的概念构建而成,其前提是文档类型包含一系列通常会在这些文档类型中出现的词,从而可以计算向量相似度。

将文件归入某一文档类型时,“智能关键字分类器”

  • 会查找与文件更相似的最接近的字词向量,
  • 会报告得分最高的文档类型,以及基本的匹配主字词。

“智能关键字分类器”还具有文件拆分功能,这意味着它可以针对给定文件、单独的页面范围报告多个类。

注意:与基于关键字的分类器不同,训练智能关键字分类器时,您不需要手动选择文档中的引用,并且在训练时提供的任何此类引用都将被忽略。

何时使用

在下列情况下,您应考虑使用此分类器:

  • 您的文件在单个文件中包含一个或多个文档类型
  • 就内容而言,您的文档类型相对容易区分。
注意:从版本 6.9.0 开始,“智能关键词分类器”活动的拆分性能已得到改进。为了优化拆分性能,请使用 6.9.0 或更高版本。

特殊要求

您需要使用 Automation CloudTM Document UnderstandingTM API 密钥,或在 AI Center 本地部署版内托管自己的“智能关键字分类器”实例,才能使用此分类器。

如何训练

将“智能关键字分类器训练器”活动放在“训练分类器作用域”中,并进行相应配置。

在活动级别,我们无法在并行训练之间强制保持训练文件一致性。Document Understanding 流程提供了可用于解决此问题的两种方法。两者都包含流量控制:

  1. 锁文件(在流程中默认实现):使用 .lock 扩展名重命名文件,修改并保存文件,然后再次重命名文件以删除 .lock 扩展名
  2. 手动设置特殊队列:在 Orchestrator 中创建一个空队列,并集成项目中的两个活动

有关如何训练分类器的更多信息,请查看此页面,其中描述了“管理学习”向导的使用过程。

了解详情

点击此链接,了解有关智能关键字分类器的更多信息。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。