activities
latest
false
重要 :
请注意此内容已使用机器翻译进行了部分本地化。 新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 活动

上次更新日期 2024年12月5日

基于关键词的分类器

UiPath.IntelligentOCR.Activities.DocumentClassification.KeywordBasedClassifier

描述

此活动的功能如下:

  • 包含基于关键字的文档分类算法,可针对具有重复标题的文件进行分类。
  • 如果在“分类文档范围”活动中使用,则根据在指定文件中找到的给定训练集对文档进行分类。

此活动只能与“分类文档范围”和“训练分类器范围”活动一起使用。

项目兼容性

Windows - Legacy | Windows

配置

设计器面板
  • “学习文件路径”- 包含分类器数据的文件的完整路径。此字段仅支持字符串和 String 变量。
    备注:

    一次只能设置上述参数之一。 您可以使用 LearningData 字符串或 LearningFilePath 字符串。

    LearningFilePath 指定从中检索分类器数据的位置。

    LearningData 包含该分类器的实际信息。

属性面板

常见

  • “显示名称”- 活动的显示名称。

输入

  • “学习数据”- 包含序列化分类器数据的字符串。此字段仅支持字符串和 String 变量。
  • “学习文件路径”- 包含分类器数据的文件的完整路径。此字段仅支持字符串和 String 变量。
    备注:

    一次只能设置上述参数之一。 您可以使用 LearningData 字符串或 LearningFilePath 字符串。

    LearningFilePath 指定从中检索分类器数据的位置。

    LearningData 包含该分类器的实际信息。

  • “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
    注意: 最佳做法是在该位置创建一个空的 .json 文件,然后在“学习文件路径”字段中使用其名称。

使用“管理学习”向导

您只需访问活动的“管理学习”向导,即可在设计时配置“基于关键字的分类器”。通过使用具有更新后学习文件路径的同一向导,可以使用同一向导来审核在文档分类训练阶段收集的数据。

此向导用于配置和管理此活动用于标识文档类型的关键字。创建它是为了适应编辑文件路径的需要。如果改用带有变量的“学习数据”参数,则系统会询问您是否要编辑特定文件路径或中止此操作。

备注:管理基于关键字的分类器学习”向导只能用于编辑和配置文件路径。
  1. 在工作流中添加“基于关键字的分类器”或“基于关键字的分类器训练器”活动。
  2. 通过添加 .json 文件的路径来配置“基于关键字的分类器”活动。配置分类器时,请考虑以下信息:
    • 如果系统未提供路径并且您单击了“管理学习”选项,则系统会显示一个弹出窗口,要求提供学习文件路径输入。提供路径后,系统将打开向导。
    • 可以添加变量而不是 .json 文件,但是,由于向导无法将学习模式应用于学习数据变量,因此它会要求您提供可编辑的特定文件路径。
  3. 选择“管理学习”。
    系统将打开“管理基于关键字的分类器学习”向导窗口。
    图 1.“管理基于关键字的分类器学习”向导概览

  4. 如果系统未提供路径并且您选择了“管理学习”选项,则系统会显示一个弹出窗口,要求提供学习文件路径。提供路径后,系统将打开向导。
    图 2. 如果未提供路径而选择了“管理学习”选项,则会显示“警告”弹出窗口

    注意:即使没有可用的 .json 文件,您也可以直接将新的 .json 文件的名称添加到活动中,系统会在指定的文件夹中自动创建 .json 文件。

为文档类型添加关键字

该向导包含您在分类法中定义的尽可能多的文档类型类别。您可以为每种文档类型添加单个或多个关键字。该活动学习特定文档的关键字,然后能够根据这些规则对特定类型的文档进行识别和分类。

所有条目都应作为字符串输入,并在 ""(引号)之间输入,并且您可以添加单个或多个值。要添加或删除关键字,请在向导中执行以下步骤:
  1. 单击“添加新关键字集”会向该类别添加一个额外的字段。
  2. 选择 remove 删除图标,以删除字段及其关键字。
  3. 选择“保存”以保存向导配置。您可以在项目的 .json 文件中找到所有添加的值。
    注意:根据 Visual Basic 约定(双引号),在“管理关键字”向导中作为关键字的一部分输入的双引号始终会转义,即使在 C# 风格的项目中也是如此。

Document Understanding 集成

“基于关键词的分类器”活动是 Document Understanding 解决方案的一部分。如需了解详情,请访问 Document Understanding 指南

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。