Document Understanding
最新
False
横幅背景图像
Document Understanding 用户指南
上次更新日期 2024年4月30日

一键分类

现在,您可以在公共预览版中使用新的“一键分类”功能,直接从 Document Understanding 界面轻松训练文档分类器。借助 Document Understanding 中的新用户体验,此功能让您无需在 AI Center 中手动创建数据集、管道和 ML 技能。

在使用此功能之前,请确保您的 Document Understanding 项目已 链接到 AI Center



分类选项

您可以将“一键分类”与 Document Manager 和/或 Forms AI 一起使用,并可以通过“分类”按钮进行识别。

要使用“一键分类”,请在“文档类型”会话中上传您的文档。单击“新建”按钮,然后选择以下选项之一:“使用表单 AI(固定布局表单)”或“使用半结构化 AI”。这两个选项都会打开一个会话,您可以在其中上传文档。在各自的“文档类型”会话中上传文档后,您可以使用“新分类器”按钮打开“一键分类”对话框。

docs image

“分类”按钮将打开一个下拉列表,其中包含两个选项:“自动训练”和“手动训练”。在使用其中任何选项之前,请确保已创建至少两个 Document Understanding 会话,每个会话至少包含十个示例。不符合要求会导致错误,如下所示。



自动化训练

使用“自动训练”选项直接在 Document Understanding 中训练分类数据集。 选择此选项后,您必须添加 分类器名称,选择首选的 文档类型,然后选择文档分类器模型的 版本 。 完成后,单击“ 训练 ” 按钮。



此功能会自动在 AI Center 中使用您之前在“训练分类数据集”弹出窗口的“分类器名称”字段中指定的名称创建一个新的数据集。

详细信息

您可以通过单击“分类器”页面中的 分类 器名称,或单击操作菜单并选择“ 详细信息 ”选项来查看有关已创建的自动训练操作的更多详细信息。

docs image

以下是“详细信息”选项提供的所有信息的列表:

  • 训练集 - 指定已处理的文档数和页数。

  • 已分类文档 - 指定已分类文档的数量。

  • F1 分数 - 提供数据集的准确性分数百分比。

  • 状态 - 提供分类操作的状态。

  • 文档类型 - 提供用于操作的文档类型列表。

  • 包名称 - 提供所用 ML 包的名称。

  • 包版本 - 提供文档分类器模型的已使用版本。

  • ML 技能详细信息 - 提供为数据集创建的 ML 技能的 URL。您可以复制此 URL 并在工作流中使用。

  • 数据集链接 - 提供已创建(公共)数据集的公共端点 URL。

  • 管道详细信息 - 提供为数据集创建的管道的 URL。

  • 分数详细信息 - 指定数据集的准确性分数。

  • 查看/隐藏日志 - 提供包含已创建数据集的所有日志的列表。您可以复制此列表并在需要时使用。

备注: “分数详细信息”和“分数”百分比选项适用于使用 DocumentClassifier 23.1 或更高版本运行的数据集。

手动训练

使用“手动训练”选项将分类数据集导出到 AI Center,然后在 AI Center 中进行训练。 选择此选项后,您必须添加 数据集名称 并选择首选的 文档类型。 完成后,单击“ 导出 ” 按钮。



详细信息

您可以从项目页面中选择“分类器”选项卡,单击操作菜单,然后选择“详细信息”选项,以查看有关已创建的手动训练操作的更多详细信息。

docs image

以下是“详细信息”选项提供的所有信息的列表:

  • 训练集 - 指定已处理的文档数和页数。

  • 已分类文档 - 指定已分类文档的数量。

  • F1 分数 - 提供数据集的准确性分数百分比。

  • 状态 - 提供分类操作的状态。

  • 文档类型 - 提供用于操作的文档类型列表。

  • 包名称 - 提供所用 ML 包的名称。

  • 包版本 - 提供文档分类器模型的已使用版本。

  • ML 技能详细信息 - 提供为数据集创建的 ML 技能的 URL。您可以复制此 URL 并在工作流中使用。

  • 数据集链接 - 提供已创建(公共)数据集的公共端点 URL。

  • 管道详细信息 - 提供为数据集创建的管道的 URL。

  • 分数详细信息 - 指定数据集的准确性分数。

  • 查看/隐藏日志 - 提供包含已创建数据集的所有日志的列表。您可以复制此列表并在需要时使用。

分类器状态

您可以使用项目页面中的“分类器”选项卡检查所有分类操作的状态。

docs image

概述

选择“分类器”选项卡后,您可以看到四个不同的列,每个列都显示有关已创建的分类操作的信息。您可以按字母顺序升序或降序对它们单独排序,也可以将它们保留为默认状态,按创建日期整理,让最新的在顶部:

  • 名称 - 显示分类操作的名称。
  • 类型 - 显示分类操作的类型(导出或训练)。
  • 创建日期 - 显示创建日期。
  • 状态 - 显示操作的状态。每个操作都有多个可用状态。有关更多详细信息,请查看下表。
  • 刷新 - 刷新所有操作的状态,显示最新的操作。

状态

描述

分类选项

可用

操作已成功执行。

自动化训练

正在进行

该操作仍在执行中。

自动化训练

导出已完成

操作已成功执行。

手动训练

正在导出

该操作仍在执行中。

手动训练

未启动

尚未开始执行操作。

自动化训练

手动训练

不同步

Document Understanding 中的状态与 AI Center 中的状态不同步。

自动化训练

手动训练

已暂停

操作已暂停。

自动化训练

手动训练

操作菜单

操作菜单位于右侧,打开后提供以下选项:

  • 复制 URL - 允许您复制使用“自动化训练”操作创建的公共端点的 URL。
  • 详细信息 - 提供有关已创建的操作的信息。
  • 删除 - 从 Document Understanding 和 AI Center 中删除已创建的操作。
  • 停用 ML 技能 - 停用“自动化训练”操作的 ML 技能。
  • 分类选项
  • 自动化训练
  • 手动训练
  • 分类器状态
  • 概述
  • 操作菜单

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.