UiPath Documentation
document-understanding
latest
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。

Document Understanding 传统用户指南

一键提取

使用“一键提取”功能直接从 Document Understanding TM界面轻松训练文档提取程序。借助 Document Understanding 中的新用户体验,此功能可实现无需在 AI Center 中手动创建数据集、管道和 ML 技能。

在使用此功能之前,请确保您的 Document Understanding 项目已链接到 AI Center

提取程序选项

您可以通过单击“新建提取程序” 按钮,使用“一键提取”功能基于现有的半结构化 AI 文档类型创建新的提取程序。

“新建提取程序”按钮将打开一个下拉列表,其中包含两个选项: “自动训练”“手动训练”

自动化训练

使用“自动训练”选项直接在 Document Understanding 中训练提取程序。选择此选项后,您必须添加“提取程序名称” ,选择首选“文档类型” ,选择要使用的“模型”及其版本,启用或禁用“使用 GPU”选项,然后选择模型的版本。完成后,单击“训练”按钮。

备注:

请记住,在开始训练提取程序之前,您需要在计划使用的会话中至少标记十个文档。

此功能会自动在 AI Center 中创建一个新的数据集,其名称为您先前在“训练提取数据集”弹出窗口的“提取程序名称”字段中指定的名称。

备注:

要在标记其他数据后更新提取程序,您需要使用不同的名称创建新的提取程序。

详细信息

您可以通过单击“提取程序”页面中提取程序的名称,或单击操作菜单并选择“详细信息”选项,来查看有关创建的自动训练操作的更多详细信息。

以下是“详细信息”选项提供的所有信息的列表:

  • 训练集 - 指定已处理的文档数和页数。
  • “提取的页面” - 指定提取的页面数。
  • F1 分数- 提供数据集的准确性分数百分比。
  • 状态- 提供提取操作的状态。
  • 文档类型 - 提供用于操作的文档类型列表。
  • 包名称 - 提供所用 ML 包的名称。
  • 包版本- 提供所用 ML 包模型的版本。
  • ML 技能详细信息 - 提供为数据集创建的 ML 技能的 URL。您可以复制此 URL 并在工作流中使用。
  • 数据集链接 - 提供已创建(公共)数据集的公共端点 URL。
  • 管道详细信息 - 提供为数据集创建的管道的 URL。
  • 查看/隐藏日志 - 提供包含已创建数据集的所有日志的列表。您可以复制此列表并在需要时使用。

手动训练

使用“手动训练”选项将数据集导出到 AI Center,然后在 AI Center 中进行训练。选择此选项后,您必须添加数据集名称并选择首选的文档类型。完成后,单击“导出”按钮。

备注:

要在标记其他数据后更新提取程序,您需要使用不同的名称创建新的提取程序。

详细信息

您可以通过单击“提取程序”页面中提取程序的名称,或单击操作菜单并选择“详细信息”选项,查看有关创建的手动训练操作的更多详细信息。

以下是“详细信息”选项提供的所有信息的列表:

  • 训练集 - 指定已处理的文档数和页数。
  • “提取的页面” - 指定提取的页面数。
  • F1 分数- 提供数据集的准确性分数百分比。
  • 状态- 提供提取操作的状态。
  • 文档类型 - 提供用于操作的文档类型列表。
  • 包名称 - 提供所用 ML 包的名称。
  • 包版本- 提供所用 ML 包模型的版本。
  • ML 技能详细信息 - 提供为数据集创建的 ML 技能的 URL。您可以复制此 URL 并在工作流中使用。
  • 数据集链接 - 提供已创建(公共)数据集的公共端点 URL。
  • 管道详细信息 - 提供为数据集创建的管道的 URL。
  • 查看/隐藏日志 - 提供包含已创建数据集的所有日志的列表。您可以复制此列表并在需要时使用。

提取程序状态

您可以使用项目页面中的“提取程序”选项卡检查所有提取操作的状态。

概述

选择“提取程序”选项卡后,您可以看到五个不同的列,每个列都显示有关已创建的分类操作的信息。 您可以按字母顺序升序或降序对它们进行单独排序,也可以将它们保留为默认状态,按创建日期整理,让最新的在顶部:

  • 名称 - 显示分类操作的名称。
  • 类型 - 显示分类操作的类型(导出或训练)。
  • 文档类型- 显示使用的文档类型。
  • 状态 - 显示操作的状态。每个操作都有多个可用状态。有关更多详细信息,请查看下表。
  • 创建日期 - 显示创建日期。
  • 刷新 - 刷新所有操作的状态,显示最新的操作。
状态描述分类选项
可用操作已成功执行。自动化训练
正在进行该操作仍在执行中。自动化训练
导出已完成操作已成功执行。手动训练
正在导出该操作仍在执行中。手动训练
未启动尚未开始执行操作。自动化培训手动培训
不同步Document Understanding 中的状态与 AI Center 中的状态不同步。 导航到 AI Center 并检查与您创建的提取程序对应的 ML 技能的状态。 如果 ML 技能已取消部署,请再次部署。自动化培训手动培训
已暂停操作已暂停。自动化培训手动培训

操作菜单

操作菜单位于右侧,打开后提供以下选项:

  • 复制 URL - 允许您复制使用“自动化训练”操作创建的公共端点的 URL。
  • 详细信息 - 提供有关已创建的操作的信息。
  • 删除 - 从 Document Understanding 和 AI Center 中删除已创建的操作。
  • 停用 ML 技能 - 停用“自动化训练”操作的 ML 技能。
  • 提取程序选项
  • 自动化训练
  • 手动训练
  • 提取程序状态
  • 概述
  • 操作菜单

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新