document-understanding
latest
false
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
上次更新日期 2024年12月12日

一键提取

使用“一键提取”功能直接从Document Understanding TM界面轻松训练文档提取程序。 借助 Document Understanding 中的新用户体验,此功能让您无需在 AI Center 中手动创建数据集、管道和 ML 技能。

在使用此功能之前,请确保您的 Document Understanding 项目已 链接到 AI Center

提取程序选项

您可以单击“ 新建提取 程序”按钮,使用“一键提取”功能基于现有的半结构化 AI 文档类型创建新的提取程序。

新建提取 程序” 按钮将打开一个下拉列表,其中包含两个选项:“ 自动训练 ” 和 “手动训练”

自动化训练

使用“自动训练”选项直接在 Document Understanding 中训练提取程序。 选择此选项后,您必须添加 “ 提取程序名称”,选择首选的 “文档类型”,选择要使用的 模型 及其 版本,启用或禁用 “ 使用 GPU ”选项,然后选择模型的 版本 。 完成后,单击“ 训练 ” 按钮。

备注:

请记住,在开始训练提取程序之前,您需要在计划使用的会话中至少标记十个文档。

docs image

此功能会自动在 AI Center 中创建一个新的数据集,其名称为您先前在“训练提取数据集”弹出窗口的“提取程序名称”字段中指定的名称。

注意:要在标记其他数据后更新提取程序,您需要使用不同的名称创建新的提取程序。

详细信息

您可以通过单击“提取程序”页面中的 提取 程序名称,或单击操作菜单,然后选择“ 详细信息 ”选项,查看有关已创建的自动化训练操作的更多详细信息。

以下是“详细信息”选项提供的所有信息的列表:

  • 训练集 - 指定已处理的文档数和页数。
  • “提取的页数 ” - 指定提取的页数。
  • F1 分数 - 提供数据集的准确性分数百分比。
  • “状态” - 提供提取操作的状态。
  • 文档类型 - 提供用于操作的文档类型列表。
  • 包名称 - 提供所用 ML 包的名称。
  • 包版本 - 提供所用 ML 包模型的版本。
  • ML 技能详细信息 - 提供为数据集创建的 ML 技能的 URL。您可以复制此 URL 并在工作流中使用。
  • 数据集链接 - 提供已创建(公共)数据集的公共端点 URL。
  • 管道详细信息 - 提供为数据集创建的管道的 URL。
  • 查看/隐藏日志 - 提供包含已创建数据集的所有日志的列表。您可以复制此列表并在需要时使用。

手动训练

使用“手动训练”选项将数据集导出到 AI Center,然后在 AI Center 中进行训练。 选择此选项后,您必须添加 数据集名称 并选择首选 文档类型。 完成后,单击“ 导出 ”按钮。

docs image
注意:要在标记其他数据后更新提取程序,您需要使用不同的名称创建新的提取程序。

详细信息

您可以通过单击“提取程序”页面中的 提取 程序名称,或单击操作菜单,然后选择“ 详细信息 ”选项,查看有关已创建的手动训练操作的更多详细信息。

以下是“详细信息”选项提供的所有信息的列表:

  • 训练集 - 指定已处理的文档数和页数。
  • “提取的页数 ” - 指定提取的页数。
  • F1 分数 - 提供数据集的准确性分数百分比。
  • “状态” - 提供提取操作的状态。
  • 文档类型 - 提供用于操作的文档类型列表。
  • 包名称 - 提供所用 ML 包的名称。
  • 包版本 - 提供所用 ML 包模型的版本。
  • ML 技能详细信息 - 提供为数据集创建的 ML 技能的 URL。您可以复制此 URL 并在工作流中使用。
  • 数据集链接 - 提供已创建(公共)数据集的公共端点 URL。
  • 管道详细信息 - 提供为数据集创建的管道的 URL。
  • 查看/隐藏日志 - 提供包含已创建数据集的所有日志的列表。您可以复制此列表并在需要时使用。

提取程序状态

您可以使用项目页面中的“ 提取 程序”选项卡检查所有提取操作的状态。

概述

选择“提取程序”选项卡后,您可以看到五个不同的列,每个列都显示有关已创建的分类操作的信息。 您可以按字母顺序升序或降序对它们进行单独排序,也可以将它们保留为默认状态,按创建日期整理,让最新的在顶部:

  • 名称 - 显示分类操作的名称。
  • 类型 - 显示分类操作的类型(导出或训练)。
  • 文档类型 - 显示使用的文档类型。
  • 状态 - 显示操作的状态。每个操作都有多个可用状态。有关更多详细信息,请查看下表。
  • 创建日期 - 显示创建日期。
  • 刷新 - 刷新所有操作的状态,显示最新的操作。

状态

描述

分类选项

可用

操作已成功执行。

自动化训练

正在进行

该操作仍在执行中。

自动化训练

导出已完成

操作已成功执行。

手动训练

正在导出

该操作仍在执行中。

手动训练

未启动

尚未开始执行操作。

自动化训练

手动训练

不同步

Document Understanding 中的状态与 AI Center 中的状态不同步。 导航到 AI Center 并检查与您创建的提取程序对应的 ML 技能的状态。 如果 ML 技能已取消部署,请再次部署。

自动化训练

手动训练

已暂停

操作已暂停。

自动化训练

手动训练

操作菜单

操作菜单位于右侧,打开后提供以下选项:

  • 复制 URL - 允许您复制使用“自动化训练”操作创建的公共端点的 URL。
  • 详细信息 - 提供有关已创建的操作的信息。
  • 删除 - 从 Document Understanding 和 AI Center 中删除已创建的操作。
  • 停用 ML 技能 - 停用“自动化训练”操作的 ML 技能。
  • 提取程序选项
  • 自动化训练
  • 手动训练
  • 提取程序状态
  • 概述
  • 操作菜单

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。