Document Understanding
2020.10
False
横幅背景图像
已弃用
Document Understanding 用户指南
上次更新日期 2024年2月28日

关于 ML 包

使用 Document Understanding ML 包涉及以下步骤:

  • 收集文档示例和需要提取的数据点的要求。
  • 使用 Data Manager 为文档添加标签。

    Data Manager 本身将连接到 OCR 服务

  • 将带标签的文档导出为训练数据集,并将导出的文件夹上传到 AI Center 存储。
  • 将带标签的文档导出为测试数据集,并将导出的文件夹上传到 AI Center 存储。
  • 在 AI Center 上运行训练管道。
  • 在 AI Center 上使用评估管道评估模型性能。
  • 在 AI Center 中将经过训练的模型部署为 ML 技能。
  • 使用 UiPath.DocumentUnderstanding.ML 活动包从 RPA 工作流查询 ML 技能。
    注意:请记住,要使用 Document Understanding ML 包,安装 AI Center 的计算机必须能够访问 https://du-metering.uipath.com
    重要提示:在 AI Center 中创建 UiPath.DocumentUnderstanding.ML.Activities 包时,包名称不应为任何 python 保留关键字,例如 classbreakfromfinallyglobalNone 等。请注意,此列表并不详尽,因为 class <pkg-name>import <pkg-name> 使用了包名称。

这些开箱即用的机器学习模型可用于从半结构化或非结构化文档中分类和提取任何经常出现的数据点,包括采用无模板方法的常规字段、表格列和分类字段。



Document Understanding 包含多个 ML 包,分为 4 个主要类别:

UiPath 文档 OCR

这是一个不可重新训练的模型,可与“UiPath 文档 OCR 引擎”活动一起使用,作为“数字化文档”活动的一部分。要使用此模型,首先必须将其设为公开,以便将 URL 复制粘贴到 UiPath 文档 OCR 引擎活动中。

UiPath Document OCR 需要访问 https://du.uipath.com/metering 上的 Document Understanding 计量服务器,如果 ML 技能在内部部署 AI Center 常规部署上运行。内部部署 AI Center 离线部署不需要互联网访问。

AI Center 中的 UiPathDocumentOCR ML 包针对在 GPU 上运行进行了优化,因此我们强烈建议在 GPU 上使用它。如果没有可用的 GPU,我们建议使用独立的 Docker 容器。

Document Understanding

这是一个通用、可重新训练的模型,用于从任何类型的结构化或半结构化文档中提取任何经常出现的数据点,从而从头开始构建模型。此 ML 包必须经过训练。如果在未事先进行训练的情况下部署此包,部署将失败,并显示错误,指明模型未经过训练。

开箱即用的预训练 ML 包

这些是可重新训练的 ML 包,其中包含不同机器学习模型的知识。

可以使用管道运行对这些包进行自定义,以提取其他字段或支持其他语言。使用最先进的迁移学习功能,您可以在其他已标记的文档上对此模型进行重新训练,并针对特定用例进行量身定制,或者将其扩展以支持拉丁语、西里尔语或希腊语等其他语言。

所使用的数据集可能具有相同的字段、字段的子集,或具有其他字段。要利用预训练模型中已包含的智能,您需要使用与开箱即用模型本身名称相同的字段。

这些 ML 包包括:

  • 发票:可在此处找到开箱即用提取的字段。
  • 澳大利亚发票 Preview:可在此处找到开箱即用提取的字段。
  • 印度发票 Preview:可在此处找到开箱即用提取的字段。
  • 日本发票 Preview:可在此处找到开箱即用提取的字段。
  • 收据:可在此处找到开箱即用提取的字段。
  • 采购订单 Preview:可在此处找到开箱即用提取的字段。
  • 水电费账单 Preview:可在此处找到开箱即用提取的字段。

这些模型是 UiPath 构建的深度学习架构。可以在服务时和训练时使用 GPU,但这不是必需的。具体来说,GPU 可使训练速度提高 10 倍以上。

其他开箱即用的 ML 包

这些是 Document Understanding 套件的非 ML 组件所需的包,这些包不可重新训练。

这些 ML 包包括:

  • 表单提取程序:部署为公开技能并将 URL 粘贴到“表单提取程序”活动中。
  • 智能表单提取程序:部署为公开技能并将 URL 粘贴到“智能表单提取程序”活动中。请务必先部署手写识别 ML 技能,并将其配置为此包的 OCR。
  • 智能关键字分类器:部署为公开技能并将 URL 粘贴到“智能关键词分类器”活动中。
  • 手写识别:部署为公开技能,并在创建智能表单提取程序包时用作 OCR。

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.