Document Understanding 用户指南

关于 ML 包

使用 Document Understanding ML 包涉及以下步骤：

收集文档示例和需要提取的数据点的要求。
使用 Data Manager 为文档添加标签。
Data Manager 本身将连接到 OCR 服务。
将带标签的文档导出为训练数据集，并将导出的文件夹上传到 AI Center 存储。
将带标签的文档导出为测试数据集，并将导出的文件夹上传到 AI Center 存储。
在 AI Center 上运行训练管道。
在 AI Center 上使用评估管道评估模型性能。
在 AI Center 中将经过训练的模型部署为 ML 技能。
使用 UiPath.DocumentUnderstanding.ML 活动包从 RPA 工作流查询 ML 技能。
重要事项：请记住，使用 Document Understanding ML 包要求安装 AI Center 的计算机可以访问 https://du-metering.uipath.com。

重要提示：在 AI Center 中创建 UiPath.DocumentUnderstanding.ML.Activities 包时，包名称不应为任何 python 保留关键字，例如 class、break、from、finally、global、None 等。请注意，此列表并不详尽，因为 class <pkg-name> 和 import <pkg-name> 使用了包名称。

这些开箱即用的机器学习模型可用于从半结构化或非结构化文档中分类和提取任何经常出现的数据点，包括采用无模板方法的常规字段、表格列和分类字段。

Document Understanding 包含多个 ML 包，分为 4 个主要类别：

这是一个不可重新训练的模型，可与“UiPath 文档 OCR 引擎”活动一起使用，作为“数字化文档”活动的一部分。要使用此模型，首先必须将其设为公开，以便将 URL 复制粘贴到 UiPath 文档 OCR 引擎活动中。

UiPath Document OCR 需要访问 https://du.uipath.com/metering 上的 Document Understanding 计量服务器，如果 ML 技能在内部部署 AI Center 常规部署上运行。内部部署 AI Center 离线部署不需要互联网访问。

AI Center 中的 UiPathDocumentOCR ML 包针对在 GPU 上运行进行了优化，因此我们强烈建议在 GPU 上使用它。如果没有可用的 GPU，我们建议使用独立的 Docker 容器。

这是一个通用、可重新训练的模型，用于从任何类型的结构化或半结构化文档中提取任何经常出现的数据点，从而从头开始构建模型。此 ML 包必须经过训练。如果在未事先进行训练的情况下部署此包，部署将失败，并显示错误，指明模型未经过训练。

这些是可重新训练的 ML 包，其中包含不同机器学习模型的知识。

可以使用管道运行对这些包进行自定义，以提取其他字段或支持其他语言。使用最先进的迁移学习功能，您可以在其他已标记的文档上对此模型进行重新训练，并针对特定用例进行量身定制，或者将其扩展以支持拉丁语、西里尔语或希腊语等其他语言。

所使用的数据集可能具有相同的字段、字段的子集，或具有其他字段。要利用预训练模型中已包含的智能，您需要使用与开箱即用模型本身名称相同的字段。

这些 ML 包包括：

这些模型是 UiPath 构建的深度学习架构。可以在服务时和训练时使用 GPU，但这不是必需的。具体来说，GPU 可使训练速度提高 10 倍以上。

这些是 Document Understanding 套件的非 ML 组件所需的包，这些包不可重新训练。

这些 ML 包包括：

在此页面上

前一个训练管道和评估管道

下一个支持的语言