Document Understanding 用户指南

适用平台：

上次更新日期 2024年10月24日

使用附加字段重新训练发票

重要提示：

此页面旨在帮助首次使用 Document Understanding 的用户。

对于可扩展的生产部署，我们强烈建议您使用 UiPath Studio 模板部分下的 Document Understanding 流程。

本快速入门向您展示如何重新训练开箱即用的发票 ML 模型，以再提取一个字段。

我们使用上一个快速入门中用于收据的同一工作流进行修改，以便支持发票。

为此，我们需要在工作流中执行以下步骤：

现在，让我们详细了解每个步骤。

在此步骤中，我们需要修改分类以添加发票文档类型。

为此，请打开分类管理器并创建一个名为“半结构化文档”的组、一个名为“财务”的类别，及一个名为“发票”的文档类型。使用用户友好名称以及相应的数据类型创建上面列出的字段。

在此步骤中，我们需要添加分类器，以便使用工作流处理收据和发票。

由于我们的工作流现在支持“收据”和“发票”两种文档类型，因此我们需要添加分类器以区分作为输入的不同文档类型：

在“数字化文档”活动之后添加“分类文档作用域”，并提供“文档路径”、“文档文本”、“文档对象模型”和“分类”作为输入参数，并在新变量中捕获“分类结果”。我们需要此变量来检查正在处理的文档。
我们还需要指定一个或多个分类器。在此示例中，我们将使用智能关键字分类器。请将其添加到“对文档范围进行分类”活动中。

此页面可帮助您就在不同场景中应使用的分类方法作出明智的决策。
请按此处所述训练分类器。
通过为这两种文档类型启用分类器来配置分类器。
根据您的用例，您可能需要验证分类。您可以使用“呈现分类站点”或“创建文档分类操作”以及“等待文档分类操作然后继续”活动来执行此操作。

在此步骤中，我们需要将机器学习提取程序添加到“数据提取范围”活动中，并将其连接到“发票”公共端点。

该过程与我们之前添加的先前收据机器学习提取程序相同：

在收据机器学习提取程序旁边添加“机器学习提取程序”活动。
提供发票公共端点，即https://du.uipath.com/ie/invoices/，以及提取程序的 API 密钥。
通过将在分类管理器中创建的字段映射到 ML 模型中的可用字段，配置提取程序以使用发票：
请勿忘记使用“分类文档作用域”输出的“分类结果”变量作为“数据提取作用域”的输入，而不是指定“文档类型 ID”。

您应该得到如下结果：
运行工作流以测试它是否能正确处理发票。

在重新训练基本发票 ML 模型之前，我们需要为数据加上标签，以使其支持新的 IBAN 字段。

考虑到您需要解决的用例的复杂性，收集足够数量的需求和发票文档示例。

按照此文档页面中的说明，标记 50 页。
获得对 Document Manager 实例的访问权限（无论是本地部署还是 Cloud AI Center）。请确保您有使用 Data Manager 的权限。
创建一个 AI Center 项目，转到“数据标签”>“UiPath Document Understanding”，然后创建一个“数据标签”会话。
按此处所述配置 OCR 引擎，尝试导入多种生产文档，并确保 OCR 引擎读取您需要提取的文本。

更多建议，请参阅本部分。只有在您确定了 OCR 引擎后，才能继续下一步。
创建新的 Data Manager 会话，然后导入训练集和评估集，同时确保在导入评估集时选中“将此作为测试集”复选框。
创建并配置 IBAN 字段。

本节提供了更高级的准则。
请按此处和此处所述，标记训练数据集和评估数据集。

此处描述的 Document Manager 预加标签功能可以使加标签工作变得更加容易。
首先从“Document Manager”视图顶部的筛选器下拉列表中选择评估集，然后将训练集导出到 AI Center。

接下来，让我们创建模型，重新训练并部署它。

现在，我们的工作流支持处理发票，我们需要从发票中提取 IBAN，此字段是开箱即用的发票 ML 模型默认情况下不会选取的字段。这意味着我们需要从基本模型开始重新训练新模型。

请按此处所述创建 ML 包。如果您的文档类型与开箱即用的文档类型不同，请选择“Document Understanding ML 包”。否则，请使用与您需要提取的文档类型最接近的包。
使用您在上一节中从 Data Manager 导出的输入数据集，按照此处的说明创建训练管道。
当训练完成并且您有包次要版本 1 时，请在此次要版本上运行评估管道，并并排检查 evaluation.xlsx。

请使用此处的详细准则。
如果评估结果令人满意，请转到“ML 技能”视图并使用 ML 包的新次要版本创建 ML 技能。如果要使用它在 Data Manager 中进行预加标签，则需要单击 ML 技能视图右上角的“修改当前部署”按钮，然后打开“将 ML 技能设为公开”。
创建 ML 技能后，我们现在需要在 Studio 中使用它。最简单的方法是按此处所述将 ML 技能设为公开。然后，唯一要做的就是将我们最初在工作流中添加到机器学习提取程序的发票 ML 模型公共端点替换为 ML 技能的公共端点。
运行工作流，您应该会看到沿默认发票字段提取新添加的 IBAN 字段。