document-understanding
latest
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 新式项目用户指南

上次更新日期 2025年12月9日

重新训练提取程序

您可以使用在验证站点中验证的文档,进一步提高模型的性能。

您可以使用以下活动重新训练文档经过处理的文档:
  • UiPath.DocumentUnderstanding.Activities:使用此活动包处理并在验证站点中验证的所有文档都会自动收集,可用于重新训练。
  • UiPath.IntelligentOCR.Activities(从 6.25.0 预览版开始):要重新训练使用此活动包处理的文档,请在工作流中使用 Document Understanding 项目提取程序训练活动。这样,可以收集文档以进行重新训练。

The Exceptions for review button is now always visible for the corresponding document type within the Build section. If no documents have been collected, the button remains available and displays a count of 0.

注意:收集的文档不会自动包含在训练集中。 您需要查看文档并确认将其添加到训练集中,以重新训练您的模型。

待审核的异常

按照此过程中的步骤,使用验证站点中的文档微调模型。
Note: Documents collected for exceptions are stored for a period of 90, after which they are automatically deleted.

不会收集持续时间超过 7 天的验证任务的文档。

  1. 选择“待审核的异常”按钮。
  2. 查看“待微调的异常”菜单中的异常文档。
    每个文档都提供以下信息:
    • 文件名称:包含异常的文档的文件名称。
    • 状态:文档的状态。
    • 页面:文档包含的页面数。
    • 项目版本:包含文档的项目版本。
    • 处理日期:处理文档的日期。
    • 提取字段的数量:包含异常的文档的提取字段数量。
    • 更正字段的数量:在验证阶段被修改的字段数量。
    • 验证者姓名:验证文档的人员的用户名。
    Note: The Exceptions for fine-tunning list may include documents imported from other Document Understanding projects or environments.


  3. 从列表中选择你想要用于微调的文档。
    每个文档都提供以下信息:
    • 此时将显示所有提取的字段以及模型的置信度。如果置信度的值为 N/A,这表示该字段未自动提取,而是由验证者手动添加的。
    • 更正的字段的提取字段名称旁边标记有黄点。
    • 以下信息可用于所有更正的字段:
      • 预测值:模型预测的值。
      • 更正的值:如果手动更改,则为验证后的值。 如果文档类型在验证后未更改,值将为“不适用”
      • 引用:文档上高亮显示的原始值。 如果您决定将该文档用于微调,此值会用于标注。
    • 您可以轻松按置信度排序查看置信度低的字段,无需进行更正。
    • 您也可以筛选出已更正的字段,专注于这类字段。


  4. 如果您想进一步标注此文档,请选择“标注”,如果您想使用此文档重新训练模型,请选择“用于模型微调”
    • 用于模型微调
      • 当文档是模型微调的理想样本、且所有字段在文档中引用正确时选择此项。
      • 文档导入训练中时带有“异常”标签,而且所有标注均已完成确认。文档将用于微调。
    • 标注
      • Choose this if the document is a good example for the model fine-tuning, but there are some validation errors, for example not all fields are correctly referenced wihtin the document and further corrections are needed.
      • 文档导入训练集中时带有“异常”标签,而且所有标注均未确认。标注必须在构建部分中完成确认,文档才能用于微调模型。
      • 如果您选择进一步标注文档,请查看“标注文档”页面,了解有关如何标注文档的更多信息。
    • 排除
      • 当文档并非理想样本,且需将其从待审核异常列表中移除,而且在未来审核会话中无需审核该文档时选择此项。
      • 您可以更改文档的状态以恢复更改。
    图 1. 用于微调或标注的选定文档

选择所有文档进行微调后,系统会使用验证站点中的新数据重新训练您的模型。

您可以创建新的项目版本,并使用“度量”部分中的“比较模型”功能对模型性能进行比较。

[Preview] Exporting and importing retraining candidates

Document Understanding allows you to export retraining candidates from one environment and import them into another.

This setup is commonly used in scenarios where you maintain a development–test–production environment structure, and your process involves creating a copy of the development Document Understanding project in higher environments, such as test, UAT, or production. In this arrangement, retraining documents are gathered within the production project, and the export–import feature allows you to bring the documents back into the development environment for model retraining, before promoting the updates back to the higher environments.

Exporting retraining candidates

You can export retraining candidates directly from the Exceptions for review page by selecting the Export button. Select View exports to access the list of exported files.



You may choose to export all collected documents or only a selected subset, depending on how you prefer to manage the review process, as explained in the following examples:

  • You can export all collected documents and triage them in the environment where you plan to import them and retrain the model.
  • You can complete the review in the current environment and export only the specific documents you want to use for retraining.


Importing retraining candidates

Importing is done from the Exceptions for review page. Imported documents are displayed in a similar manner to documents automatically collected from the Validation Station, with the To review status.

Imported documents are added as retraining candidates. For model fine-tuning, simply follow the same steps as for documents collected directly in a project. Remember to review and confirm the retraining candidates before adding them to the training set.

  • 待审核的异常
  • [Preview] Exporting and importing retraining candidates
  • Exporting retraining candidates
  • Importing retraining candidates

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo
信任与安全
© 2005-2025 UiPath。保留所有权利。