UiPath Documentation
document-understanding
2.2510
true
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding modern projects user guide

上次更新日期 2026年4月15日

标注文档

After successfully creating your project and uploading your documents to a specific document type, they are automatically pre-annotated. This is done using specialized models, based on the document type's schema. The schema clearly defines the fields you want to extract from a particular document type. To find the document type's schema, go to the Annotation page and check the Fields section.

“字段”菜单的屏幕截图。

预测在文档中的文本上显示为下划线,无法删除。如果这些信息不正确且无法与特定字段匹配,您可以忽略它们。在训练流程期间,只有确认的字段会被用于训练,而不会考虑下划线。

随着您继续添加更多标注,预测下划线应会逐渐与您的输入对齐。开头下划线和用户标注字段之间可能存在一些不一致。但是,随着您创建的标注数量增加以及模型的改进,下划线与用户提供的数据之间的排列应该会更加精确。

在以下图像中,送货地址被错误预测为包含人员姓名。

“字段名称”菜单的屏幕截图。

要解决此问题,您只需确认收货地址。无需删除与名称相关的带下划线的文本。当您继续批注并更正此类错误时,带下划线的文本与已确认的字段不一致的情况应该会减少。

备注:

要触发模型训练,至少需要 40 次操作。例如,如果您有 20 个文档,则每个文档至少需要批注 2 个字段,总共需要 40 次操作。

提示:

To optimize model perfomance, follow the suggestions from the Recommendations section. These suggestions are designed to improve the overall performance of your model.

“批注”页面的屏幕截图。

验证预测的文档

上传并预测所有文档后,您的目标是验证或修改预批注的字段。对于所有字段均被准确预测的文档,请选择“确认”以一次性确认所有字段。文档确认后,将在文档列表中显示绿色盾牌符号。

“批注”页面的屏幕截图。

If a document is only partially confirmed, it will be marked with an empty shield symbol in the document list. This symbolizes that the annotation process for this particular document is In Progress. Your end aim should be to make sure that all documents are Confirmed.

在验证期间,您可能会遇到以下情况:

  • 预测正确,应进行验证。
  • 预测不正确,该字段存在于文档中。
  • 预测不正确,文档中缺少该字段。
  • 没有预测。

预测正确,应进行验证

如果预测准确无误,您可以通过选择带下划线的文本并选择“确认”或选中字段的确认复选框来进行确认。不过最便捷的方法是直接按下分配给该字段的快捷键(在此场景中为“N”)。

“批注”页面的屏幕截图。

预测不正确,且该字段位于文档中

如果预测不正确,请从文档中选择正确的文本和从下拉列表中选择相应的字段,然后选择“确认”。

当处理表格时,您可以选择忽略错误预测的值。这些值将不会用于模型训练,而重新训练的模型将学会在后续迭代中避免预测这些值。

预测不正确,文档中缺失该字段

如果预测不正确且文档中缺少该字段,请选择字段名称旁边的三点图标 ,然后选择“标记为缺失”。

重要提示:

You can also mark wrong fields as missing. For example, if you do not have a Vendor Address in your document but during processing a different field was pre-labeled as Vendor Address, you can just mark it as missing during validation.

“批注”页面的屏幕截图。

无预测

没有预测的字段显示为空单元格。您可以将这些单元格逐一标记为缺失,或通过选择“确认”按钮批量标记为缺失。

文档类型设置

You can change the document type settings from the Annotate view.

要这样做,请选择文档类型名称右侧的三点图标 ,然后选择“设置”。

“设置”按钮的屏幕截图。

您可以更改以下设置:

  • 基本模型:“建议操作”中使用的数据集大小估计值取决于用于训练的基本模型。使用与您的文档类型最相似的基本模型将减少所需的注释工作量。
  • 语言数量:“建议操作”中使用的数据集大小估计值取决于数据集中语言的数量。通常情况下,语言越多,需要添加注释的数据就越多。

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新