UiPath Documentation
document-understanding
2.2510
true
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding user guide

上次更新日期 2026年4月6日

导出文档

“导出文件”对话框用于轻松导出数据以训练 ML 模型。

Select the Export button “导出”图标 from the management bar.

该对话框包含三个选项卡:

立即导出

“立即导出”选项卡使您能够:

  • Download to Excel - Download the data locally in an Excel format.
  • Download - Download the data locally.
  • Export to AI Center - Export the data to AI Center. The exported folders can be found in AI Center under the export folder (Datasets > dataset_name > export).
备注:

The Download to Excel function cannot be used if Schema or Backwards-compatible export options are selected.

如果未定义架构,则禁用所有导出选项。

如果定义了架构,则必须输入导出名称,否则将禁用“下载”和“导出”按钮。有效名称最多可包含 24 个字符,并且不得包含特殊字符。

即使架构包含多值字段,您也可以导出或下载该架构。

您可以选择以下导出选项:

  • 当前搜索结果 - 按预定义关键字/指定批次或文本查询筛选的带标签文档。如果未应用任何筛选器,则导出当前视图中的所有带标签文档。
  • “全部已添加标签”- 所有至少包含一个已标记字段(任意类型)的文档;更准确地说,是来自“带标签”筛选器的文档。
  • 架构 - 包含字段及其配置的 zip 文件,可将其导入到不同的 Document Manager 会话中。
  • All - exports all documents, no matter if labels are applied or not.

“向后兼容导出”复选框使您能够应用旧版导出行为,即将每个页面导出为单独的文档。如果使用默认方式导出的已训练模型未达到预期效果,请尝试以下方法。取消选中此项以原始多页形式导出文档。

导出验证

要导出数据集,需要在至少 10 个不同的页面中为所有字段加上标签。否则,导出将失败,并显示以下消息:

导出错误示例

导出错误示例

对于分类字段,还存在另一个要求:需要在至少一个文档中为每个选项加上标签。否则,导出将失败,并显示以下消息:

导出错误示例

仅导出评估集数据时,将禁用所有验证。

数据集格式

包含来自 Document Manager 的导出数据集的文件夹。这包括:

  • schema.json:此文件包含要提取的字段及其类型

  • split.csv:此文件夹包含每个文档的拆分,这些文档将在训练管道中用于训练验证

  • images:此文件夹包含所有已标记页面的图像;

  • latest:此文件夹包含 .json 文件,以及每个页面中的已标记数据;

    “数据集”界面的屏幕截图。

日志

“日志”选项卡显示最新的导出日志。

如果导出成功,日志将显示已处理的文档数量和导出持续时间。

日志消息示例

如果架构导出成功,日志将显示导出持续时间。

日志消息示例

在文件导出过程中,您可以查看导出状态。这对于大型导出尤其有用。

日志消息示例

日志还会显示错误消息,例如:

日志消息示例

In case of a successful auto-retraining, the import logs from the fine-tune folder of the dataset are displayed as well:

日志消息示例

  • 立即导出
  • 导出验证
  • 数据集格式
  • 日志

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新