document-understanding
latest
false
UiPath logo, featuring letters U and I in white

Document Understanding 新式项目用户指南

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
上次更新日期 2024年12月12日

UiPath™ 文档路径

DocPath 大型语言模型 (LLM) 是我们最新的数据提取模型技术,旨在替换UiPath™ Document Understanding TM中使用的当前生成模型。 虽然 DocPath 的运行方式与以前的模型类似,但它是使用各种文档进行训练的。 这使其能够处理常见的文档类型,甚至几乎不需要训练。 DocPath LLM 的独特之处在于其生成式架构,该架构可显着提高准确性并简化提取。 此外,您还可以使用唯一的数据集来微调模型。

要进一步了解 DocPath 架构和用于训练的技术,请查看我们的 AI 博客中的DocPath页面。

可用性

目前,UiPath DocPath 仅适用于美国的租户。 计划于 2025 月初推出对其他区域的支持。

与上代相比的改进

与以前的模型相比,DocPath LLM 提供了许多增强功能。 它提高了准确性,尤其是表格的准确性,可适应各种文档布局以减少注释工作,并提高自动化率。

主要改进包括:
  • 提高的准确性: DocPath LLM 为发票、收据和采购订单等半结构化文档提供了更高的准确率和卓越的 F1 分数。 这可确保提取精确一致的数据。
  • 轻松注释: 该模型每个文档只需要一个注释,无需在每个页面上注释每个字段实例,从而减少了手动工作。
  • 增强的自动化: 由于置信度级别和准确性之间的相关性更大,DocPath LLM 在提高自动化率的同时,还减少了在准确性级别相同的情况下发送到 Action Center 的文档数量。

从我们的内部测试来看,DocPath 的性能优于其前身。 它将误报率减少了约 15%,漏报率下降了近 17%。

如何使用 DocPath

DocPath LLM 仅适用于 Document Understanding 新式项目。 尽管引入了 DocPath,所有现有的项目版本仍将使用当前的模型版本。 这可确保无缝过渡,而不会中断正在进行的生产工作流。

要开始在 DocPath 上训练现有文档类型,请取消确认并确认几个文档中的所有字段。

  1. 选择要在 DocPath 上训练的文档类型。
  2. 选择一个文档。
  3. 选择文档中的所有字段,然后选择“删除”。


  4. 标注文档中的所有字段,然后选择“确认”。
    注意:重复步骤34 ,直到针对所选文档类型启动训练。


如何检查 DocPath 是否已启用

在 DocPath 上训练模型后,请检查模型版本以确保已启用 DocPath。
  1. 转到“发布”页面并创建一个新的项目版本。
  2. 选择项目版本旁边的三点图标 ,然后选择“编辑版本”以查看模型版本。
    Note: All models version 24.7 and above are UiPath DocPath models.


Optimizing results

The field names you choose can greatly impact the performance of the model. To ensure optimal results, use natural language and proper grammar for field names. You should only use widely recognized acronyms such as Number (No), Account (Acct), Address (Addr), and Apartment (Apt). Currently, only West European languages are supported, so make sure that the chosen field names align with these languages. Refrain from using non-descriptive names, such as "Column 3", unless the document specifically uses that terminology.

UiPath® DocPath known limitations

The following limitations currently apply for UiPath DocPath:
  • The extracted fields must match exactly with the text in the documents. This process does not include summarization or other types of text analysis.
  • Custom training is not applicable for the following document types. If you attempt to use DocPath for these, it will result in an error:
    • 中国发票
    • 希伯来语发票
    • 日本发票

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。