document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
上次更新日期 2024年12月18日

概述

您可以通过多种方式使用 Document UnderstandingTM 的功能:

  • DocumentUnderstanding.Activities 包在 Studio 网页版、Studio X 和 Studio 桌面版中可用,并且在您从文件开始创建新的自动化时,或者您在发布项目版本后继续使用自动化之旅时,系统已为您预先配置该包。
  • 使用 IntelligentOCR 包,该包专为 Windows 和 Windows 旧版项目设计,并在 Document Understanding 流程模板中进行了预配置。
  • 使用 Cloud API 调用,通过您选择的编程语言将 Document Understanding 作为服务使用。

Document Understanding 活动

如果您是 RPA 开发者,则可以在云项目中使用 DocumentUnderstanding.Activities。使用 Document Understanding,您可以在单个输入/输出对象(名为文档数据)中处理有关文档的所有数据。此外,Document Understanding 活动不需要设置文档类型的分类,因此您可以轻松利用开箱即用模型。

您可以通过 Document Understanding、UiPath Marketplace 和 Studio Web 中提供的提取自动化生成器,使用以下某些活动轻松设置自动化:

请记住,Document Understanding 活动尚不支持以下功能:拆分、训练(模型微调)、生产/开发者租户支持、内部部署支持以及每种文档类型的多种提取方法。

如果您启动使用新式项目的新自动化项目(使用主动学习体验创建),则可以使用 DocumentUnderstanding.Activities

智能 OCR

作为想要试用 IntelligentOCR 包的 RPA 开发者,您可以根据需要使用不同的提取和分类模型。如果一个模型不能满足您的需求,您可以使用其他提取程序或分类器作为备用选项。您还可以在运行时使用 RPA 代码修改分类、文档对象模型 (DOM) 和提取结果。

但是,使用智能 OCR 需要更长的学习曲线,因为其灵活性涉及多种活动和数据类型,同时也涉及复杂性。

借助智能 OCR,您可以集成自己的分类器、提取程序或 OCR 引擎。请访问文档处理代码示例,查看实施示例。

API 调用

您可以使用 API 调用替代机器人流程自动化 (RPA) 方法。API 调用可让您检索有关项目的详细信息,包括所使用的提取程序和分类器,方便使用数字化 API,使用专用模型和生成式模型对文档中的数据进行分类和提取,并验证先前数字化、分类和提取的信息。

要使用 API,您可以使用任何编程/脚本语言(因为调用是使用 HTTP 进行的),包括 RPA。

您可以通过 Swagger 访问 API:在 Document Understanding 服务的工具栏中,搜索“REST API”下拉列表,然后选择“框架”

提示:有关如何开始使用 Document Understanding API 的更多信息,请查看 Document Understanding API 指南
  • Document Understanding 活动
  • 智能 OCR
  • API 调用

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。