document-understanding

2024.10

false

重要 :

新发布内容的本地化可能需要 1-2 周的时间才能完成。

Document Understanding 用户指南

适用平台：

上次更新日期 2025年12月19日

概述

您可以通过多种方式使用 Document Understanding^TM 的功能：

DocumentUnderstanding.Activities 包在 Studio 网页版、Studio X 和 Studio 桌面版中可用，并且在您从文件开始创建新的自动化时，或者您在发布项目版本后继续使用自动化之旅时，系统已为您预先配置该包。
使用 IntelligentOCR 包，该包专为 Windows 和 Windows 旧版项目设计，并在 Document Understanding 流程模板中进行了预配置。
使用 Cloud API 调用，通过您选择的编程语言将 Document Understanding 作为服务使用。

Document Understanding 活动

如果您是 RPA 开发者，则可以在云项目中使用 DocumentUnderstanding.Activities。使用 Document Understanding，您可以在单个输入/输出对象（名为文档数据）中处理有关文档的所有数据。此外，Document Understanding 活动不需要设置文档类型的分类，因此您可以轻松利用开箱即用模型。

您可以通过 Document Understanding、UiPath Marketplace 和 Studio Web 中提供的提取自动化生成器，使用以下某些活动轻松设置自动化：

请记住，Document Understanding 活动尚不支持以下功能：拆分、训练（模型微调）、生产/开发者租户支持、内部部署支持以及每种文档类型的多种提取方法。

如果您启动使用新式项目的新自动化项目（使用主动学习体验创建），则可以使用 DocumentUnderstanding.Activities。

智能 OCR

作为想要试用 IntelligentOCR 包的 RPA 开发者，您可以根据需要使用不同的提取和分类模型。如果一个模型不能满足您的需求，您可以使用其他提取程序或分类器作为备用选项。您还可以在运行时使用 RPA 代码修改分类、文档对象模型 (DOM) 和提取结果。

但是，使用智能 OCR 需要更长的学习曲线，因为其灵活性涉及多种活动和数据类型，同时也涉及复杂性。

借助智能 OCR，您可以集成自己的分类器、提取程序或 OCR 引擎。请访问文档处理代码示例，查看实施示例。

API 调用

您可以使用 API 调用替代机器人流程自动化 (RPA) 方法。API 调用可让您检索有关项目的详细信息，包括所使用的提取程序和分类器，方便使用数字化 API，使用专用模型和生成式模型对文档中的数据进行分类和提取，并验证先前数字化、分类和提取的信息。

要使用 API，您可以使用任何编程/脚本语言（因为调用是使用 HTTP 进行的），包括 RPA。

您可以通过 Swagger 访问 API：在 Document Understanding 服务的工具栏中，搜索“REST API”下拉列表，然后选择“框架”。

提示：有关如何开始使用 Document Understanding API 的更多信息，请查看 Document Understanding API 指南。

在此页面上

Document Understanding 活动
智能 OCR
API 调用

此页面有帮助吗？

前一个从表单中提取数据

下一个Document Understanding 活动

支持与服务

获取您需要的帮助

了解 RPA - 自动化课程

UiPath Community 论坛

信任与安全

© 2005-2025 UiPath。保留所有权利。