UiPath Documentation
document-understanding
latest
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding classic user guide

上次更新日期 2026年4月23日

概述

There are several ways in which you can consume Document UnderstandingTM capabilities:

  • The DocumentUnderstanding.Activities package is available in Studio Web, Studio X, and Studio Desktop and is pre-configured for you either when you create a new automation starting from a file, or if you continue your journey after publishing a project version.
  • Using the IntelligentOCR package, which is designed for Windows and Windows Legacy projects, and pre-configured in the Document Understanding process template.
  • Using cloud API calls, consuming Document Understanding as a service via the programming language of your choice.

Document Understanding 活动

If you're an RPA developer, you can use DocumentUnderstanding.Activities in your cloud projects. Using Document Understanding allows you to handle all data about a document within a single input/output object, named Document Data. Also, Document Understanding activities don't require setting the taxonomy of Document Types, so you can easily leverage out-of-the-box-models.

您可以通过 Document Understanding、UiPath Marketplace 和 Studio Web 中提供的提取自动化生成器,使用以下某些活动轻松设置自动化:

请记住,Document Understanding 活动尚不支持以下功能:拆分、训练(模型微调)、生产/开发者租户支持、内部部署支持以及每种文档类型的多种提取方法。

If you start new automation projects that leverage modern projects (created using the Active Learning experience), you can use DocumentUnderstanding.Activities.

智能 OCR

作为想要试用 IntelligentOCR 包的 RPA 开发者,您可以根据需要使用不同的提取和分类模型。如果一个模型不能满足您的需求,您可以使用其他提取程序或分类器作为备用选项。您还可以在运行时使用 RPA 代码修改分类、文档对象模型 (DOM) 和提取结果。

但是,使用智能 OCR 需要更长的学习曲线,因为其灵活性涉及多种活动和数据类型,同时也涉及复杂性。

With IntelligentOCR, you can integrate your own classifier, extractor, or OCR engine. Visit Document Processing Code Samples to check implementation examples.

API 调用

您可以使用 API 调用替代机器人流程自动化 (RPA) 方法。API 调用可让您检索有关项目的详细信息,包括所使用的提取程序和分类器,方便使用数字化 API,使用专用模型和生成式模型对文档中的数据进行分类和提取,并验证先前数字化、分类和提取的信息。

要使用 API,您可以使用任何编程/脚本语言(因为调用是使用 HTTP 进行的),包括 RPA。

You can access the APIs via Swagger: In the toolbar of the Document Understanding service, search the REST API dropdown list, and select Framework.

提示:

For more information on how to get started with the Document Understanding APIs, check the Document Understanding API Guide.

  • Document Understanding 活动
  • 智能 OCR
  • API 调用

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新