UiPath Documentation
document-understanding
latest
false

Document Understanding 传统用户指南

上次更新日期 2026年4月30日

简介

Document Understanding TM是创建新项目的主要起点。您可以将其用于结构化或半结构化文档,也可以与预训练模型一起使用。您始终可以从头开始训练,验证文档并根据需要自定义项目。

Overview page

在这里,您可以找到所有已创建项目的列表,以及特定的详细信息。您可以按字母顺序或日期对项目进行排序,创建新项目并自定义页面视图。

项目

显示所有已创建项目的列表。项目的排序分为三种类型:

  • 按字母顺序升序排列
  • 按字母顺序降序排列
  • 按创建日期 (默认排序顺序是按创建日期)

创建项目后,您可以选择文档类型。有两个选项:

  • Using Forms AI (fixed layout format) - intended for Forms AI
  • Using Semi-Structured AI - intended for Document Manager

如果要删除文档类型,请打开项目,选择要删除的文档类型,打开“操作”菜单,然后单击“删除”选项。

Use this function to customize the amount of details available for the Projects list. Here's the full list of details that can be displayed for each created project.

  • 名称 - 显示项目的名称。
  • Document types - Displays the type of documents used for each project.
  • Extractors - Displays the number of extractors used for each project.
  • 已处理的文档 - 显示每个项目的已处理文档数。
  • 创建日期 - 显示每个项目的创建日期。
  • 刷新 - 刷新所显示列中所有项目的信息。
    提示:

    提示:您可以从列 ˅下拉菜单中选择要显示的列。如果单击“重置” ,则无论之前的选择如何,系统都将显示所有字段。

New project

Create a new project by using the New project button. Clicking on the New project opens a new popup window.

创建新项目时,需要提供以下信息:

选项

描述

字段状态

名称

为新项目命名。

必需

描述

提供有关项目的更多详细信息。

可选

OCR 方法

为新项目选择 OCR 方法。

在以下选项之间选择:

  • UiPath™ 文档 OCR
  • UiPath™ 中文、日语、韩语 OCR
  • Google Cloud Vision OCR
  • 日语版 Google Cloud Vision
  • Microsoft Read OCR

必需

OCR URL

提供与所选 OCR 方法对应的 OCR URL。

以下是与 UiPath OCR 方法对应的 OCR URL 列表。

以下是其他常用 OCR URL 的列表:

Google: https://vision.googleapis.com/v1/images:annotate Microsoft Read 3.2 Azure: <Azure_resource_Endpoint>/vision/v3.2/read/analyze Microsoft Read 3.2 On-Prem: http://<IP_addr>:<port_number>/vision/v3.2/read/analyze Microsoft Read 2.0 Azure: <Azure_resource_Endpoint>/vision/v2.0/read/core/asyncBatchAnalyze Microsoft Read 2.0 On-Prem: http://<IP_addr>:<port_number>/vision/v2.0/read/core/Analyze

必需

OCR API 密钥

为所选 OCR 方法提供 OCR API 密钥。

如果 OCR 方法为 UiPath OCR 或 UiPath 中文、日语、韩语 OCR,则可在 Cloud Platform 上获取此字段的值,方法是转到“主页”>“管理”>“许可证”>“消耗品”>“AI Unit”

可选

将 OCR 应用于 PDF

确定是否应将 OCR 流程应用于 PDF 文档。如果设置为“是” ,则 OCR 将应用于文档的所有 PDF 页面。

如果设置为“否” ,则 OCR 不会应用于任何页面,并且仅返回 PDF 中嵌入的文本。设置为“自动”时,OCR 仅适用于文档的扫描页面。默认值为自动

必需

AI Center 项目

提供要导入的 AI Center 项目的名称。

可选

从 AI Center 导入

启用/禁用从 AI Center 导入功能

可选

备注:

您也可以在云平台上使用 UiPath OCR API 密钥,方法是转到“管理员”/“许可证”/“机器人和服务”/“Document Understanding”,然后复制可用的密钥。

链接到 AI Center 的项目可通过 AI Center 图标轻松识别。

如果要删除链接到 AI Center 的项目,则删除时也会自动将该项目从 AI Center 中删除。

Project page

您可以在此处找到有关已创建项目的更多详细信息,编辑项目名称或创建新的文档类型。

第一行信息显示以下详细信息:

  • Project name - The name of the project.
  • Date - Details about the project time creation.
  • 设置- 从“概述”页面打开弹出菜单。有关该活动的更多详细信息,请参阅此处

文档类型和提取程序

在一般详细信息下方,您可以找到两个选项卡:

Document type - Provides a list of all the available document types for the selected project. Defining a document type is mandatory for creating an extractor or classifier. A document type can be an invoice, a purchase order, or a standardized form.

文档类型菜单描述
名称显示所有已创建文档类型的名称列表。
提取方法显示所选文档类型所使用的提取方法类型。
页面显示在每种文档类型中找到的总页数。
刷新刷新项目列表。

Extractors - Provides the list of extractors created for the document types of the selected project. Use extractors to train the document types.

“提取程序类型”菜单描述
名称显示已创建文档类型中所有提取程序的名称列表。
类型显示使用的提取程序的类型。
创建日期显示每个提取程序的创建日期。
已处理的页数显示每个提取程序已处理的页面数。
状态显示每个提取程序的状态。
刷新刷新提取程序列表。
提取程序的菜单可以用于复制提取程序的 URL 链接。

Both Document types and Extractors have three types of sorting the information:

  • 按字母顺序升序排列。
  • 按字母顺序降序排列。
  • 按创建日期 (默认排序顺序是按创建日期)
    备注:

    Document types are mandatory in a project, while extractors are optional. You can choose to add an extractor for any of the document types.

其他选项

以下选项适用于 Document Understanding 的整个界面。

Search option enables you to initiate a search among the available list of projects, document types, or extractors. Search is active separately for each selected tab, meaning that if you want to search for an extractor, you should select the Extractors tab. Same applies for Document types. Start a search by typing the name of the project inside the Search bar.

Refresh - Refreshes the list of projects.

Remove project - Deletes the selected project. The Remove project button becomes visible only after opening the action menu.

备注:

When deleting a project, all containing document types and extractors are deleted along with the project.

Page scrolling - Easy scroll through the list of project pages, document types, or extractors. Go page by page or skip directly to the first/last page.

Items per page - Select the number of projects, document types, or extractors displayed per project page.

REST API - Opens the REST API framework capabilities.

许可

在本指南的“许可”类别中,您可以查看以下信息:

RPA 集成

如果要将 Document Understanding 项目集成到 RPA 工作流中,请确保按照以下步骤操作:

  • 打开 UiPath Studio 并通过从模板列表中选择 Document Understanding 流程创建一个新项目。

还应将以下包添加到 UiPath Studio 项目中:

  • UiPath.Intelligent OCR.Activities
  • UiPath.OCR.Activities
  • UiPath.DocumentUnderstanding.OCR.LocalServer
  • UiPath.DocumentUnderstanding.ML.Activities
  • UiPath.OmniPage.Activities

确保在租户上启用 Document Understanding。

启用 Document Understanding 后,左侧导航栏中将显示 Document Understanding 选项卡。

  • Overview page
  • 项目
  • New project
  • Project page
  • 文档类型和提取程序
  • 其他选项
  • 许可
  • RPA 集成

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新