Document Understanding
最新
False
横幅背景图像
预览
适用于新式体验的 Document Understanding 用户指南
上次更新日期 2024年4月26日

简介

Document Understanding 是创建新项目的主要起点。您可以将其用于结构化或半结构化文档,也可以与预训练模型一起使用。您始终可以从头开始训练,验证文档并根据需要自定义项目。

概览页面

在这里,您可以找到所有已创建项目的列表,以及特定的详细信息。您可以按字母顺序或日期对项目进行排序,创建新项目并自定义页面视图。

项目

显示所有已创建项目的列表。项目的排序分为三种类型:

  • 按字母顺序升序排列
  • 按字母顺序降序排列
  • 按创建日期

    (默认排序顺序是按创建日期)

创建项目后,您可以选择文档类型。有两个选项:

  • 使用 Forms AI(固定布局格式) - 适用于 Forms AI
  • 使用半结构化 AI - 适用于 Document Manager


如果要删除文档类型,请打开项目,选择要删除的文档类型,打开“操作”菜单,然后单击“删除”选项。

使用此功能可自定义“项目”列表的可用详细信息数量。以下是可以为每个已创建项目显示的详细信息的完整列表。

  • 名称 - 显示项目的名称。
  • 文档类型 - 显示用于每个项目的文档类型。
  • 提取程序 - 显示用于每个项目的提取程序数量。
  • 已处理的文档 - 显示每个项目的已处理文档数。
  • 创建日期 - 显示每个项目的创建日期。
  • 刷新 - 刷新所显示列中所有项目的信息。
提示:您可以从列 ˅ 下拉菜单中选择要显示的列。如果单击“重置”,则无论之前的选择如何,系统都将显示所有字段。

新建项目

使用“创建项目”按钮新建项目。单击“创建项目”,系统将弹出一个新窗口。要使用新式体验,请选择“新式”。此体验当前为公开预览版。



创建新项目时,需要提供以下信息:

选项

描述

字段状态

名称

为新项目命名。必需
构建体验在“传统”或“新式”体验之间进行选择。新式体验目前为公开预览版。 必需
为中文、日语或韩语启用 OCR 选中此框会将 UiPath 中文、日语、韩语 OCR 配置为此项目中使用的 OCR 引擎。您稍后可以在“项目设置”中更改此设置。 可选

创建项目后,您可以更改项目设置并配置高级选项。为此,请选择您的项目并转到项目设置

表 1.
选项描述字段状态

描述

提供有关项目的更多详细信息。可选

OCR 方法

为新项目选择 OCR 方法。

在以下选项之间选择:

  • UiPath 文档 OCR
  • UiPath 中文、日语、韩语 OCR
  • Google Cloud Vision OCR
  • 日语版 Google Cloud Vision
  • Microsoft Read OCR

必需

OCR API 密钥

为所选 OCR 方法提供 OCR API 密钥。

如果 OCR 方法为 UiPath OCR 或 UiPath 中文、日语、韩语 OCR,则可在 Cloud Platform 上获取此字段的值,方法是转到“管理”>“许可证”>“消耗品”>“AI Unit

可选

OCR URL

提供与所选 OCR 方法对应的 OCR URL。

以下是与 UiPath OCR 方法对应的 OCR URL 列表。

以下是其他常用 OCR URL 的列表:

Microsoft Read 3.2 Azure: <Azure_resource_Endpoint>/vision/v3.2/read/analyze
Microsoft Read 3.2 内部部署: http://<IP_addr>:<port_number>/vision/v3.2/read/analyze
Microsoft Read 2.0 Azure: <Azure_resource_Endpoint>/vision/v2.0/read/core/asyncBatchAnalyze
Microsoft Read 2.0 内部部署: http://<IP_addr>:<port_number>/vision/v2.0/read/core/Analyze

必需

将 OCR 应用于 PDF

确定是否应将 OCR 流程应用于 PDF 文档。如果设置为“是”,则 OCR 将应用于文档的所有 PDF 页面。

如果设置为“否”,则 OCR 不会应用于任何页面,并且仅返回 PDF 中嵌入的文本。设置为“自动”时,OCR 仅适用于文档的扫描页面。默认值为“自动”。

必需

注意:您也可以在 Cloud Platform 上使用 UiPath OCR API 密钥,方法是转到“管理员”>“许可证”>“消耗品”>“AI Unit”,然后复制可用密钥。

链接到 AI Center 的项目可通过项目名称旁的 AI Center 图标轻松识别。

如果要删除链接到 AI Center 的项目,则删除时也会自动将该项目从 AI Center 中删除。

项目页面

任何项目页面都包含四个部分:
  • 构建:上传文档,训练文档分类和提取模型,并接收建议的后续步骤,以提高模型性能。
  • 衡量:审核项目的整体状态,并验证分类模型和提取模型的性能。
  • 发布:发布包含模型的项目版本,使用活动或 API 使用模型。
  • 监控:审核自动化的性能指标,并查看已处理文档的审核追踪。

其他选项

以下选项适用于 Document Understanding 的整个界面。

“搜索”选项使您能够在可用的项目、文档类型或提取程序列表中启动搜索。对于每个选定的选项卡,“搜索”都会单独处于活动状态,这意味着如果要搜索提取程序,则应选择“提取程序”选项卡。这同样适用于文档类型。通过在“搜索”栏中键入项目名称来开始搜索。

刷新 - 刷新项目列表。

删除项目 - 删除选定的项目。只有在打开操作菜单后,“删除项目”按钮才会可见。

注意:删除项目时,所有包含的文档类型和提取程序将与项目一起删除。

页面滚动 - 轻松滚动项目页面、文档类型或提取程序列表。逐页浏览或直接跳至第一页/最后一页。

每页项目数 - 选择每个项目页面显示的项目、文档类型或提取程序的数量。

REST API - 打开 REST API 框架功能。

许可

在本指南的“许可”类别中,您可以查看以下信息:

RPA 集成

如果要将 Document Understanding 项目集成到 RPA 工作流中,请确保按照以下步骤操作:

  • 打开 UiPath Studio 并通过从模板列表中选择 Document Understanding 流程创建一个新项目。

还应将以下包添加到 UiPath Studio 项目中:

  • UiPath.Intelligent OCR.Activities
  • UiPath.OCR.Activities
  • UiPath.DocumentUnderstanding.OCR.LocalServer
  • UiPath.DocumentUnderstanding.ML.Activities
  • UiPath.OmniPage.Activities

确保在租户上启用 Document Understanding。为此,请按照以下步骤操作:

  1. 转到 Automation Cloud™ 管理页面。
  2. 选择要在其中启用 Document Understanding 服务的租户。
  3. 选择“服务”。
  4. “Document Understanding”卡上,单击三点图标 ,然后选择“启用”。


启用 Document Understanding 后,左侧导航栏中将显示 Document Understanding 选项卡。

  • 概览页面
  • 项目
  • 新建项目
  • 项目页面
  • 其他选项
  • 许可
  • RPA 集成

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.