ixp
latest
false
  • 简介
      • 功能类型
      • 选择正确的功能
  • Access control and administration
  • 许可
  • 常见问题
UiPath logo, featuring letters U and I in white

IXP 概述指南

上次更新日期 2025年8月19日

功能类型

何时使用每项功能

UiPath™ IXP 提供以下针对特定内容类型优化的提取体验:
  • 通信数据(通过 Communications Mining™ 访问)
  • 非结构化和复杂文档(通过 Generative Extraction for Unstructured Documents™ 访问)
  • 结构化和半结构化文档(通过 Document Understanding™ 访问)

要处理通信消息,请使用通信数据

要处理文档,请使用以下功能:

  • IXP 中的非结构化文档和复杂文档功能。使用此功能,可以处理最多 50 页的文档。目前,对 50 至 150 页文档的支持处于预览阶段。这是一项临时限制,未来版本中将会提高此限制。
  • Document Understanding 生成式提取活动,仅在 Studio Web 和 Studio Desktop 中提供。您可以使用这些活动来处理 50 页以上的文档。
  • Document Understanding™ 的经典或现代体验。

如果您的用例同时包含通信消息和文档,请使用所有适用功能。例如,通过通信数据选项卡中的 Communications Mining 功能处理电子邮件,并根据附件的文档类型处理附件。一些可能的方法包括:

  • 选项 1:通信数据以及结构化和半结构化文档
  • 选项 2:通信数据以及非结构化和复杂文档
  • 选项 3:通信数据结构化和半结构化文档以及非结构化和复杂文档
注意:如果您不确定哪种功能最适合您的特定用例,请在少量样本上测试每个文档提取功能。

有关此主题的更多详细信息,请参阅选择正确的功能

图 1. IXP 功能概述

通信数据

所有短小的非结构化通信消息(例如电子邮件、短信、工单、评论等)都应通过通信数据功能 Communications Mining™ 进行处理。

图 2. UiPath™ IXP 中的通信数据功能

通信数据提取将专业 AI 与生成式 AI 相结合,以增强用户体验并加快价值实现时间。

您可以在 Communications Mining 中的数据集层面禁用此功能中的所有生成式 AI 功能,如生成式标注生成式提取

图 3. 从“数据集”选项卡禁用生成式 AI 功能

非结构化和复杂文档

非结构化和复杂文档功能以及 Document Understanding 生成式提取活动最适用于非结构化和复杂文档。

图 4. UiPath™ IXP 中的非结构化和复杂文档功能

此类文档包含自由格式文本段落以及复杂元素,例如:

  • 复杂的表格
  • 图形
  • 图表
  • 复选框
  • 标注框
  • 签名
  • 手写文字等。

非结构化文档通常具有不同的格式或布局,可能需要不同的提取模式。可以将多种文档类型合并到单个文档堆栈中,例如,包含身份证明、地址证明、银行账单等文档的抵押贷款申请。如果此类组合文档未拆分成单独的文档类型,则可能需要进行生成式提取

此外,您可能需要提取文档中未明确呈现、需要推断的值。推断值的示例可能包括:

  • 未在文档中的任何位置呈现但上下文中隐含的值。
  • 需要跨文档的不同区域连接的值。
  • 跨多个段落、行或列的值。

IXP 和 Document Understanding 生成式提取活动都依赖于生成式 AI 功能。因此,如果不启用生成式 AI 功能,就无法使用这些产品。如果您的组织的策略限制您无法在生产环境中使用生成式 AI 功能,请在 Document Understanding™ 中使用经典或新式项目。

非结构化文档和复杂文档的 IXP 功能目前最多支持 50 页的文档。目前,对 50 至 150 页文档的支持处于预览阶段。同时,如果您需要处理超过 50 页的非结构化文档,您可以使用带内置 RAG 的 Document Understanding 生成式提取活动来处理长文档。

Document Understanding 生成式提取活动只能通过 Studio Web 或 Studio Desktop 访问。此功能中提供以下提取程序:

  • 长文档简单布局 - 针对主要包含文本和标题的长文档进行了优化。使用 GPT4-turbo AI Trust Layer LLM。仅支持文本处理,具有内置 RAG,每个文档的页数上限为 500 个。
  • 长文档复杂布局(预览版)- 针对包含表格、图像、手写文字、表单元素和浮动标注框等复杂元素的长文档进行了优化。使用 GPT-4o AI Trust Layer LLM。支持文本和图像处理,具有内置 RAG,每个文档的页数上限为 500 个。
  • 简短文档复杂布局(预览版) - 针对包含表格、图像、手写文字、表单元素或浮动标注框等复杂元素的简短结构化或半结构化文档进行了优化。使用 GPT-4o AI Trust Layer LLM。支持文本和图像处理,没有内置 RAG,每个文档的页数上限为 20 个。

图 5. Document Understanding 活动生成式提取程序类型

除其他优势以外,非结构化和复杂文档功能还提供以下功能:

  • 用于文档标注和验证的用户界面。
  • 所有提取数据的性能统计和置信度分数。
  • 快速迭代提取模式和提示指令的功能。
  • 保存和比较不同模型版本的功能。
  • 在不同 LLM 之间进行选择的功能。目前,IXP 仅支持 GPT-4o。但是,未来版本中将提供更多模型。

  • 可配置的模型设置,例如温度种子等。

结构化和半结构化文档

UiPath™ IXP 中的结构化和半结构化文档功能使用 Document Understanding™ 的经典和现代项目。这些项目最适用于结构化或半结构化文档,通常遵循相同或非常相似的布局,没有任何复杂元素。

图 6. IXP 结构化和半结构化文档功能

Document Understanding 经典和现代体验将开箱即用的专用模型和生成式 AI 功能相结合。您可以从 AI Trust Layer 管理此功能中的所有生成式 AI 功能,例如自动分类和生成式标注。

有关何时选择经典或现代项目的更多详细信息,请参阅选择项目类型

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo
信任与安全
© 2005-2025 UiPath。保留所有权利。