activities
latest
false
重要 :
请注意此内容已使用机器翻译进行了部分本地化。 Integration Service 中提供的连接器包采用的是机器翻译的译文。
Integration Service 活动
Last updated 2024年9月9日

PREVIEW
索引和提取(公开预览)

描述

对数据源中的数据进行索引和提取以创建嵌入,从而支持 UiPath GenAI Activities 中的检索增强生成 (RAG)。

项目兼容性

Windows | 跨平台

配置

  • 连接 ID - 在 Integration Service 中建立的连接。 访问下拉菜单以选择、添加或管理连接。

  • Orchestrator 文件夹- 此为 Orchestrator 文件夹,其中包含要使用上下文基础查询的数据。 此文件夹必须为共享文件夹。 按名称搜索或从该租户中可用/权限 Orchestrator 文件夹的下拉列表中选择。 此字段支持String类型输入。
  • Orchestrator 存储桶- 共享文件夹中的 Orchestrator 存储桶。 按名称搜索,或从该文件夹的存储桶的下拉列表中选择。 选择 Orchestrator 文件夹后,系统将显示此字段。 此字段支持String型输入。
  • “索引名称” - 如果先前已创建索引,请从下拉列表的可用选项中选择一个。 如果尚未创建,请创建一个新的索引。 此字段支持String型输入。
  • 数据类型”- 定义提取的 Orchestrator 存储桶中的特定数据类型:PDF、JSON 或 CSV。 一次只能提取一种文件类型。 如果您有多种类型,请为每种文件类型运行每个活动。
  • 文件全局模式”- 如果您要提取的同一个 Orchestrator 存储桶中有多种数据类型,请定义此模式以匹配“数据类型”字段中的文件。 选择:
    • *. - 如果要提取与上一个请求相同的文件类型。
    • *.pdf - 适用于 PDF。
    • *.csv - 对于 CSV。
    • *.json - 表示 JSON。
其他属性
输出
  • “索引 ID ” - 索引中使用的架构的唯一标识符。 自动生成的输出变量。
  • 数据源 ID - 数据源的唯一标识符。 自动生成的输出变量。
  • 索引和提取- 自动生成的输出变量。

如何使用索引和提取

索引和提取”活动使您的数据集在运行时可用,以便 LLM 查询和检索增强的生成 (RAG)。 请注意,Orchestrator 存储桶和索引是单独的实体。 上下文基础使用 Orchestrator 存储桶,您可以在其中上传和存储文件以创建索引。 然后,在搜索语义相似的上下文以插入到 LLM 提示中时,可以引用这些索引。

  • 索引:在 UiPath 管理的向量数据库中,创建一个井井有条的位置(例如文件夹),用于在运行时存储和引用嵌入。
  • 提取”:将存储在 Orchestrator 存储桶中的业务数据转换为代表性嵌入;向量进行搜索,结果以 LLM 易于理解的方式显示。

要使用“索引”和“提取”,您必须通过直接上传、API 或活动将数据上传到共享的 UiPath Orchestrator 存储桶中。 该活动使用此数据来执行以下操作:

  • 创建新索引(例如 使用入门指南,添加要在不同文件夹中组织的新数据)。
  • 重新提取数据并重新索引 (例如 确保获得最相关的结果;删除数据集和添加新数据集)。
表 1. 术语
条款定义
Orchestrator 文件夹要在 UiPath Platform 中使用的数据的常规存储。
Orchestrator 存储桶数据在要为其创建索引的文件夹中的特定位置。 存储桶和索引之间通常是一对一关系。
索引名称要创建或更新的索引的唯一名称。

创建后,该活动将显示在“ 索引和提取 ”活动的“ 索引名称 ” 字段下拉列表下,以及“ 内容生成” 活动的“ 索引 字段”下拉列表中。

我们建议异步使用此活动,以免花费额外时间。 这样,可以有效地管理创建/记录/更新/删除操作,并且潜在错误不会涉及下游活动。 您可以使用单独的流程或同一流程中的“延迟”活动来完成此操作。 为获得最佳结果,请使用两个单独的流程。

有关更多信息,请参阅管理提取管道

  • 描述
  • 项目兼容性
  • 配置
  • 如何使用索引和提取

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。