UiPath Documentation
test-cloud
latest
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Test Cloud 管理员指南

上次更新日期 2026年4月7日

使用上下文基础

本节包含有关如何有效使用上下文基础的信息。

入门指南

要将上下文锚定与 Agents 或 Autopilot for Everyone 使用,请按照创建索引中描述的步骤创建索引。

要将“上下文基础” 用于活动,请创建与 UiPath GenAI Activities 连接器的连接,并确保使用 Studio Web 或 Studio Desktop 2024.4 或更高版本。

管理提取管道

您可以通过以下方式管理提取管道:

  • “索引”页面中的 Orchestrator 或智能体。请参阅管理索引
  • 更新上下文基础索引活动是 UiPath GenAI 活动包的一部分。

使用上下文基础查询数据

在 Orchestrator 中创建索引后,就可以在整个 UiPath 平台上访问索引。这些索引可持久存储从数据源提取的文档,为各种 UiPath 产品提供可重用资源:

  • 在 Autopilot for Everyone 中,上下文锚定通过启用跨现有索引的搜索来增强用户交互,以提供准确的查询答案。有关详细信息,请参阅Autopilot for Everyone 中的上下文锚定
  • GenAI Activities 允许根据存储在许可的知识库中的信息生成内容,从而从上下文锚定中受益。有关详细信息,请参阅GenAI 活动
  • 对于智能体而言,索引在运行期间提供上下文方面发挥着至关重要的作用。有关详细信息,请参阅上下文

监控上下文基础

了解上下文基础如何影响工作流对于优化性能和故障排除至关重要。以下是如何跨不同 UiPath 产品追踪和查看“上下文基础”输出的方法。

智能体中,访问智能体运行的“追踪”视图,以查看全面的详细信息。此视图提供来自上下文基础查询的所有搜索结果和引文,帮助您深入了解智能体的决策过程。

要收集有关 GenAI 活动中上下文基础的详细信息,请执行以下操作:

  1. 在工作流序列中, “日志消息”活动紧跟在“内容生成” 活动之后。
  2. 使用以下输出变量捕获特定信息:
    • 优先生成的文本:执行工作流后查看 LLM 生成响应。
    • 引文:检查影响生成输出的语义搜索结果。这仅适用于 PDF 和 JSON 数据类型。

GenAI Activities 中的上下文基础

上下文基础分三个阶段与数据进行交互:

  1. 为上下文基础建立数据源。
    • 上下文基础遵循共享文件夹权限。 使用具有适当访问权限的文件夹来管理数据和查询数据。
    • 创建与受支持的 Integration Service 数据源的连接,或将数据添加到共享的 Orchestrator 存储桶位置。
  2. 将数据源中的数据提取到上下文基础中。
  3. 使用您的数据进行查询和地面提示。
    • 使用 “内容生成”活动、智能体或 Autopilot for Everyone 来查询文档,并使用信息来增强或依据提示词。

常见的上下文基础模式

上下文基础的核心组件旨在提供一种机制,该机制支持在文档内和文档间查找相关信息,并仅呈现从 LLM 进行高质量、低延迟生成所需的最相关的片段。

在文档中搜索

上下文基础服务可帮助您更有效地在单个文档中查找特定信息。 它不仅会匹配关键字,还会理解搜索查询的含义和上下文。 例如,如果您在菜单中查找有关“ 苹果派菜单 ”的信息,系统会理解为您对点心和面包感兴趣,而不是技术或果树生产感兴趣。

跨文档搜索

上下文基础可帮助您查找分布在多个文档中的信息。 它可以理解不同信息之间的关系,并提供更相关的结果。 例如,如果您在各种科学论文中研究“天气变化对农业的影响”,它会从多个来源汇总相关信息,并了解降水模式、作 物单产和温度变化等主题都与您的查询相关。

这意味着您可以将上下文基础用于:

  • 数据提取和比较:上下文基础可以自动从文档中识别和提取特定类型的信息,然后以有意义的方式进行比较。假设您有很多简历,想要比较求职者的工作经验。该服务可以提取职位名称、持续时间和职责,然后以易于比较的方式呈现这些信息,即使每份简历中这些信息的格式不同。
  • 摘要:上下文基础可以创建长文档或多个相关文档的摘要。它不会随机选取句子,而是会理解关键点和整体消息。例如,如果您有一份关于市场趋势的长报告,该服务可以提供摘要,突出显示主要发现、关键统计信息和总体结论。

通知

您可以订阅以接收来自上下文基础的通知。请访问通知面板,了解详情。

事件充当通知的触发器。 生成通知的上下文基础事件包括:

  • 提取作业已完成
  • 提取作业失败
  • 提取作业已开始

您还可以根据事件的严重性订阅事件,例如SuccessError

引入您自己的向量数据库

使用您现有的向量数据库,将智能体响应存储在受信任的企业数据中,无需复制内容或更改当前架构。

本指南演示如何使用 API 工作流将外部管理的向量数据库(例如 Databricks向量搜索或 Azure AI 搜索)连接到 UiPath 智能体,从而使用自己的数据源启用检索增强生成 (RAG)。

学完本指南后,您将能够:

  • 从 UiPath 智能体查询外部向量数据库。
  • 以结构化上下文的形式返回最相关的内容。
  • 智能体可以在您组织的数据中安全地实时做出响应。

何时使用“自带向量数据库 (BYOVD)”模式

在下列情况下,请使用 BYOVD:

  • 您的数据已在外部向量存储中编入索引。
  • 您希望智能体能够访问最新的企业知识。
  • 您需要避免将数据复制或重新索引到 UiPath。
  • 您需要对数据存储、安全性和嵌入进行完全控制。

工作方式

BYOVD 使智能体可以在您的可信数据源中基于生成式 AI 响应。您不依赖内置的上下文基础索引,而是使用API 工作流,这些工作流可以安全地查询外部向量数据库并将相关上下文返回给智能体的大型语言模型。

此方法使您可以灵活地将任何向量数据库与公共 API 集成,同时保持对数据访问、身份验证和检索逻辑的控制。

UiPath 通过充当智能体工具的 API 工作流来支持 BYOVD。在运行时:

  1. 用户查询:用户向智能体提交提示。
  2. 工具选择:智能体的 LLM 会确定需要其他上下文,并选择自定义向量搜索工具。
  3. 执行 API 工作流(仅适用于 StudioX 策略):智能体调用已发布的 API 工作流,将用户查询作为输入传递。
  4. 向量搜索:工作流会查询向量数据库,以检索语义最相关的内容。
  5. 上下文返回:工作流以结构化 JSON 形式返回检索到的内容。
  6. 制定响应:智能体使用此上下文来生成基础、准确的响应。

此方法支持检索增强生成 (RAG),而无需原生提取到上下文基础服务中。

架构概述

BYOVD 解决方案由三个主要组件组成:

  • 向量数据库:您的现有系统(例如 Databricks向量搜索或 Azure AI 搜索)。
  • API 工作流: UiPath Integration Service 工作流:
    • 接受查询。
    • 调用向量数据库 API。
    • 返回相关结果。
  • 智能体工具:发布的 API 工作流,添加为智能体可以调用的工具。

安全性和凭据管理

在构建工作流之前,请安全存储所有 API 密钥和密码。不要在工作流中硬编码凭据。请改为使用 Orchestrator 凭据存储:

  • 在 Orchestrator 中存储凭据(在Orchestrator 中存储): 在 Orchestrator 租户中添加 API 密钥和其他密码作为凭据资产。这可以实现对敏感信息的集中、安全管理。
  • 在运行时检索凭据:在 API 工作流中,使用获取凭据活动以在工作流运行时访问存储的凭据。该活动以字符串形式返回用户名,并以SecureString形式返回密码(例如 API 密钥),以防止密码在日志或工作流定义中公开。

先决条件

开始之前,请确保您:

  • 包含索引数据的活动向量数据库(例如 Databricks向量搜索或 Azure AI 搜索)。
  • 有效的 API 端点和身份验证凭据,作为凭据资产存储在 Orchestrator 中。
  • 嵌入模型端点和密钥,也安全存储(仅适用于 Azure 客户端向量化)。

设置

您可以使用三种方法之一实施 BYOVD:模型原生端点、客户端向量化(其中 API 工作流执行向量化)或集成向量化。

以下部分提供了配置每种方法的分步说明。这些示例使用 Databricks 和 Azure AI 搜索,但相同的模式也适用于其他向量数据库。选择符合您的向量数据库处理查询向量化方式的设置。

Databricks向量搜索(模型原生端点)

当 Databricks 在原生处理查询向量化时,请使用此选项。

为什么使用此选项:

  • 简单配置
  • 每个查询仅支持一次 API 调用
  • 无需单独的嵌入模型

步骤

  1. 获取 Databricks 详细信息:
    1. 检索端点 URL。
    2. 将您的 Databricks 个人访问令牌存储为 Orchestrator 中的凭据资产。
  2. 在 Studio 中,创建一个新的 API 工作流项目并定义以下参数:
    • in_QueryText (String)
    • in_TopKInt32 ,默认值为5
    • out_Results (String)
  3. 使用“获取凭据”活动在运行时从 Orchestrator 检索 Databricks 个人访问令牌。
  4. 添加HTTP 请求活动以调用 Databricks 端点:
    • 端点:Databricks 向量搜索端点
    • 方法: POST
    • 标头Authorization: Bearer <Personal Access Token>
    • 正文:构建 Databricks API 所需的 JSON 正文,以映射输入变量。
  5. 将工作流发布到 Orchestrator 租户。
  6. 将工作流作为工具添加到您的智能体中,并提供明确的名称和描述,供 LLM 使用。

Azure AI 搜索(客户端向量化)

当 Azure AI 搜索索引需要向量输入时,请使用此选项。

为什么使用此选项:

  • 对嵌入模型的完全控制
  • 与现有向量索引的兼容性

步骤

  1. 获取 API 详细信息:
    • 对于 Azure AI 搜索:检索端点 URL、索引名称,并将 API 密钥作为凭据资产存储在 Orchestrator 中。
    • 对于嵌入模型:检索端点 URL,并将嵌入服务的 API 密钥作为凭据资产存储在 Orchestrator 中。
  2. 在 Studio 中,创建一个新的 API 工作流项目并定义以下参数:
    • in_QueryText (String)
    • in_TopKInt32 ,默认值为5
    • out_Results (String)
  3. 首先,对查询进行向量化:
    1. 添加“获取凭据”活动,以检索嵌入模型的 API 密钥。
    2. 添加“HTTP 请求”活动,以使用in_QueryText调用嵌入模型。
    3. 反序列化 JSON 响应,并将生成的嵌入向量存储在变量(例如queryVector )中。
  4. 查询 Azure AI 搜索:
    1. 添加“获取凭据”活动,以检索 Azure AI 搜索 API 密钥。
    2. 添加“HTTP 请求”活动并进行如下配置:
      • 端点 (仅适用于 Azure AI 端点):您的 Azure AI 搜索端点。
      • 方法: POST
      • 标头:使用您的 Azure AI 搜索 API 密钥变量添加api-key标头,如下所示: api-key: <API key>
      • 正文:为 Azure AI 搜索向量搜索查询构建 JSON 正文,并嵌入queryVector变量。
  5. 将工作流发布到 Orchestrator 租户。
  6. 将已发布的工作流作为工具添加到您的智能体中,并提供清晰的描述,供 LLM 使用。

Azure AI 搜索(集成的向量化)

当 Azure AI 搜索索引支持内置向量化时,请使用此选项。

为什么使用此选项:

  • 最简单的 Azure 设置
  • 不可在工作流中嵌入调用
  • 每个查询单个 API 请求

步骤

  1. 获取 API 详细信息:
    • 检索 Azure AI 搜索端点 URL、索引名称,并将 API 密钥作为凭据资产存储在 Orchestrator 中。
  2. 在 Studio 中,创建一个新的 API 工作流项目并定义以下参数:
    • in_QueryText (String)
    • in_TopKInt32 ,默认值为5
    • out_Results (String)
  3. 添加“获取凭据”活动,以便从 Orchestrator 检索 Azure AI 搜索 API 密钥。
  4. 添加“HTTP 请求”活动并进行如下配置:
    • 端点:
      https://<service>.search.windows.net/indexes/<index-name>/docs/search?api-version=2023-11-01
      https://<service>.search.windows.net/indexes/<index-name>/docs/search?api-version=2023-11-01
      
    • 方法: POST
    • “标头”(在 Azure 中设置):使用您的 Azure AI 搜索 API 密钥变量添加api-key标头,如下所示: api-key: <API key>
    • 正文:构建 JSON 正文,以使用查询文本执行向量搜索。Azure AI 搜索会自动处理向量化。
      {
        "vectorQueries": [
          {
            "kind": "text",
            "text": "<%= in_QueryText %>",
            "fields": "contentVector",
            "k": "<%= in_TopK %>"
          }
        ],
        "select": "chunk, source_document"
      }
      {
        "vectorQueries": [
          {
            "kind": "text",
            "text": "<%= in_QueryText %>",
            "fields": "contentVector",
            "k": "<%= in_TopK %>"
          }
        ],
        "select": "chunk, source_document"
      }
      
  5. 将工作流发布到 Orchestrator 租户。
  6. 将已发布的工作流作为工具添加到您的智能体中,并为 LLM 提供清晰的描述。

常见问题

什么是上下文基础?

上下文基础是 UiPath™ 的一项新功能,是 AI Trust Layer 的一部分。它提供了一种从数据中搜索和检索相关上下文以给出提示词的机制,并通过 UiPath GenAI 功能和产品指导从大型语言模型 (LLM) 更精确地生成内容。

为什么上下文基础很重要?

上下文基础通过用户提供的数据向 LLM 提供影响其生成的证据。 这会使预测更加适合您的用例和数据,而不是基于训练 LLM 的通用数据。 这可以使利用 GenAI 的有人值守自动化和无人值守自动化更加准确和精确。

上下文基础如何工作?

上下文基础提供两项服务:

  • 托管的向量数据库即服务:我们可以让您轻松将数据转换为嵌入表示。
  • 检索增强生成 (RAG) 即服务:上下文基础查询来自各种自动化产品的数据,检索最相关的结果,并使用这些结果增强提示,以确保生成更具体。

如何使用上下文基础?

您可以通过UiPath GenAI ActivitiesAutopilot for EveryoneAgents使用上下文锚定。

“上下文基础”是否可以消除假想?

否,但确实会显着降低出现错觉的可能性,因为生成是基于从用户提供的数据中查询到的信息进行的。 默认情况下,“上下文基础”会提供生成所基于的引文或知识证明。 这意味着您可以验证和确认来源。 当上下文基础无法在提供的数据中找到高度可信的相应答案时,它不会尝试组成答案。 相反,它会生成如下响应:“无法找到答案”。

我可以使用上下文基础吗?

所有租户和组织都可以使用上下文基础。

有关数据驻留的详细信息,请参阅“数据驻留”页面

如何获得上下文基础的许可?

当通过其受支持的 UiPath 产品界面执行时,上下文基础会按搜索或 RAG 收费。有关详细信息,请参阅上下文基础许可

上下文基础是否仅在云部署中可用?

从 2.2510 版本开始,Automation Suite 中也提供上下文基础。

我可以在“上下文基础”中使用哪些类型的数据?

“上下文基础”目前适用于以下数据格式:PDF、JSON、CSV、DOCX、TXT、XLS。

我可以将其他业务数据导入到上下文基础中吗?

要利用上下文基础,您需要将数据导入 UiPath Orchestrator 存储桶或索引。然后,您可以使用上下文基础活动来提取、索引和管理查询的数据,以确保获得高度相关的结果。

“上下文基础”中可以包含的数据量是否有限制?

可用于依据提示的数据限制取决于模型上下文窗口令牌大小限制。 请参阅用于执行 RAG 的模型(例如,在 GenAI 活动中),以确定潜在的令牌限制阈值。

  • 索引限制(上限为 10 个):每个租户最多有十个索引。我们建议您在要从中提取数据的 Orchestrator 存储桶之间保持一对一关系,以防止数据在文件夹之间泄漏,并确保不同用户出于不同目的可能需要查询的数据进行逻辑分离。上下文基础利用文件夹授权权限来帮助执行此建议。
  • 存储:这些索引之间或内部的存储不受限制。但是,我们对提取的数据量非常大的客户施加了一些限制。

上下文基础是否与 RAG 相同?

“上下文基础”确实在运行时为 UiPath GenAI 体验提供了 RAG 服务。 但是,它也提供托管向量数据库作为服务,以帮助管理运行时使用的数据。 这保证了高质量的搜索和生成的结果。

系统如何存储我的数据,或如何与上下文基础共享我的数据?

将按照标准企业合规性、加密和安全标准处理与 UiPath 共享的所有数据。

上下文基础是 AI Trust Layer 的一部分,这意味着您的数据绝不会存储在 UiPath 之外,也不会用于训练第三方模型。

如何确保数据安全?

上下文基础是租户范围的,它利用 UiPath 中现有的 RBAC 和 AuthZ 策略,以及加密静态和传输中的数据。

由于它在租户范围内,因此不会在同一租户内的索引之间或租户之间共享任何数据。

如何获得上下文基础?

上下文基础是租户范围内的内容。 我们支持 Orchestrator 存储桶中的文件夹级别授权,并且上下文基础利用应用于 GenAI Activities 的现有身份验证和 Automation Ops 策略。

我可以动态选择要使用的 LLM 吗?

在 UiPath GenAI 活动中,您可以选择使用哪个 LLM 来执行上下文基础支持的 RAG 部分。您可以选择 LLM 网关中的任何可用 LLM。然后,UiPath 会管理提取和语义搜索策略以优化生成。

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新