automation-cloud
latest
false
- 入门指南
- 数据安全性与合规性
- 组织
- 身份验证和安全性
- 许可
- 租户和服务
- 帐户和角色
- Ai Trust Layer
- 外部应用程序
- 通知
- 日志记录
- 故障排除
- 迁移到 Automation Cloud™
重要 :
请注意此内容已使用机器翻译进行了部分本地化。
新发布内容的本地化可能需要 1-2 周的时间才能完成。
Automation Cloud 管理员指南
上次更新日期 2024年12月10日
关于上下文基础
上下文基础是 UiPath AI 信任层的组件,可让您引入数据以生成更准确、更可靠的 GenAI 预测。 上下文基础旨在使您的业务数据实现 LLM 就绪,而您无需额外订阅嵌入模型、向量数据库或大型语言模型 (LLM)。 您可以创建 UiPath GenAI 功能可以引用以在运行时作为上下文证据的代表性索引和嵌入的业务数据。
上下文基础是一项租户范围的平台服务,旨在支持 UiPath GenAI 体验(例如 GenAI Activities 和 Autopilot for Everyone),方法是在 LLM 通过检索增强生成 (RAG) 执行提示之前,为提示提供相关信息。
将 RAG 作为服务提供给 UiPath GenAI 体验有助于:
- 克服 LLM 上下文窗口限制:无论是小型模型还是大型模型,RAG 都有助于提高模型在与知识库交互时的准确性、可靠性、可扩展性和效率。
- 通过引用地面实况数据存储来降低产生错觉的风险。
- 为生成式应用程序提供对专业和专有知识来源的访问权限。
- 使生成式应用程序访问最新的信息来源。
- 在数据存储和用户查询之间启用正反馈循环。
上下文基础的术语和核心组件包括:
图 1.上下文基础组件架构
提取和索引:使您的业务数据为 LLM 就绪
- 提取:使用 UiPath 托管的嵌入模型将业务数据转换为具有代表性的嵌入。
- 嵌入:LLM 可以理解和搜索的业务数据表示。
- 索引:向量数据库中的一个文件夹,用于组织嵌入。
- 向量 DB:UiPath 管理的向量数据库,用于存储在索引中整理的嵌入。
检索
- 搜索适合 LLM 的业务数据,以查找最相关的信息。 “上下文基础”使用各种提取、组块、检索和重新排名技术,这些技术根据不同的数据格式和查询进行了优化。
- 将提示解释为查询以搜索嵌入,并根据余弦相似度搜索生成最相关的结果。 这些搜索结果是 RAG 的中间前导步骤,用于使用业务数据中的相关上下文来增强提示。
检索增强的生成
- 使用语义相似度搜索结果中最相关的信息修饰和更新提示,然后通过 AI Trust Layer 的 LLM 网关托管的 LLM 执行生成。
以下是上下文基础的一些主要功能:
- 多文档支持:PDF、JSON、CSV、XLS、DOCX 和 TXT 文件。
- 托管的提取和索引管道:UiPath 可以优化 UiPath 托管的向量数据库中的数据提取和索引编制。
- 多个界面:上下文基础当前作为 UiPath GenAI Activities、AI Trust Layer(具有专用用户界面)和 Autopilot for Everyone 的一部分提供。
- 数据检索:使用各种技术(例如 查询转换、嵌入、微调等),以确保搜索结果高度相关。
- 检索增强的生成:通过内存中的实时 (JIT) 或知识库去除提示。
- 知识证明:从语义相似度搜索中提供参考来源和文本的引用。
- 流支持:流 API 支持,可在生成生成时显示生成。
- 多语言支持:能够从所有 UTF-8 编码语言的文档中进行提取和查询。
- 支持多个数据源:
- UiPath Orchestrator 存储桶实体:您可以提取、索引和查询存储在 Orchestrator 存储桶实体的共享文件夹中的数据。
- 文档存储系统:通过 Integration Service 连接器,例如Microsoft OneDrive & SharePoint和 Google Drive:上下文基础可以访问直接存储在第三方应用程序中的数据。
- “上下文基础”目前支持特定的文件类型:PDF、JSON、CSV、XLS、DOCX、TXT。
- 每个租户最多只能有 10 个索引。 我们建议您与这些路径以及要使用的数据源中的文件夹路径保持一对一关系。
- 上下文基础遵循共享文件夹实体的文件夹权限和授权。 没有适当权限的用户可能无法查看、更新、删除或使用与其无权访问的文件夹相关联的索引。
- 要通过 UiPath GenAI Activities 使用上下文基础,您必须使用 Studio Web 或 Studio Desktop 2024.4 或更高版本。 有关更多信息,请参阅入门部分。