- 入门指南
- Studio Web 中的 UiPath 智能体
- UiPath 编码智能体
智能体用户指南
选择数据访问方法:JIT 与基于索引的策略
在配置智能体访问数据并根据数据进行推理的方法时,请选择最符合您数据形状、生命周期和性能要求的方法。
有两种主要模式:
- 即时 (JIT) 工具,用于处理运行时传递的文件。
- 基于索引的上下文锚定,用于查询预构建的持久性索引。
DeepRAG (JIT) 和 DeepRAG(索引搜索策略)使用相同的底层合成功能。两者的区别在于文档如何到达引擎:
- JIT:文件在运行时提供。
- 基于索引:文档预先提取到持久性索引中。
批量转换则不同。它对表格数据执行结构化行级转换。它不执行文档检索或长文档合成。
快速参考
| 功能 | DeepRAG(JIT 工具) | 批量转换(JIT 工具) | 语义搜索(索引) | DeepRAG(索引搜索策略) |
|---|---|---|---|---|
| 需要设置 | 无 | 无 | 索引 + 提取 | 索引 + 提取 |
| Input format | PDF 或 TXT | CSV | 预先编制索引的文档 | 预先编制索引的文档 (PDF/TXT) |
| 每次运行时数据都会更改 | 是(理想) | 是(理想) | 否(稳定语料库) | 否(稳定语料库) |
| 输出类型 | 带引文的全面合成1 | 丰富的 CSV 文件 | 相关代码片段 | 带引文的全面合成 |
| 速度 | 分钟(约 1,000 页需要 30 分钟以上) | 分 | 即时 | 分钟(约 1,000 页需要 30 分钟以上) |
| 理想适用于 | 每次运行的文档分析 | 每次运行的结构化数据处理 | 快速事实查找 | 对大型语料库进行深度研究 |
1 TXT 输入目前不支持引文。
JIT 工具:建议的默认值
对于大多数智能体实施,JIT 工具是合适的起点。
它们不需要设置索引、配置存储,也不需要提取工作流。智能体运行时,文件直接传递给智能体,工具自动处理。因此 JIT 特别适合文档集每次调用后都会发生变化的用例。
我们提供两种 JIT 工具:DeepRAG (JIT) 和批量转换。
DeepRAG(JIT 工具)
当您的智能体需要读取运行时提供的 PDF 或 TXT 文件并对其进行推理,并生成有依据的综合响应时,请使用 DeepRAG (JIT)。
DeepRAG 算法执行结构化多步骤研究流程。它会规划子任务,对提供的文档进行迭代,并将结果合成为全面的输出。对于 PDF 输入,响应包含引文。(TXT 输入目前不支持引文。)
当每次运行都处理不同的文档集(例如客户文件、合同、病例或每次调用后都会发生变化的报告)时,此方法最为有效。在此方法中,完整性和可追溯性优先于速度,通常在几分钟内完成,具体取决于文档大小。
批量转换(JIT 工具)
批量转换用于结构化数据处理。它对运行时提供的 CSV 文件进行操作,并对每行应用一致的逻辑。
批量转换不是合成文档,而是丰富数据。它将各项记录单独处理,并生成更新的 CSV 文件,其中可以包含新列、分类、分数或其他派生值。
因此它适合在结构化数据集之间进行标记、评分、数据丰富和基于规则的转换。
基于索引的上下文锚定
基于索引的锚定要求在智能体运行之前将文档提取到上下文锚定索引中。尽管此设置增加了额外配置,但在处理在多次智能体执行期间被重复使用的大型稳定语料库时,这些配置非常有用。
典型示例包括策略库、知识库、监管存储库或由多个用户或流程共享的长期文档集合。
配置包含索引的智能体时,请选择搜索策略。
语义搜索
语义搜索是默认索引策略。它可快速执行轻量化检索,并返回最相关的文档块。
当智能体需要快速查找特定事实或提取目标信息时,此策略非常适用。它非常适合注重速度的问答模式以及共享存储库重复查询。
DeepRAG(索引搜索策略)
DeepRAG 还可以对索引进行操作。在此模式下,它会分析和连接许多文档之间的信息,并生成包含引文的全面响应。
与语义搜索相比,此方法速度较慢,消耗的 AI Unit 也更多,但支持更深入的研究任务。它非常适合需要在稳定语料库内对数百页进行全面分析的场景,例如合同审核、监管评估或病例合成。
如何决定
根据以下指南,选择正确的方法:
- 文档每次运行后都会发生更改,而且您需要与来自 Runtime 文件的引文进行合成时,请使用 DeepRAG (JIT)。
- 逐行处理结构化 CSV 数据时,请使用批量转换 (JIT)。
- 查询稳定的共享语料库,以进行快速、有针对性的检索时,请使用语义搜索(索引)。
- 对大型索引语料库进行深入研究,需要包含引文的全面答案时,请使用 DeepRAG(索引策略)。
如有疑问,请从 JIT 工具开始。只有需要在多次智能体执行期间进行共享持久文档锚定时,才应采用基于索引的策略。