- 入门指南
- 数据安全性与合规性
- 组织
- 身份验证和安全性
- 许可
- 租户和服务
- 帐户和角色
- Ai Trust Layer
- 外部应用程序
- 通知
- 日志记录
- 在您的组织中进行测试
- 故障排除
- 迁移到 Test Cloud
Test Cloud 管理员指南
DeepRAG(深度研究增强生成)是一个上下文锚定和合成层,使 Agents 能够跨多个文档分析和关联信息,从而生成附带引文的企业级答案。您可使用它构建 Agents,以大规模执行深度研究、调查性分析和循证推理。要了解有关 Agents 的更多信息,请参阅Agents 用户指南。
DeepRAG 分三个运行阶段:
- 规划 — 分析您的问题,识别子任务,并界定研究范围。
- 迭代研究循环 — 查询索引数据,提取相关证据,并整合结果。
- 合成 — 将所有证据整合为连贯且附带引文的回答。
每个结果都包含对原始来源的可追踪引用,确保整个企业数据后端的可审核性和合规性。
关键功能
以下是 DeepRAG 的关键功能:
- 多文档合成 — 单次查询可跨多达 1,000 页文档进行信息整合。
- 附带引文的答案 — 包括每项关键发现的文档名称、页码和时间戳。
- 智能体推理 — 在执行期间进行计划、研究和调整,而非仅检索结果。
- 企业级规模 — 通过单一索引处理来自多个来源的结构化与非结构化数据。
- 可追溯性和合规性 — 保留合成过程中所用来源的完整审核追踪。
何时使用 DeepRAG
当您的智能体需要执行以下操作时,请使用 DeepRAG:
- 请分析多个文档以回答复杂问题。
- 生成不同数据集的全面摘要。
- 通过高保真引文验证发现结果。
- 进行需要可追踪性的监管、医学或法律研究。
使用语义搜索进行快速事实查找,使用DeepRAG跨文档集进行详细分析或综合。有关在智能体中使用上下文的详细信息,请参阅 《智能体用户指南》 。
表 1.DeepRAG 与其他方法
| 功能 | 语义搜索 | DeepRAG |
|---|---|---|
| 用途 | 查找相关数据块 | 整合多个文档 |
| 文档限制 | 无限制 | 1,000 页 |
| 正在处理 | 即时 | 分 |
| 输出 | 代码片段 | 综合综合 |
| 成本 | 低 | 中 |
| 引文 | 基本 | 详细说明 |
配置 DeepRAG
在使用 DeepRAG 之前,请确保满足以下先决条件:
- 您的数据以正确的文件格式存储:原生 PDF 或 TXT 文件,每个文件最大为 512 MB。
- 您可以拥有用于提取和执行查询的 AI Unit。有关详细信息,请参阅上下文基础许可。
接下来,完成以下操作:
步骤 1 — 准备文档
-
使用组织良好的文件夹且命名约定清晰。
-
包括文档元数据和页码。
-
避免重复,并确保扫描后的文件已应用 OCR。
备注:为了获得更高的准确性,请使用原生 PDF 并按类别或标识符构建文档。
第 2 步 — 创建索引
在 Agent Builder 中:
-
选择“上下文”节点,然后选择“新建” 。以下是索引配置的示例:
- 名称中将包含:“医疗记录 2025”
- 说明:供审核的汇总患者记录
- 提取模式: “高级”。
-
上传文档并等待提取完成。
- 提取成本:0.2 AIU * 页数。例如,1,000 页 = 200 个 AIU。
第 3 步 — 配置智能体
配置您的智能体。以下是一个示例:
- 智能体名称 — 医疗记录摘要器
- 描述 — 分析患者医疗记录并提供完整引文
- 上下文 — 配置上下文。例如:
- 索引:医疗_记录_2025;
- 搜索策略:DeepRAG
- 搜索策略提示词 — 编写有效的提示词,例如:“分析所有医疗记录,并提供全面摘要,包括:诊断和治疗、医疗历史、药物、实验室结果。”
- 指定输出格式 — 例如:“带引文的结构化摘要”。始终在提示词中包含详细的输出格式指令和冲突处理指令。
备注:
如果 DeepRAG 生成的摘要超过输出大小限制,请在外部检索完整的摘要。将 DeepRAG ID(来自追踪记录)与“上下文锚定摘要 — DeepRAG GenAI 活动”结合使用,在智能体运行之外获取完整的合成输出。这样您就可以访问完整响应内容,而无需担心截断问题。
为 DeepRAG 编写有效的提示词
DeepRAG 会自动生成经过验证的引文,指向源文档中找到支持性证据的确切页面。您无需请求引文或指定引文格式,这在默认情况下会发生。实际上,添加引文或格式化说明可能会干扰结果,因此应加以避免。
为了获得可靠、高质量的输出,您的提示词应重点突出角色清晰度、任务特殊性和具体要求。
使用以下模式:
角色:您是审核 [文档类型] 的[领域专家]。
任务:分析所有文档和[特定目标]。
要求:
- [要求 1]
- [要求 2]
- [要求 3]
输出格式:[结构化输出格式]
合适提示词示例:您是一位医疗专业人员,正在审核患者的记录。创建全面的摘要,包括诊断、历史记录、药物治疗和实验室结果。
效果较差的提示词示例:总结患者的记录。
良好示例明确定义了角色,设置了特定任务,并概述了具体要求,从而允许 DeepRAG 有效地检索和依据其响应,同时在后台自动处理引用。
优化 DeepRAG 性能
使用以下信息来优化上下文的性能:
| 场景 | 通常持续时间 | 优化提示 |
|---|---|---|
| 小于 200 页 | 少于 10 分钟 | 使用针对性强的问题和原生 PDF。 |
| 500—800 页 | 20 分钟内 | 拆分大文件并优化提示范围。 |
| 1,000 页 | 少于 30 分钟 | 删除重复项 |
成本模型
- 提取 = 0.2 AIU * 页数
- DeepRAG 查询 = 每 30K 词元消耗 0.20 AIU(每 500 页消耗 0.2—0.4 AIU)
故障排除
| 问题 | 原因 | 解决方案 |
|---|---|---|
| 没有可用于 DeepRAG 的有效文件 | 文件格式错误或选择的基本提取模式错误 | 仅使用 PDF/TXT |
| 超时(60 分钟) | 语料库太大或提示词太复杂 | 拆分文档;简化查询。 |
| 缺少引文 | 弱提示或非结构化来源 | 验证 PDF 的编号是否一致。 |
| 低质量的摘要 | 提示词为通用信息或文档质量不佳 | 提高提示的针对性;整洁的文档层次结构。 |
DeepRAG 用例
以下是一些可以使用 DeepRAG 的现实业务场景:
医疗记录摘要:分析 200—400 页的患者档案,提取诊断、治疗、药物和实验室结果,并生成附带引文的摘要。
- 提示示例:分析所有患者医疗记录并生成临床摘要,包括主效、诊断、药物和治疗建议。
- 结果:在医疗保健场景中,审核效率提升 5—10 倍,准确率提高 70—90%
合同分析:审核多项协议以识别主要条款、契诺和默认条款。
- 提示示例:分析所有信用协议并提取财务条款、契诺和默认条款。
- 结果:通过完整的审核线索,为合规性和法律工作流启用风险分析。
法规与合规性审核:汇总审核报告、存档和 SOP,以突出显示与页面级参考的合规性差距。
- 提示示例:审核所有监管申报并汇总合规状态,识别不合规情况并进行罚单。