Test Cloud - 使用 DeepRAG

test-cloud

latest

false

Test Cloud 管理员指南

重要 :

新发布内容的本地化可能需要 1-2 周的时间才能完成。

使用 DeepRAG

在 Test Cloud 中配置和使用 DeepRAG，以使智能体能够执行多文档合成，并生成引文支持的企业级答案。

DeepRAG（深度研究增强生成）是一个上下文锚定和合成层，使 Agents 能够跨多个文档分析和关联信息，从而生成附带引文的企业级答案。您可使用它构建 Agents，以大规模执行深度研究、调查性分析和循证推理。要了解有关 Agents 的更多信息，请参阅Agents 用户指南。

DeepRAG 分三个运行阶段：

规划 — 分析您的问题，识别子任务，并界定研究范围。
迭代研究循环 — 查询索引数据，提取相关证据，并整合结果。
合成 — 将所有证据整合为连贯且附带引文的回答。

每个结果都包含对原始来源的可追踪引用，确保整个企业数据后端的可审核性和合规性。

关键功能

以下是 DeepRAG 的关键功能：

多文档合成 — 单次查询可跨多达 1,000 页文档进行信息整合。
附带引文的答案 — 包括每项关键发现的文档名称、页码和时间戳。
智能体推理 — 在执行期间进行计划、研究和调整，而非仅检索结果。
企业级规模 — 通过单一索引处理来自多个来源的结构化与非结构化数据。
可追溯性和合规性 — 保留合成过程中所用来源的完整审核追踪。

何时使用 DeepRAG

当您的智能体需要执行以下操作时，请使用 DeepRAG：

请分析多个文档以回答复杂问题。
生成不同数据集的全面摘要。
通过高保真引文验证发现结果。
进行需要可追踪性的监管、医学或法律研究。

使用语义搜索进行快速事实查找，使用DeepRAG跨文档集进行详细分析或综合。有关在智能体中使用上下文的详细信息，请参阅《智能体用户指南》。

表 1.DeepRAG 与其他方法

功能	语义搜索	DeepRAG
用途	查找相关数据块	整合多个文档
文档限制	无限制	1,000 页
正在处理	即时	分
输出	代码片段	综合综合
成本	低	中
引文	基本	详细说明

配置 DeepRAG

在使用 DeepRAG 之前，请确保满足以下先决条件：

您的数据以正确的文件格式存储：原生 PDF 或 TXT 文件，每个文件最大为 512 MB。
您可以拥有用于提取和执行查询的 AI Unit。有关详细信息，请参阅上下文基础许可。

接下来，完成以下操作:

步骤 1 — 准备文档

使用组织良好的文件夹且命名约定清晰。
包括文档元数据和页码。
避免重复，并确保扫描后的文件已应用 OCR。

备注：
为了获得更高的准确性，请使用原生 PDF 并按类别或标识符构建文档。

第 2 步 — 创建索引

在 Agent Builder 中：
选择“上下文”节点，然后选择“新建” 。以下是索引配置的示例：
1. 名称中将包含：“医疗记录 2025”
2. 说明：供审核的汇总患者记录
3. 提取模式： “高级”。
上传文档并等待提取完成。
- 提取成本：0.2 AIU * 页数。例如，1,000 页 = 200 个 AIU。

第 3 步 — 配置智能体

配置您的智能体。以下是一个示例：

智能体名称 — 医疗记录摘要器
描述 — 分析患者医疗记录并提供完整引文
上下文 — 配置上下文。例如:
- 索引：医疗_记录_2025；
- 搜索策略：DeepRAG
- 搜索策略提示词 — 编写有效的提示词，例如：“分析所有医疗记录，并提供全面摘要，包括：诊断和治疗、医疗历史、药物、实验室结果。”
指定输出格式 — 例如：“带引文的结构化摘要”。始终在提示词中包含详细的输出格式指令和冲突处理指令。
备注：
如果 DeepRAG 生成的摘要超过输出大小限制，请从外部检索完整的摘要。将DeepRAG ID （来自追踪记录）与“上下文锚定摘要 — DeepRAG GenAI”活动一起使用，在智能体运行之外获取完整的合成输出。这样，您就可以访问完整的响应，而不会被截断。

为 DeepRAG 编写有效的提示词

DeepRAG 会自动生成经过验证的引文，指向源文档中找到支持性证据的确切页面。您无需请求引文或指定引文格式，这在默认情况下会发生。实际上，添加引文或格式化说明可能会干扰结果，因此应加以避免。

为了获得可靠、高质量的输出，您的提示词应重点突出角色清晰度、任务特殊性和具体要求。

使用以下模式：

角色：您是审核 [文档类型] 的[领域专家]。

任务：分析所有文档和[特定目标]。

要求：

[要求 1]
[要求 2]
[要求 3]

输出格式：[结构化输出格式]

合适提示词示例：您是一位医疗专业人员，正在审核患者的记录。创建全面的摘要，包括诊断、历史记录、药物治疗和实验室结果。

效果较差的提示词示例：总结患者的记录。

良好示例明确定义了角色，设置了特定任务，并概述了具体要求，从而允许 DeepRAG 有效地检索和依据其响应，同时在后台自动处理引用。

优化 DeepRAG 性能

使用以下信息来优化上下文的性能：

场景	通常持续时间	优化提示
小于 200 页	少于 10 分钟	使用针对性强的问题和原生 PDF。
500—800 页	20 分钟内	拆分大文件并优化提示范围。
1,000 页	少于 30 分钟	删除重复项

成本模型

提取 = 0.2 AIU * 页数
DeepRAG 查询 = 每 30K 词元消耗 0.20 AIU（每 500 页消耗 0.2—0.4 AIU）

故障排除

问题	原因	解决方案
没有可用于 DeepRAG 的有效文件	文件格式错误或选择的基本提取模式错误	仅使用 PDF/TXT
超时（60 分钟）	语料库太大或提示词太复杂	拆分文档；简化查询。
缺少引文	弱提示或非结构化来源	验证 PDF 的编号是否一致。
低质量的摘要	提示词为通用信息或文档质量不佳	提高提示的针对性；整洁的文档层次结构。

DeepRAG 用例

以下是一些可以使用 DeepRAG 的现实业务场景：

医疗记录摘要：分析 200—400 页的患者档案，提取诊断、治疗、药物和实验室结果，并生成附带引文的摘要。

提示示例：分析所有患者医疗记录并生成临床摘要，包括主效、诊断、药物和治疗建议。
结果：在医疗保健场景中，审核效率提升 5—10 倍，准确率提高 70—90%

合同分析：审核多项协议以识别主要条款、契诺和默认条款。

提示示例：分析所有信用协议并提取财务条款、契诺和默认条款。
结果：通过完整的审核线索，为合规性和法律工作流启用风险分析。

法规与合规性审核：汇总审核报告、存档和 SOP，以突出显示与页面级参考的合规性差距。

提示示例：审核所有监管申报并汇总合规状态，识别不合规情况并进行罚单。

此页面有帮助吗？

前一个创建索引

下一个上下文基础许可

关键功能​

何时使用 DeepRAG​

配置 DeepRAG​

步骤 1 — 准备文档​

第 3 步 — 配置智能体​

为 DeepRAG 编写有效的提示词​

优化 DeepRAG 性能​

成本模型​

故障排除​

DeepRAG 用例​