- 入门指南
- Studio Web 中的 UiPath 智能体
- UiPath 编码智能体

智能体用户指南
UiPath Agents 附带内置工具、预定义的即用型组件,无需自定义开发或外部配置。
“分析附件”工具使智能体可以使用 LLM 处理文件内容并对其进行推理。
目前支持以下文件类型:GIF、JPE、JPEG、PDF、PNG、WEBP。
要将此工具添加到您的智能体中,请执行以下步骤:
-
定义文件输入。在“数据管理器”面板中,向您的智能体架构中添加文件输入的参数。这些应为
File类型。图 1. 创建文件输入参数
- 添加“分析附件”工具:
- 在“工具”面板中选择“添加工具”。
- 在“内置工具”类别中,选择“分析附件”。
- 可选择更新工具的名称和描述,以帮助智能体更好地推断何时使用。
-
了解工具的输入。此工具预配置了两个主要输入:
-
attachments(Array):一个或多个待分析文件的列表。 -
analysisTask(String):描述任务的提示词或指令。如果您的用例仅涉及一个文件,您可以更新输入描述,以反映它是单个附件。
-
- 使用输入文件运行智能体。
- 打开“调试配置”窗口:
- 导航到“项目参数”选项卡。
- 提供
analysisTask的值,例如“比较两张图像”。 - 将您的输入文件上传到与您的
attachments参数绑定的字段中。
- 单击“保存”,然后运行调试会话。
- 打开“调试配置”窗口:
- 运行智能体后,通过底部面板查看执行追踪记录。
图 2. 执行追踪记录中的分析
附件追踪
使用“分析附件”工具时,所有文件输入和输出都将在“执行追踪”面板的“历史记录”选项卡下捕获。追踪记录详细显示了智能体执行期间如何处理附件。
对于每个文件,追踪记录显示:
- ID:附件的唯一标识符。
-
名称:原始文件名称(例如
1.jpg)。 -
MIME 类型:检测到的文件类型(例如
image/jpeg)。 - 下载 URL:用于下载文件以供检查或重用的直接链接。目前,追踪记录中显示的下载链接的生命周期为 30 分钟。
最佳实践和常见问题解答
通过“分析附件”工具,智能体可以使用 LLM 流程处理文档和图像。虽然功能强大,但在设计文件驱动的智能体时,需要注意一些重要的限制和行为。
大型文件可能超过令牌上限
智能体通过将内容嵌入到 LLM 提示词中来处理文件,而提示词会受到模型令牌上限的约束。大型 PDF 或扫描图像文档可能会静默失败,或返回“出错”等模糊错误,尤其是超出模型的令牌预算时。
-
使用令牌容量较高的模型。
-
使用上下文基础,而非完整文件嵌入,尤其适用于大型文件或多页面文件。
-
通过自定义工具,在智能体运行之前或期间对文档进行预索引,并对其进行同步。
LLM 调整图像大小
.jpg、.png)作为 LLM 提示词的一部分发送时,大多数模型会自动调整它们的大小。这可能会导致纵横比失真或像素精确数据丢失。
避免依赖确切坐标、边界框或像素对齐比较的提示词(例如,需要特定 x/y 定位的图像差异)。有关更多信息,请参阅 OpenAI 的图像视觉指南,以了解模型专属的大小调整行为。
支持的文件类型
支持以下文件扩展名:GIF、JPE、JPEG、PDF、PNG、WEBP。
文件类型支持因 LLM 提供程序而异。例如,根据文件名称或编码,某些 Anthropic 模型可能无法提供 PDF 支持。
获得更好结果的提示
- 如果您正在处理长 PDF,请考虑在将其传递给智能体之前将其拆分成更小的块或页面。
- 文件名称必须整洁:特别是 Anthropic 模型会拒绝包含特殊字符或重复空格的文件名称。
- 保持图像数量少:GPT-4o 等某些模型每个请求最多支持 10–50 个图像。