UiPath Documentation
agents
latest
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。

智能体用户指南

智能体和工作流

在设计智能自动化系统时,区分智能体和工作流非常重要,因为它们是两种截然不同但通常互补的范式。本节概述了每种范式的特点、它们之间的区别,以及如何针对您的用例选择最适合的模型。

通过本节更好地了解:

  • 什么是智能体以及什么是工作流
  • 决策标准和用例示例,以确定何时考虑采用其中一种模型。

什么是智能体?

An agent is a software system driven by large language models (LLMs) that can reason, act, and adapt dynamically toward a goal. Unlike traditional automation logic, agents do not follow a rigid set of instructions. Instead, they make decisions in real time, selecting tools, interpreting results, and adjusting actions based on current context and memory.

Agents shine when the path to the outcome can’t be hard-coded, or when hard-coded logic is super complex. They reason, decide and act over dynamic, often unstructured inputs.

智能体可以有不同的操作模式:

  • 自主:由时间或程序化事件触发,通常是更广泛工作流的一部分。
  • 对话:使用自然语言消息对话来解释用户输入,并根据上下文做出响应,以完成任务或提供信息。
  • 环境:嵌入环境或设备,可持续感知上下文,并主动执行有用的操作或通知,无需明确的用户提示。

智能体特别适用于输入为非结构化且事先不知道最佳解决路径的模糊开放式任务。智能体还可以从之前的交互中学习,因此适用于适应性和推理能力极为重要的环境。

关键特征

  • 自治:选择接下来调用工具或 API。
  • 有状态的记忆:能记住上下文、之前的步骤和反馈。
  • 动态控制流:即时进行分支、循环或提出澄清问题。
  • 人机回圈挂钩:在置信度较低或违反规则时升级。

适合的典型场景

  • 模糊任务(例如,诊断支持工单、研究市场)。
  • 高度变化的输入/路径。
  • 从每次运行中学习可以增加价值的情况。

什么是工作流?

工作流是按固定顺序执行的步骤的结构化序列。它通常集成了 LLM、API 或人工输入,但缺乏智能体的自主规划能力。工作流中的每个步骤都是预定义的,各个步骤之间的转换遵循确定性逻辑。

工作流擅长处理大批量的可重复流程,具有明确的业务规则和可预测的结果。工作流具有透明度和监管能力,易于在成本、时间和合规性方面进行基准测试。

关键特征

  • 确定性路径:在输入相同的情况下,每次运行都会遵循相同的分支。
  • 运行之间无状态:每次执行都会从新开始(除非明确保留数据)。
  • 透明的成本和时间:易于进行基准测试和制定预算。
  • 符合监管要求:满足合规和审核需求。

适合的典型场景

  • 大批量例行任务(例如,发票提取 → 验证 → ERP 输入)。
  • 严格的服务级别协议或监管约束。
  • 相同输入的输出必须相同的场景。

智能体工作流:混合方法

An agentic workflow blends the adaptability of agents with the structure of workflows. It allows agents to reason, act, and learn within or across defined steps, enabling dynamic decision-making where traditional workflows fall short.

This hybrid approach handles ambiguity and variability while maintaining orchestration and governance. Agentic Orchestration in Maestro blends the two: agents handle the dynamic decisions, then hand off to predictable workflows for execution.

在智能体和工作流之间进行选择。

使用以下考虑因素来指导您的决策:

  • 输入类型:当输入是非结构化、多模式或需要上下文理解时,选择智能体;当输入是结构化且定义明确时,使用工作流。
  • 控制流:智能体根据中间结果动态制定操作计划。工作流遵循在设计时确定的静态路径。
  • 适应性:智能体可以根据需要学习或重新提示,即时适应。工作流如果有任何变更,都需要手动重新设计。
  • 监管和可预测性:工作流提供强大的合规性、成本控制和一致性。智能体提供实验能力和灵活性,成本和结果的差异较大。
  • runtime 推理:如果必须在运行时根据部分上下文或不断变化的上下文进行决策或分支,智能体则是正确的选择。

表格 1. 智能体与工作流决策框架

条件代理工作流
重复性且基于规则的任务
非常模糊的任务
确定性结果
动态推理和适应
表 2. 智能体与工作流属性对照表
维度 代理 Workflows
控制流程 动态规划与工具选择/生成 使用预定义工具的预定义序列
输入类型 非结构化、多模态 结构化记录/表单
适应性 即时学习或修改提示 需要在设计阶段进行更改
可靠性 可变;取决于护栏和评估 如果输入符合规范,则较高
监管负载 更高(智能体无序风险) 存在成熟策略/工具
成本可预测性 中低(LLM/令牌差异)
典型 ROI 时间周期 快速实验,不确定的扩展 编写脚本后,可稳定节省成本
技能障碍 低代码与代码类似

表 3. 智能体与工作流用例比较

Use case代理工作流
支持工单分类▸ 根据日志和路由动态诊断对于预定义路径来说过于模糊
销售邮件生成▸ 量身定制的自适应外联无法在买家动态上下文中进行个性化
发票的处理过于基于规则,可重复▸ 遵循固定、可靠的路径
员工入职不涉及模糊性▸ 流程步骤简单

多智能体系统

多智能体系统由多个自主智能体组成,这些智能体在运行时进行交互和协调,以实现共同目标或协商目标。与遵循预定义路径的标准工作流或独立运行的单个智能体不同,多智能体设置支持突现行为、灵活的任务分配和动态协作。

多智能体系统最适合用于高度复杂的开放式目标,例如协作式 RAG 管道或动态供应链响应。

下表在几个关键维度上对经典工作流编排与真正的多智能体系统进行了比较:

维度经典工作流(可以调用智能体)真正的多智能体系统
控制逻辑预先设计:“步骤 A → 步骤 B → 步骤 C”。分支由作者固定。在运行时突现:智能体会规划自己的步骤,有可能将工作动态重新分配给对等智能体。
计划实体工作流引擎决定顺序;各个智能体(如果有)只需执行各自的任务。每个智能体都在本地制定计划;协调层(或对等协议)可以即时解决冲突。
适应性仅限于人工建模的决策树。可以形成新的子计划,拆分/合并角色,重新协商目标。多智能体群可以重新分配任务或生成辅助智能体,以进行故障处理。
状态和记忆在运行之间通常无状态(除非将状态保留)。每个智能体都可以保留自己的记忆;共享记忆(即黑板)可让它们为其他智能体写入/读取上下文。
监管和可观察性简单:一个编排器,确定性追踪。更难:许多自主循环需要全局追踪、策略实施和安全护栏。
适合的典型场景明确交接步骤的重复性流程(例如“提取发票 → 验证 → 发布到 ERP”)。从分工协作中受益的复杂开放式目标(例如,RAG 研究程序 → 规划程序 → 编码器协作完成微功能的发布)。

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新