- Erste Schritte
- UiPath Agents in Studio Web
- UiPath Agents in Agent Builder
- Codierte UiPath Agents

Benutzerhandbuch zu Agents
Beim Entwerfen intelligenter Automatisierungssysteme ist es wichtig, zwischen Agents und Workflows zu unterscheiden, zwei unterschiedlichen, aber oft komplementären Paradigmen. In diesem Abschnitt wird beschrieben, was die einzelnen Modelle beinhalten, wie sie sich unterscheiden und wie Sie das richtige Modell für Ihren Fall auswählen.
Dieser Abschnitt soll Ihnen ein Verständnis dafür vermitteln:
- Was ein Agent im Vergleich zu einem Workflow ist.
- Welche Entscheidungskriterien und Anwendungsbeispiele in Ihrer Betrachtung einbeziehen sollten.
Ein Agent ist ein von großen Sprachmodellen (LLMs) gesteuertes Softwaresystem, das ein Ziel dynamisch durch vernünftiges Denken, Handeln und Anpassen erreichen kann. Im Gegensatz zur herkömmlichen Automatisierungslogik folgen Agents keinen starren Anweisungen. Stattdessen treffen sie Entscheidungen in Echtzeit, wählen Tools, interpretieren Ergebnisse und passen Aktionen basierend auf dem aktuellen Kontext und Gedächtnis an. Agents glänzen, wenn der Pfad zum Ergebnis nicht fest programmiert sein kann oder wenn fest programmierte Logik sehr komplex ist. Sie argumentieren, entscheiden und handeln über dynamische, oft unstrukturierte Eingaben.
Agents können verschiedene Betriebsmodi haben:
- Autonom: Wird durch zeitliche oder programmatische Ereignisse ausgelöst, in der Regel als Teil umfassenderer Workflows.
- Konversational: Interpretiert mithilfe von Meldungen in natürlicher Sprache Benutzereingaben und reagiert kontextbezogen, um Aufgaben zu erledigen oder Informationen bereitzustellen.
- Ambient: In einer Umgebung oder einem Gerät eingebettet, das kontinuierlich den Kontext erfasst und proaktiv hilfreiche Aktionen oder Benachrichtigungen ohne explizite Benutzerprompts ausführt.
Agents sind besonders wertvoll bei mehrdeutigen, offenen Aufgaben, bei denen die Eingaben unstrukturiert sind und der optimale Pfad zur Lösung nicht im Voraus bekannt ist. Sie wurden auch entwickelt, um aus früheren Interaktionen zu lernen, sodass sie für Umgebungen geeignet sind, in denen Anpassungsfähigkeit und logisches Denken entscheidend sind.
Hauptmerkmale
- Autonomie: Wählt, welches Tool oder welche API als nächstes aufgerufen werden soll.
- Statusbezogenes Gedächtnis: Merkt sich Kontext, vorherige Schritte und Feedback.
- Dynamischer Steuerungsfluss: Verzweigt, macht Schleifen oder stellt sofort Fragen zur Klärung.
- Human-in-the-Loop-Hooks: Eskaliert bei geringem Vertrauen oder einem Verstoß gegen Regeln.
Übliche Einsatzgebiete
- Mehrdeutige Aufgaben (z. B. Diagnose eines Supporttickets, Marktrecherche).
- Stark variable Eingaben/Pfade.
- Situationen, in denen das Lernen von jeder Ausführung einen Nutzen bringt.
Ein Workflow ist eine strukturierte Sequenz von Schritten, die in einer festen Reihenfolge ausgeführt werden. Es werden häufig LLMs, APIs oder menschliche Eingaben integriert, aber es fehlen die selbstgesteuerten Planungsfunktionen von Agents. Jeder Schritt in einem Workflow ist vordefiniert und Übergänge zwischen Schritten folgen einer deterministischen Logik.
Workflows eignen sich besonders gut für umfangreiche und wiederholbare Prozesse mit klaren Geschäftsregeln und vorhersehbaren Ergebnissen. Sie bieten Transparenz sowie Governance und sind in Bezug auf Kosten, Zeit und Compliance einfach vergleichbar.
Hauptmerkmale
- Deterministische Pfade: Jede Ausführung folgt denselben Verzweigungen mit denselben Eingaben.
- Statuslos zwischen Ausführungen: Jede Ausführung beginnt neu (es sei denn, Sie speichern explizit Daten).
- Transparente Kosten und Zeitpläne: Einfach für Benchmarking und Budgetplanung.
- Governance-ready: Entspricht Compliance- und Prüfanforderungen.
Übliche Einsatzgebiete
- Routineaufgaben mit hohem Volumen (z. B. Rechnungsextraktion → Validierung → ERP-Eintrag).
- Strenge Service-Level-Vereinbarungen oder regulatorische Einschränkungen.
- Szenarien, in denen die Ausgaben ei identischen Eingaben identisch sein müssen.
Ein agentischer Workflow kombiniert die Anpassungsfähigkeit von Agents mit der Struktur von Workflows. Agents können so innerhalb definierter Schritte oder darüber hinweg vernünftig denken, handeln und lernen, was eine dynamische Entscheidungsfindung ermöglicht, wenn herkömmliche Workflows nicht ausreichen. Dieser hybride Ansatz kann unter Beibehaltung von Orchestrierung und Governance mit Mehrdeutigkeiten und Variabilität umgehen. Die Orchestrierung mit Agenten in Maestro vereint beides: Agents verarbeiten die dynamischen Entscheidungen und geben sie dann an vorhersehbare Workflows zur Ausführung weiter.
Ziehen Sie folgenden Überlegungen bei Ihrer Entscheidung ein:
- Eingabetyp: Wählen Sie Agents, wenn Eingaben unstrukturiert oder multimodal sind oder kontextuelles Verständnis erfordern. Verwenden Sie Workflows, wenn Eingaben strukturiert und gut definiert sind.
- Steuerungsfluss: Agents planen dynamisch Aktionen basierend auf Zwischenergebnissen. Workflows folgen einem statischen Pfad, der in der Entwurfsphase festgelegt wird.
- Anpassungsfähigkeit: Agents passen sich sofort an, lernen oder fordern bei Bedarf neue Prompts ein. Workflows erfordern eine manuelle Neugestaltung bei Änderungen.
- Governance und Vorhersehbarkeit: Workflows bieten starke Compliance, Kostenkontrolle und Konsistenz. Agents bieten Experimente und Flexibilität mit einer höheren Varianz bei den Kosten und Ergebnissen.
- Überlegungen während der Runtime: Wenn Entscheidungen oder Verzweigungen zur Runtime basierend auf einem teilweisen oder sich entwickelnden Kontext erfolgen müssen, sind Agents die richtige Wahl.
Kriterien | Mitarbeiter | Workflow |
---|---|---|
Sich wiederholende und regelbasiere Aufgaben |
|
|
Besonders mehrdeutige Aufgaben |
|
|
Deterministische Ergebnisse |
|
|
Dynamische Argumentation und Anpassung |
|
|
Dimension | Mitarbeiter | Workflows |
---|---|---|
Kontrollfluss | Dynamische Planung und Toolauswahl/Generierung | Vordefinierte Sequenz mit vordefinierten Tools |
Eingabetyp | Unstrukturiert, multimodal | Strukturierte Datensätze/Formulare |
Anpassungsfähigkeit | Lernt oder verlangt dynamisch nach neuen Prompts | Erfordert Änderungen in der Entwurfsphase |
Zuverlässigkeit | Variable; hängt von Leitplanken und Auswertungen ab | Hoch, wenn Eingaben den Spezifikationen entsprechen |
Governance-Last | Höher (Risiko der Agentenanarchie) | Fertige Richtlinien/Tools vorhanden |
Vorhersehbarkeit bei den Kosten | Mittel bis niedrig (LLM/Token-Varianz) | Hoch |
Typischer ROI-Horizont | Schnelle Experimente, unsichere Skalierung | Gleichbleibende Einsparungen nach Skripterstellung |
Fähigkeitsbarriere | Ähnlich für Low-Code vs. Code |
Use case | Mitarbeiter | Workflow |
---|---|---|
Priorisierung von Supporttickets | ||
Erstellung von Vertriebsmails | ||
Verarbeiten von Rechnungen | ||
Mitarbeiter-Onboarding |
Ein Multi-Agent-System besteht aus mehreren autonomen Agents, die zur Runtime interagieren und sich koordinieren, um ein gemeinsames oder ausgehandeltes Ziel zu erreichen. Im Gegensatz zu einem Standardworkflow, der einem vordefinierten Pfad folgt, oder einem einzelnen Agent, der isoliert arbeitet, unterstützt eine Setup mit mehreren Agents ein emergentes Verhalten, eine flexible Aufgabenverteilung und eine dynamische Zusammenarbeit.
Multi-Agent-Systeme eignen sich am besten für offene, hochkomplexe Ziele wie kollaborative RAG-Pipelines oder dynamische Supply-Chain-Antworten.
In folgender Tabelle werden die klassische Workflow-Orchestrierung mit echten Multi-Agent-Systemen über mehrere Schlüsseldimensionen hinweg verglichen:
Dimension | Klassischer Workflow (kann Agents aufrufen) | Echtes Multi-Agent-System |
---|---|---|
Steuerlogik | Im Vorfeld entworfen: „Schritt A → Schritt B → Schritt C“. Verzweigungen werden vom Autor festgelegt. | Wird zur Runtime angezeigt: Agents planen ihre eigenen Schritte und können anderen Agents dynamisch eine neue Arbeit zuweisen. |
Planungsentität | Die Workflow-Engine entscheidet über die Reihenfolge. Einzelne Agents (falls vorhanden) führen einfach ihren Abschnitt aus. | Jeder Agent plant lokal. Eine Koordinierungsebene (oder Peer-to-Peer-Protokolle) löst Konflikte unmittelbar. |
Anpassungsfähigkeit | Beschränkt auf den von Menschen modellierten Entscheidungsbaum. | Kann neue Unterpläne erstellen, Rollen aufteilen oder zusammenführen, Ziele neu aushandeln. Multi-Agent-Schwärme können Aufgaben neu zuweisen oder Hilfsagents für die Fehlerbehandlung generieren. |
Status und Gedächtnis | In der Regel statuslos zwischen Ausführungen (es sei denn, Sie speichern ihn). | Jeder Agent kann sein eigenes Gedächtnis behalten. Mithilfe eines gemeinsam genutzten Speichers oder eines Schwarzen Bretts können sie Kontext für andere schreiben/lesen. |
Governance und Beobachtbarkeit | Einfach: Ein Orchestrator, deterministische Ablaufverfolgung | Schwierig: Viele autonome Schleifen erfordern eine globale Nachverfolgung, Richtliniendurchsetzung und Schutzmaßnahmen. |
Übliches Einsatzgebiet | Sich wiederholende Prozesse mit klaren Übergaben (z. B. „Rechnung extrahieren → validieren → im ERP verbuchen“). | Komplexe, offene Ziele, die von einer Arbeitsteilung profitieren (z. B. RAG-Forscher → Planer → Programmierer arbeiten zusammen, um eine kleine Funktion bereitzustellen). |