- Erste Schritte
- UiPath Agents in Studio Web
- Codierte UiPath Agents

Benutzerhandbuch zu Agents
Conversational Agents bilden eine neue Klasse von UiPath-Agents, die für dynamische, mehrstufige und Echtzeitdialoge mit Benutzern entwickelt wurden. Im Gegensatz zu autonomen Agents, die auf eine einzige Eingabe reagieren, interpretieren Conversational Agents einen kontinuierlichen Strom von Benutzernachrichten und reagieren darauf. Sie verwalten den Gesprächskontext, die Toolausführung, menschliche Eskalationen sowie das Gedächtnis, um eine umfassendere und adaptivere Automatisierung zu ermöglichen. Stellen Sie sich sie als intelligente digitale Assistenten vor, die den Kontext verstehen und Mehrdeutigkeiten auf natürliche Weise behandeln.
Conversational Agents eignen sich besonders gut für Szenarien, in denen Folgendes verlangt wird:
- Laufende Klärung oder ein Dialog
- Personalisierte Anleitung basierend auf der Benutzerabsicht
- Einfacher Rückgriff auf einen Menschen bei geringem Vertrauen
| Funktionen | Conversational Agent | Autonomer Agent |
|---|---|---|
| Interaktionsmodell | Mehrstufiger, wechselseitiger Dialog | Einzelne Aufgabenausführung basierend auf einem ersten Prompt |
| Primärer Einsatz | Benutzersupport und Hilfe in Echtzeit, interaktive Erfassung von Informationen | Ausführen einer Aufgabe über einen definierten Prompt |
| Benutzereingaben | Ununterbrochene Benutzerchatnachrichten | Ein einziger strukturierter Prompt |
| Hauptstärke | Aufrechterhaltung des Gesprächs und Umgang mit Mehrdeutigkeiten | Ausführung eines Plans über Tools hinweg |
Wann Sie Conversational Agents einsetzen sollten
Setzen Sie Convertional Agents ein, wenn Ihr Automatisierungsszenario eine kontextbezogene Interaktion in Echtzeit beinhaltet. Diese Agents eignen sich am besten für:
- Self-Service-Lösungen für Kunden oder Mitarbeitende, wie etwa Helpdesk-Support oder Onboarding-Assistenten.
- Interaktive Führung durch mehrstufige Prozesse, Formulare oder Entscheidungsbäume.
- Kontextbezogene Gespräche, bei denen Benutzer Nachfragen stellen oder Informationen schrittweise bereitstellen.
- Schnittstellen mit natürlicher Sprache für Anwendungen, Systeme oder Wissensdatenbanken, über die Benutzer Informationen im Dialog abfragen können.
Setzen Sie stattdessen autonome Agents ein, wenn die Aufgabe vollständig in einem einzigen Prompt beschrieben werden kann, wobei alle erforderlichen Eingaben im Vorfeld bereitgestellt werden. Ideale Beispiele dafür sind:
- Verarbeitung von strukturierten Dokumenten (z. B. Extraktion von Daten aus Rechnungen oder Verträgen)
- Automatisierte Berichtserstellung basierend auf einer vordefinierten Logik
- Zusammenfassungs- oder Transformationsaufgaben mit klaren Anforderungen für einmalige Ausführungen
Sind mehrere Chats verfügbar, ist es wichtig zu wissen, welcher davon zu welchem Zweck verwendet werden soll.
Konversationsagenten vs. Autopilot for Everyone:
- Zusammenarbeiten: Diese beiden arbeiten nebeneinander. Konversationsagenten sind kein Ersatz für Autopilot for Everyone.
- Unterschiedliche Zwecke: Stellen Sie sich Autopilot for Everyone als Allzweckagenten von UiPath vor, der für Produktivitätsaufgaben optimiert ist und mit der UiPath Platform interagiert. Konversationsagenten sind Spezialisten, die Sie für einen bestimmten Einsatz erstellen (z. B. einen Assistenten für HR-Richtlinien).
- Zugriff: Sie können direkt von Autopilot for Everyone aus auf Ihre spezialisierten Konversationsagenten zugreifen, wodurch es zu einem zentralen Hub für alle Ihre Gesprächsanforderungen wird.
Konversationsagenten vs. spezialisierte Autopiloten:
-
Überschneidungen: Beide wurden für jeweils spezifische Zwecke entwickelt.
-
Unsere Empfehlung: Wir empfehlen die Entwicklung mit Konversationsagenten. Sie verfügen über eine viel umfassendere und robustere Entwurfsphase zum Erstellen, Testen und Optimieren Ihres anwendungsspezifischen Agenten.
-
Hauptunterschied: Konversationsagenten unterstützen derzeit keine Dateiuploads oder die Automatisierung auf dem lokalen Desktop, im Gegensatz zu spezialisierten Autopiloten.
Während der öffentlichen Vorschau werden durch Ausführungen von Konversationsagenten keine Platform oder Agent Units verbraucht. Wenn der Agent jedoch einen kostenpflichtigen Dienst wie ein DeepRAG-Tool verwendet, werden die für das Aufrufen dieses Tools benötigten Einheiten verbraucht.
Official licensing details for conversational agents will become available with the general availability release.
Folgen Sie beim Entwerfen eines Conversational Agents folgenden bewährten Verfahren:
- Beginnen Sie mit einer genauen Personenbeschreibung: Definieren Sie den Tonfall und den Scope des Agents (z. B. „Sie sind ein freundlicher HR-Assistent …“).
- Denken Sie an Unvorhersehbarkeit: Benutzer können unvollständige oder falsche Informationen bereitstellen. Gehen Sie elegant mit Mehrdeutigkeiten um.
- Hinzunahme von Hilfe-Tools: Stellen Sie sicher, dass in den Beschreibungen von Tools klar angegeben ist, wann und wie sie verwendet werden sollen.
- Iterieren Sie mithilfe von Evaluierungen: Erstellen Sie Testfälle sowohl für erfolgreiche als auch für alternative Pfade. Aktualisieren Sie die Logik Ihres Agents entsprechend.
Die Erstellung eines Conversational Agents folgt einem strukturierten Lebenszyklus, der Entwurf, Tests, Bereitstellung und Überwachung umfasst. Die wichtigsten Schritte sind:
- Entwerfen Sie den Agent: Definieren Sie in Studio Web den Systemprompt des Agents, konfigurieren Sie verfügbare Tools, fügen Sie eine Kontextgrundlage hinzu und richten Sie Eskalationsworkflows ein.
- Test und Evaluierung: Testen Sie mithilfe des integrierten Debugging-Chats Multi-Turn-Interaktionen. Fügen Sie Evaluierungssätzen echte oder simulierte Gespräche hinzu, um Verhalten und Leistung zu validieren.
- Veröffentlichung und Bereitstellung: Veröffentlichen und stellen Sie den Agent als Lösungspaket in Orchestrator bereit. Stellen Sie sicher, dass der Lösungsordner einen serverlosen und einen Unattended Robot zur Ausführung enthält.
- Zugriff und Verwaltung: Interagieren Sie mit dem Agent über die Instanzverwaltung. Überwachen Sie das Runtime-Verhalten, überprüfen Sie die Ablaufverfolgungsprotokolle und führen Sie basierend auf Feedback Iterationen durch.
Sie können Conversational Agents mit demselben Low-Code-Designer in Studio Web wie bei autonomen Agents erstellen, wobei es entscheidenden Unterschiede in Bezug auf Dialoge in Echtzeit vorhanden sind.
Erstellen des Agents
So legen Sie los:
- Gehen Sie zu studio.uipath.com.
- Wählen Sie die Taste Neuen erstellen, dann Agent.
- Wählen Sie den Typ Conversational Agent.
Sie können optional Ihren Agent Autopilot beschreiben, um eine Startkonfiguration zu generieren
Konfigurieren des Systemprompts
Der Systemprompt definiert das Profil des Agents, seine Ziele, Verhaltenseinschränkungen und die Tool-/Eskalationslogik. Damit können Sie dem Agent anweisen, wie:
- Die Benutzer zu begrüßen sind.
- Unbekannte Abfragen zu bearbeiten sind.
- Probleme zu eskalieren oder Tools aufzurufen sind.
- Sich ein konsistenter Ton und Stil bewahren lässt.
Conversational Agents verwenden keine Benutzerprompts oder Eingaben/Ausgaben des Data Manager. Alle Eingaben werden live während des Gesprächs erfasst.
Tools konfigurieren
Mithilfe von Tools können Agents während eines Gesprächs Aktionen ergreifen, z. B. Automatisierungen ausführen, Prozesse ausführen oder APIs aufrufen. Zu den unterstützten Tooltypen gehören: RPA-Workflows, API-Workflows, Aktivitäten und andere Agents (außer Conversational Agents).
Verwenden Sie Guardrails auf Tool-Ebene, um Runtime-Richtlinien zu erzwingen. Guardrails gelten sowohl während des Test- als auch zur Runtime und sind in den Ablaufverfolgungsprotokollen sichtbar. Weitere Informationen dazu finden Sie unter Benutzerdefinierte Leitplanken.
Konfigurieren von Kontexten
Fügen Sie Indizes für die Kontextgrundlage hinzu, um Ihrem Agent Zugriff auf bestimmte Wissensquellen zu gewähren. Der Agent kann diese Indizes abfragen, um fundierte, zitierte Antworten bereitzustellen. Weitere Information dazu finden Sie unter Kontexte.
Konfigurieren von Eskalationen und dem Agentengedächtnis
Conversational Agents unterstützen Eskalationsworkflows und ein Agentemgedächtnis zur Verbesserung der Entscheidungsfindung:
- Über Eskalationen kann der Agent, Gespräche über das Action Center an einen Menschen weiterleiten, wenn das Vertrauen gering ist oder die Benutzerabsicht unklar ist. Gespräche werden synchron ausgeführt, was bedeutet, dass der Agent alle weiteren Interaktionen bis zur Lösung der Eskalation unterbricht.
- Dank des Agentengedächtnisses kann sich der Agent bereits aufgelöste Eskalationen merken und diese wiederverwenden, was die Redundanz reduziert und die Effizienz verbessert.
Weitere Informationen dazu finden Sie unter Eskalationen und Gedächtnis des Agents.
Evaluieren und Testen des Agents
Mithilfe von Evaluierungen können Sie sicherstellen, dass sich Ihr Conversational Agent über verschiedene Dialogpfade hinweg zuverlässig verhält. Der Prozess ähnelt dem der Evaluierung eines autonomen Agents, ist jedoch für Dialoge entsprechend angepasst.
Im Ausgabebereich können Sie echte Gespräche simulieren. Wählen Sie In der Cloud testen, um den Agent in einer chatähnlichen Umgebung auszuführen und mit Ihrem Agent in natürlicher Sprache zu interagieren.
Ausführungsprotokolle in Echtzeit anzeigen
- LLM-Aufrufe und Antworten von Agents
- Toolaufrufe samt Argumente und endgültige Ausgaben
Testfälle hinzufügen
Sie können Testfälle direkt im Ausgabebereich hinzufügen, indem Sie nach einem Testlauf die Option Dem Evaluierungssatz hinzufügen wählen. Für das Gespräch wird ein Evaluierungstest mit Folgendem erstellt:
- Gesprächsverlauf: Eine Aufzeichnung der vorangegangenen Gesprächsrunden.
- Aktuelle Benutzernachricht: Die letzte Nachricht des Benutzers im Gespräch.
- Erwartete Antwort des Agents.
Auf diese Weise können Sie testen, wie gut der Agent den Kontext aufrechterhält und Nachfragen verarbeitet, was für ein gutes Gespräch unerlässlich ist.
Für jeden Evaluierungstest können Sie über die Oberfläche des Gesprächseditors den Gesprächsverlauf und den aktuellen Benutzerprompt bearbeiten. Über eine ähnliche Oberfläche können Sie zur Sicherstellung einer genauen Testvalidierung die erwartete Antwort des Agents definieren und optimieren.
Zugriff auf Convertional Agents
Nach der Veröffentlichung und Bereitstellung eines Conversational Agents können Sie über die Instanzverwaltung im Abschnitt „Agents“ von Automation Cloud damit interagieren.
Accessing agents in Microsoft Teams and Slack (Preview)
You can access conversational agents in Microsoft Teams and Slack. For details, refer to:
Einbetten von Konversationsagenten in UiPath Apps
Sie können einen Konversationsagenten mithilfe einer IFrame-Komponente auch direkt in eine UiPath App einbetten.
- Erstellen und veröffentlichen: Stellen Sie zunächst sicher, dass Ihr Konversationsagent erstellt und veröffentlicht wurde.
- IFrame hinzufügen: Öffnen Sie Ihre App in Studio und fügen Sie Ihrer Seite eine IFrame-Komponente hinzu.
- URL konfigurieren: Setzen Sie die Eigenschaft Quelle von IFrame auf eine URL, die im folgenden Format und mit folgenden Parametern erstellt wurde:
"https://<cloud_env>.uipath.com/<organization>/<tenant>/autopilotforeveryone_/conversational-agents/?agentId=<agent_id>&mode=embedded&title=<title>&welcomeTitle=<welcome_title>&welcomeDescription=<welcome_description>&suggestions=<suggestions>"Weitere Informationen dazu finden Sie in folgender Tabelle.
- App veröffentlichen: Veröffentlichen Sie Ihre App. Der Agent ist jetzt eingebettet und einsatzbereit!
| Parameter | Erforderlich | Beschreibung |
|---|---|---|
agentId | Ja | Die Version-ID des veröffentlichten Agenten. Um sie zu finden, gehen Sie zu Agents > Konversationsagenten, klicken Sie in Ihrem Agenten auf „Jetzt chatten“ und kopieren Sie die ID von der URL. |
mode | Nein |
Der Standardwert ist
fullscreen.
|
title | Nein | Der im Header der Chatkomponente angezeigte Titel. Standardmäßig der Name des Agenten. |
welcomeTitle | Nein | Ein Titel für den Willkommensbildschirm für die Erstausführung. Standardmäßig ein leerer String. |
welcomeDescription | Nein | Eine Beschreibung des Willkommensbildschirms für die Erstausführung. Standardmäßig ein leerer String. |
suggestions | Nein | Ein Array mit vorgeschlagenen Prompts für die Erstausführung für den Benutzer. Standardmäßig ein leeres Array []Hinweis:
|
showHistory | Nein | Ein Boolesch (true oder false), um die Sichtbarkeit des Bereichs „Chatverlauf“ zu steuern. Standardmäßig auf true.
|
| Funktion | Beschreibung |
|---|---|
| Benutzerprompt | Es sind keine Benutzerprompts erforderlich: Diese Agents sind nicht auf vordefinierte Prompts angewiesen, um Eingaben zu erfassen. Stattdessen verarbeiten sie Nachrichten in Echtzeit und reagieren entsprechend, eine Gesprächsrunde nach der anderen. |
| Data Manager | Data Manager ist derzeit deaktiviert. Da Ausgaben dynamisch während des gesamten Gesprächs vom Agenten ausgegeben werden, müssen keine Ausgabeargumente konfiguriert werden. Die Möglichkeit, Eingaben zu konfigurieren, d. h. allgemeine Parameter zur Initialisierung eines Gesprächs, wird in einer zukünftigen Version verfügbar sein. |
| Dateiuploads | Sie können während eines Gesprächs keine Dateien (z. B. PDFs, Bilder) in den Agenten hochladen.
Die Möglichkeit, Dateien hochzuladen, wird in einer zukünftigen Version verfügbar sein. |
| Automatisierung des lokalen Desktops | Der Agent kann keine Automatisierungen ausführen, die mit Ihrem lokalen Desktop interagieren (z. B. über Assistant). |
| Persönliche Verbindungen | Tools können nicht mit Ihren persönlichen Verbindungen zum Integration Service ausgeführt werden. Derzeit können nur freigegebene Verbindungen verwendet werden. |
| Toolbestätigung | Der Agent fragt nicht nach einer Bestätigung, bevor er ein Tool ausführt. |
| Sprachinteraktion |
Sie können nur über Textbefehle mit dem Agenten interagieren. Push-to-Talk- und Zwei-Wege-Sprachinteraktion werden in einer zukünftigen Version als Vorschau verfügbar sein. |
| Bewertung des Health Score von Agenten | Die Funktion „Agentenbewertung“ zur Evaluierung der Leistung ist noch nicht verfügbar. |
| Instanzverwaltung | Erweiterte Beobachtungsfunktionen zur Überwachung der Agentenleistung sind noch nicht verfügbar. |
| Benutzerfeedback | Sie können kein Feedback (z. B. Daumen hoch/runter) zu Antworten des Agenten geben. |
| SDKs | Headless- und UI-SDKs zur Einbettung von Agenten in externe Anwendungen von Drittanbietern sind noch nicht verfügbar. |
| Integrationen von Drittanbietern | Der Zugriff auf Konversationsagenten über Oberflächen wie Slack, Microsoft Teams oder MSFT Copilot ist noch nicht verfügbar. |
| Lizenzierung | Offizielle Lizenzierungsdetails werden für die allgemeine Verfügbarkeit finalisiert. |
Warum gibt es so viele Orchestrator-Aufträge für Conversational Agents?
Mit jedem Gespräch, das ein Benutzer mit einem Conversational Agent beginnt, wird ein neuer Orchestrator-Auftrag zur Bearbeitung dieser Sitzung erstellt. Diese Aufträge:
-
Bleiben bis zu acht Stunden Inaktivität aktiv.
-
Werden automatisch beendet, wenn in diesem Fenster keine weiteren Benutzereingaben mehr empfangen werden.
-
Minimieren Sie die Startzeiten, indem Sie die Agentensitzung während laufender Gespräche aktiv halten.
Dieses Verhalten stellt sicher, dass der Agent immer ohne Verzögerungen reagieren kann, während gleichzeitig die Ressourcennutzung in den Leerlaufzeiten optimiert wird.
Warum startet mein Conversational Agent nicht von der Instanzverwaltung aus
Wenn Ihr Conversational Agent nicht in der Instanzverwaltung gestartet wird, überprüfen Sie folgende Voraussetzungen:
-
Stellen Sie sicher, dass Sie dem Lösungsordner mit Ihrem Agent sowohl einen serverlosen als auch einen Unattended Robot zugewiesen haben.
-
Make sure you are in the correct tenant where your conversational agent solution resides.
-
Stellen Sie sicher, dass Ihr Mandant über genügend Robot Units verfügt, um die Ausführung zur Runtime zu unterstützen.
Ohne diese Ressourcen wird der Agent nicht initialisiert oder ausgeführt, wenn er von der Instanzverwaltung ausgelöst wird.