- Erste Schritte
- UiPath Agents in Studio Web
- Codierte UiPath Agents

Benutzerhandbuch zu Agents
UiPath-Agents verfügen über integrierte Tools, vordefinierte, einsatzbereite Komponenten, die keine benutzerdefinierte Entwicklung oder externe Konfiguration erfordern.
Mit dem Tool Anhänge analysieren können Agents mithilfe von LLMs Dateiinhalte verarbeiten und Schlussfolgerungen ziehen.
Folgende Dateitypen werden derzeit unterstützt: GIF, JPE, JPEG, PDF, PNG, WEBP.
Um dieses Tool Ihrem Agent hinzuzufügen, führen Sie folgende Schritte aus:
-
Definieren Sie Dateieingaben. Fügen Sie im Bereich Data Manager Ihrem Agentschema für Dateieingaben Argumente hinzu. Diese sollten vom Typ
Filesein.Abbildung 1. Erstellen von Dateieingabeargumenten
- Fügen Sie das Tool Anhänge analysieren hinzu:
- Wählen Sie im Bereich Tools die Option Tool hinzufügen aus.
- Wählen Sie in der Kategorie Integrierte Tools die Option Anhänge analysieren aus.
- Aktualisieren Sie optional den Namen und die Beschreibung des Tools, damit der Agent besser darüber nachdenken kann, wann er es verwenden sollte.
-
Grundlegendes zu den Eingaben des Tools. Das Tool wird mit zwei Haupteingaben vorkonfiguriert:
-
attachments(Array): Liste einer oder mehrerer zu analysierender Dateien. -
analysisTask(Zeichenfolge): Ein Prompt oder eine Anweisung, die die Aufgabe beschreibt. Wenn Ihr Anwendungsfall nur eine Datei umfasst, können Sie die Eingabebeschreibung aktualisieren, um zu erkennen, dass es sich um einen einzigen Anhang handelt.
-
- Führen Sie den Agent mit Eingabedateien aus.
- Öffnen Sie das Fenster Debug-Konfiguration :
- Navigieren Sie zur Registerkarte Projektargumente .
- Geben Sie einen Wert für
analysisTask, z. B. „Vergleichen Sie die beiden Bilder“ an. - Laden Sie Ihre Eingabedateien in die an Ihr
attachmentsArgument gebundenen Felder hoch.
- Klicken Sie auf Speichern und führen Sie die Debug-Sitzung aus.
- Öffnen Sie das Fenster Debug-Konfiguration :
- Überprüfen Sie nach der Ausführung des Agents die Ausführungsablaufverfolgung über den unteren Bereich.
Abbildung 2. Analyse im Ausführungspfad
Anhangablaufverfolgungen
Bei Verwendung des Tools Anhänge analysieren werden alle Dateieingaben und -ausgaben im Bereich Ausführungspfad auf der Registerkarte Verlauf erfasst. Die Ablaufverfolgung bietet einen detaillierten Überblick darüber, wie Anhänge während der Ausführung des Agents verarbeitet wurden.
Für jede Datei zeigt die Ablaufverfolgung Folgendes an:
- ID: Ein eindeutiger Bezeichner für den Anhang.
-
Name: Ursprünglicher Dateiname (z. B.
1.jpg). -
MIME-Typ: Erkannter Dateityp (z. B.
image/jpeg). - Download-URL: Ein direkter Link zum Herunterladen der Datei zur Überprüfung oder Wiederverwendung. In der Ablaufverfolgung angezeigte Downloadlinks haben derzeit eine Gültigkeitsdauer von 30 Minuten.
Bewährte Methoden und FAQ
Mit dem Tool Anhänge analysieren können Agents mithilfe von LLMs Dokumente und Bilder verarbeiten. Trotz ihrer Leistungsfähigkeit gibt es einige wichtige Einschränkungen und Verhaltensweisen, die beim Entwerfen von dateigesteuerten Agents berücksichtigt werden müssen.
Große Dateien können die Tokenlimits überschreiten
Agents verarbeiten Dateien, indem sie deren Inhalt in LLM-Prompts einbetten, die durch das Tokenlimit des Modells eingeschränkt sind. Große PDFs oder gescannte Bilddokumente können im Hintergrund fehlschlagen oder unbestimmte Fehler wie „Ein Fehler ist aufgetreten“ zurückgeben, insbesondere wenn sie das Tokenlimit des Modells überschreiten.
-
Verwenden Sie Modelle mit höherer Tokenkapazität.
-
Verwenden Sie die Kontextgrundlage anstelle der vollständigen Dateieinbettung, insbesondere für große oder mehrseitige Dateien.
-
Sie können Dokumente vorindizieren und sie vor oder während der Ausführung des Agents über benutzerdefinierte Tools synchronisieren.
LLMs ändern die Größe von Bildern
.jpg, .png) als Teil des LLM-Prompts gesendet werden, ändern die meisten Modelle automatisch ihre Größe. Dadurch können Seitenverhältnisse verzerrt oder pixelgenaue Daten verloren gehen.
Vermeiden Sie Prompts, die auf genauen Koordinaten, Begrenzungsrahmen oder auf Pixel ausgerichteten Vergleichen basieren (z. B. Bildunterschiede, die eine bestimmte x/y-Positionierung erfordern). Weitere Informationen zum modellspezifischen Verhalten bei der Größenänderung finden Sie im Leitfaden zur Bildverarbeitung und -analyse von OpenAI.
Unterstützte Dateitypen
Folgende Dateierweiterungen werden unterstützt: GIF, JPE, JPEG, PDF, PNG, WEBP.
Die Unterstützung des Dateityps variiert je nach LLM-Anbieter. Zum Beispiel kann die PDF-Unterstützung bei einigen Anthropic-Modellen je nach Dateiname oder Codierung fehlschlagen.
Tipps für bessere Ergebnisse
- Wenn Sie mit langen PDF-Dateien arbeiten, sollten Sie sie in kleinere Teile oder Seiten aufteilen, bevor Sie sie an den Agent übergeben.
- Dateinamen müssen fehlerfrei sein: Insbesondere anthropische Modelle lehnen Dateinamen mit Sonderzeichen oder wiederholten Leerzeichen ab.
- Halten Sie die Anzahl der Bilder niedrig: Einige Modelle wie GPT-4o unterstützen maximal 10 bis 50 Bilder pro Anforderung.