activities
latest
false
Aktivitäten für Integration Services
Last updated 21. Okt. 2024

Best Practices

Dieser Abschnitt enthält Informationen zur effektiven Nutzung der Kontexterschließung .

Erste Schritte

Führen Sie zuerst die folgenden Schritte aus, um Kontextgrundlage zu verwenden:

  1. Stellen Sie sicher, dass Sie die Version 2024.4 oder höher von Studio Web oder Studio Desktop verwenden.
  2. Stellen Sie in der Automation Cloud im Integration Service eine Verbindung mit dem UiPath GenAI-Aktivitäten -Connector her.

Wie Kontexterstellung mit Ihren Daten in den GenAI-Aktivitäten interagiert

Um die Kontexterstellung zu verwenden, benötigen Sie ein Dataset (z. B. eine Gruppe von Dokumenten). Dann kann die Kontexterschließung in drei Phasen mit Ihren Daten interagieren:

  1. Legen Sie Ihre Datenquelle für die Kontexterschließung fest.
    • Verwenden Sie eine Automatisierung, oder laden Sie Dateien direkt in einen Orchestrator-Bucket in einem freigegebenen Orchestrator-Ordner hoch. Der Orchestrator-Ordner muss freigegeben werden, da Kontextgrundlage ein Mandanten-Scope ist.
    • Sie müssen über Bearbeitungsberechtigungen für diesen Ordner verfügen, um sicherzustellen, dass Sie Dokumente aus dem Bucket hochladen oder aus dem Bucket entfernen können. Es sind keine zusätzlichen Berechtigungen erforderlich.
  2. Erfassen Sie Daten aus Ihrer Datenquelle in Kontextgrundlage.
  3. Abfragen und Verbindungsaufforderungen mit Ihren Daten.
    • Nutzen Sie die Inhaltsgenerierung , um Dokumente abzufragen und Informationen zu verwenden, um Eingabeaufforderungen zu erweitern oder zu begründen.

Verwalten der Erfassungspipeline

Kontexterstellung im AI Trust Layer

In UiPath® Automation CloudTM -Administrator können Sie als Teil der AI Trust Layer-Administratorumgebung die Daten verwalten und steuern, die Sie als Kontext mit UiPath GenAI-Funktionen verwenden.

Sie können Kontexterstellungsindizes erstellen und verwalten, die für bestimmte Mandanten verfügbar sind. Nach der Erstellung können Sie einen Index von anderen Produkten und Funktionen mithilfe von GenAI abfragen, z. B. GenAI-Aktivitäten und Autopilot for Everyone.

Unter Steuern von Kontextdaten für GenAI-Funktionen im Automation Cloud-Administrator-Benutzerhandbuch erfahren Sie, wie Sie einen Index erstellen und verwalten.

Index und Erfassung der GenAI-Aktivität

Die Aktivität Index und Erfassung (öffentliche Vorschau) bietet einen asynchronen Mechanismus zum Erfassen von Dokumenten, die in Orchestrator-Buckets hochgeladen und gespeichert werden.

In der Aktivität „Index und Erfassung (öffentliche Vorschau) “ unter „ Zusätzliche Eigenschaften“ können Sie im Dropdownfeld „Datentyp“ den Dateityp angeben, den Sie erfassen möchten:

  • PDF – zum Erfassen von PDF-Dateien (Standardauswahl).
  • CSV – zum Erfassen von CSV-Dateien.
  • JSON – zum Erfassen von JSON-Dateien.

Wenn Sie Ihrem Orchestrator-Bucket weitere Dateien hinzufügen, müssen Sie diese Aktivität erneut ausführen, um sicherzustellen, dass der Index auf dem neuesten Stand bleibt.

Das Feld Datei-Globmuster ist auf den Dateityp ausgerichtet, den Sie als Datentyp festlegen:

  • Wenn Sie einen Datentyp in Ihrem Orchestrator-Bucket haben (z. B alle PDFs), wählen Sie PDF aus der Dropdownliste Datentyp aus und behalten Sie den Standardwert Datei -Globmuster als *. bei.
  • Wenn Sie mehrere Dateitypen in Ihrem Orchestrator-Bucket haben, müssen Sie sowohl in der Dropdownliste Datentyp als auch im Datei-Glob-Muster die Datentypen angeben, die erfasst werden sollen. Die Muster sind mit dem Datentyp identisch. Wir geben den Unterschied an, um die Erfassungsanforderung zu verdeutlichen:
    • *.pdf für PDF-Dateien.
    • *.csv für CSV-Dateien.
    • *.json für JSON-Objekte.
Beispiel: Wenn Sie PDFs in Ihren Orchestrator-Bucket hochladen, müssen Sie Index und Erfassung (öffentliche Vorschau) mit Ihrem Index ausführen, Datentyp auf PDF festgelegt und Datei-Globmuster auf *. festgelegt. Als Nächstes laden Sie CSV-Dateien in denselben Orchestrator-Bucket hoch. Sie müssen Index und Erfassung (öffentliche Vorschau) erneut ausführen, denselben Index auswählen, aber das Feld Datentyp auf CSV und Datei-Globmuster auf *.CSV festlegen.

Verwenden Sie ein ähnliches Muster, wenn Sie Dokumente aus Ihrer Datenquelle entfernen: Wenn Sie über Index und Erfassung (öffentliche Vorschau) erneut erfassen, müssen Sie den Datentyp und Datei-Glob angeben, um sicherzustellen, dass die Erfassung erkennt, dass dieser Dokumenttyp aus dem Index entfernt wird .

Hinweis: Die Erfassung und erneute Erfassung von CSV-Dateien kann etwas länger dauern als bei anderen Datentypen.

Nachdem Sie einen Index erstellt haben, können Aktivitäten und andere UiPath-Produkte diesen zur Abfrage von Dokumenten verwenden, die für Ihren Anwendungsfall wichtig sind.

Erfassungszeit

Die Aufnahme ist ein asynchroner Prozess. Nachdem Sie die Aktivität ausgeführt haben, bedeutet das nicht, dass die Daten sofort abgefragt werden können. Kleinere Erfassungsnutzlasten werden schneller verarbeitet. Daher empfehlen wir, Dokumente in Batches hochzuladen und diese Aktivität regelmäßig auszuführen. Die Dauer dieses Prozesses hängt von der Datenmenge und davon ab, wie viele andere Benutzer Erfassungsanforderungen einreichen.

Nach dem Senden der Erfassungsanforderung, unter der Annahme, dass jedes Dokument kleiner oder gleich 1 MB ist, empfehlen wir in der Regel zu warten:

  • <10 Minuten: für höchstens 10 Dokumente;
  • <30 Minuten: für höchstens 50 Dokumente;
  • Bis zu 2 Stunden: für 50 Dokumente oder mehr.
Hinweis: Dies sind keine SLAs oder SLOs. Die Leistung hängt von der Art der Dokumente, der Größe und der Anzahl der gleichzeitigen Anforderungen ab.

Führen Sie die Aktivität Index und Erfassung (öffentliche Vorschau) jedes Mal aus, wenn Sie Daten zu Ihrer Datenquelle hinzufügen oder aus ihr löschen. Dies gewährleistet die Parität mit Ihrer Datenquelle und den für die Suche und RAG verwendeten Einbettungen.

Der Indexname wird möglicherweise nicht in der Aktivität Content Generierung angezeigt, bevor die Erfassung abgeschlossen ist. Wenn Sie den Indexnamen in der Aktivität zur Generierung des Inhalts nicht finden können:

Wenn Sie nach dem Ausführen der Aktivität Index und Erfassung (öffentliche Vorschau) einen vorhandenen Index verwenden, wählen Sie das Schaltflächenmenü Aktualisierung erzwingen neben dem Feld Index aus:

docs image

Gängige Fehler und Lösungsmuster

  • Sie erhalten möglicherweise einen Fehler („Keine Ergebnisse gefunden“), wenn der Erfassungsauftrag nicht abgeschlossen wurde.
  • Sie erhalten möglicherweise einen Fehler („Kein Schema gefunden“), wenn der Erfassungsauftrag fehlgeschlagen ist. Warten Sie in diesem Fall einige Minuten, wiederholen Sie die Abfrage und wiederholen Sie die Erfassung.
  • Möglicherweise wird ein Fehler („Datenquellensynchronisierung bereits in Bearbeitung“) angezeigt, der bedeutet, dass Sie einen Erfassungsauftrag für diesen Index haben, der derzeit ausgeführt wird. Warten Sie einige Minuten, und versuchen Sie die Erfassung erneut.

Sie können die Aktivität Index und Erfassung (öffentliche Vorschau) ausführen:

  • Manuell (dringend empfohlen).
  • Ereignisbasiert: Richten Sie eine Automatisierung ein, um die Erfassungspipeline jedes Mal auszuführen, wenn ein neues Dokument zu einem Speicher-Bucket hinzugefügt oder aus ihm entfernt wird. Tun Sie dies, wenn Sie regelmäßig Dokumente aus Buckets hinzufügen oder aus ihnen entfernen.
  • Zeitbasiert: Richten Sie eine Automatisierung ein, um die Erfassungspipeline geplant auszuführen. Tun Sie dies, wenn Sie regelmäßig ein hohes Volumen an Zu-/Abfluss von Dokumenten erwarten. Damit Trigger für diese Aktivitäten erstellt werden können, sollten Sie berücksichtigen, dass vorherige Anweisungen zur Erfassung ein asynchroner Prozess sind.

Delete Index

Verwenden Sie die Aktivität Delete Index (Öffentliche Vorschau) , wenn Sie den Index und die Einbettungen löschen möchten. Entfernen Sie diese als Datenquelle, die von anderen UiPath GenAI-Aktivitätsumgebungen abgefragt werden kann. Die Dokumente oder Daten in der Datenquelle werden dadurch nicht gelöscht (z. B Orchestrator-Buckets).

Tipp: Für die Aktivitäten Index und Ingest (öffentliche Vorschau) sowie Index löschen (öffentliche Vorschau) empfehlen wir die Verwendung eines separaten Studio-Projekts, um sie separat von der Aktivität zur Inhaltsgenerierung (Abfrage/RAG) auszuführen. Auf diese Weise kann der asynchrone Erfassungs-/Löschprozess erfolgen.

Abfragen und RAG mit Kontextgrundlage

Die Aktivität Inhaltsgenerierung bietet zwei Optionen für die Arbeit mit Dokumenten: Dateiressource und Vorhandener Index.

Dateiressource

Mit der Option Dateiressource können Sie Dateivariablen aus vorherigen Aktivitäten verwenden (z. B. ein aus Google Drive heruntergeladenes Dokument) und Kontextgrundlage eine Just-in-Time-RPG (JIT) ausführen lassen. Das bedeutet, dass sie das Dokument in einen Index aufnimmt, es durchsucht, die Eingabeaufforderung erweitert und dann den Index löscht, sodass diese Daten nicht persistent sind.

Hinweis:
  • Die Option Dateiressource unterstützt derzeit nur das PDF-Format.
  • Halten Sie diese Dokumente kleiner (unter 50 Seiten). Integration Service-Aktivitäten haben ein Timeout-Fenster, in dem die gesamte oben genannte Verarbeitung erfolgen muss.

  • Wenn Sie eine PDF-Datei mit gescannten Bildern haben, empfehlen wir, die Option Document Understanding OCR in der Aktivität Extract Data zu verwenden, nachdem Sie eine Datei heruntergeladen haben, um den Text aus diesen Bildern zu extrahieren (da Kontextgrundlage noch keine Bilder unterstützt). Übergeben Sie die extracted_data -Ausgabe an die Eingabeaufforderung, wobei die Dateiressource auf Ihre heruntergeladene Datei verweist.

Vorhandener Index

Mit der Option Vorhandener Index können Sie einen Index verwenden, den Sie mit der Aktivität Index und Erfassung (Öffentliche Vorschau) erstellt haben. Sie fragen über einen persistenten Index ab, in den Sie Dokumente aus Ihrer Datenquelle aufgenommen haben. Sie können diesen Index so oft wiederverwenden, bis Sie ihn löschen.

Wir empfehlen, die Aktivität Log Message nach der Inhaltsgenerierung in Ihrer Workflow-Sequence zu verwenden, um die Variable Top generierter Text einzugeben und die Antwort der LLM-Generierung nach der Ausführung des Workflows einzusehen.

Die Aktivität Inhaltsgenerierung hat auch eine Ausgabevariable namens Cities String (Public Preview). Verwenden Sie sie als Eingabe in einer Log Message -Aktivität, um die semantischen Suchergebnisse anzuzeigen, mit denen die Generierungsausgabe beeinflusst wird. Dies funktioniert nur für die PDF- und JSON-Datentypen.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten