activities
latest
false
Wichtig :
Bitte beachten Sie, dass dieser Inhalt teilweise mithilfe von maschineller Übersetzung lokalisiert wurde. Die Connector-Pakete, die in Integration Service verfügbar sind, werden maschinell übersetzt.
Aktivitäten für Integration Services
Last updated 8. Okt. 2024

PREVIEW
Indexieren und Erfassen (öffentliche Vorschau)

Beschreibung

Indexieren und Erfassen von Daten aus Datenquellen, um Einbettungen zur Unterstützung der Retrieval Erweiterte Generation (RAG) innerhalb von UiPath GenAI-Aktivitäten zu erstellen.

Projektkompatibilität

Windows | Plattformübergreifend

Konfiguration

  • Verbindungs-ID – Die im Integration Service hergestellte Verbindung. Greifen Sie auf das Dropdownmenü zu, um Verbindungen auszuwählen, hinzuzufügen oder zu verwalten.

  • Orchestrator-Ordner – Der Orchestrator-Ordner, der Daten enthält, die Sie mit Kontextgrundlage abfragen möchten. Dies muss ein freigegebener Ordner sein. Suchen Sie anhand des Namens, oder wählen Sie ihn aus der Dropdownliste der verfügbaren/berechtigten Orchestrator-Ordner in diesem Mandanten aus. Dieses Feld unterstützt die Eingabe vom Typ String .
  • Orchestrator-Bucket – Der Orchestrator-Bucket im freigegebenen Ordner. Suchen Sie anhand des Namens oder wählen Sie ihn aus der Dropdownliste aus den Buckets in diesem Ordner aus. Dieses Feld wird angezeigt, nachdem Sie den Orchestrator-Ordner ausgewählt haben. Dieses Feld unterstützt die Eingabe vom Typ String .
  • Indexname – Wenn Sie zuvor einen Index erstellt haben, wählen Sie eine aus den verfügbaren Optionen in der Dropdownliste aus. Wenn nicht, erstellen Sie einen neuen Index. Dieses Feld unterstützt die Eingabe vom Typ String .
  • Datentyp – Definieren Sie den spezifischen Datentyp im Orchestrator-Bucket, der erfasst wird: PDF, JSON oder CSV. Es kann jeweils nur ein Dateityp erfasst werden. Wenn Sie mehrere Typen haben, führen Sie die Aktivität each für jeden Dateityp aus.
  • Datei-Glob-Muster – Definieren Sie dies so, dass es mit der Datei im Feld Datentyp übereinstimmt, wenn Sie mehrere Datentypen im selben Orchestrator-Bucket haben, den Sie erfassen möchten. Auswählen:
    • *. – wenn Sie den gleichen Dateityp wie die vorherige Anforderung erfassen.
    • *.pdf - für PDF-Dateien.
    • *.csv - für CSV-Dateien.
    • *.json - für JSONs.
Zusätzliche Eigenschaften
Ausgabe
  • Index-ID – Der eindeutige Bezeichner für das bei der Indizierung verwendete Schema.
  • Datenquellen-ID – Ein eindeutiger Bezeichner für die Datenquelle.
  • Index und Erfassung (Index and Ingest ) - Automatisch generierte Ausgabevariable.

Verwendung von Index und Erfassung

Mit der Aktivität Index and Ingest werden Ihre Datasets zur Laufzeit für Abfragen und Abrufen von erweiterten Generationen (RAG) durch LLMs verfügbar. Beachten Sie, dass Orchestrator-Buckets und -Indizes separate Entitäten sind. Kontextgrundlage verwendet Orchestrator-Buckets, in denen Sie Dateien hochladen und speichern können, um Indizes zu erstellen. Auf diese Indizes kann dann verwiesen werden, wenn nach semantisch ähnlichem Kontext zum Einfügen in einen LLM-Eingabeaufforderung gesucht wird.

  • Index: Erstellen Sie in der UiPath-verwalteten Vektordatenbank einen organisierten Speicherort (z. B. einen Ordner), an dem Einbettungen gespeichert und zur Laufzeit referenziert werden.
  • Erfassen: Konvertieren von in Orchestrator-Buckets gespeicherten Geschäftsdaten in repräsentative Einbettungen; Vektoren, die mit Ergebnissen durchsucht werden können, die für LLMs gut verständlich sind.

Um Index und Erfassung zu verwenden, müssen Sie Daten über einen direkten Upload, eine API oder eine Aktivität in freigegebene UiPath Orchestrator-Buckets hochladen. Die Aktivität verwendet diese Daten zu:

  • Erstellen Sie neue Indizes (z. B gerade die ersten Schritte sind, neue Daten hinzufügen, die Sie in verschiedenen Ordnern organisieren möchten).
  • Daten erneut erfassen und indizieren (z. B Sicherstellen, dass Sie die relevantesten Ergebnisse erhalten; Löschen eines Datasets, Hinzufügen neuer Datasets).
Tabelle 1. Terminologie
BegriffDefinition
Orchestrator-OrdnerAllgemeiner Speicher für Daten, die in der UiPath-Plattform verwendet werden sollen.
Orchestrator-BucketDer spezifische Speicherort der Daten innerhalb des Ordners, für den Sie einen Index erstellen möchten. In der Regel gibt es eine 1:1-Beziehung zwischen Buckets und Indizes.
IndexnameDer eindeutige Name des Indexes, den Sie erstellen oder aktualisieren möchten.

Nach der Erstellung wird dies in der Dropdownliste für das Feld Indexname in der Aktivität Index und Erfassung und in der Dropdownliste für das Feld Index in der Aktivität Inhaltsgenerierung angezeigt.

Es wird empfohlen, diese Aktivität asynchron zu verwenden, falls sie zusätzliche Zeit in Anspruch nimmt. Auf diese Weise können Aktionen zum Erstellen/Aufzeichnen/Aktualisieren/Löschen effektiv verwaltet werden und potenzielle Fehler wirken sich nicht auf nachgelagerte Aktivitäten aus. Sie können dies mit einem separaten Prozess oder einer Delay- Aktivität innerhalb desselben Prozesses erreichen. Verwenden Sie für optimale Ergebnisse zwei separate Prozesse.

Weitere Informationen finden Sie unter Verwalten der Erfassungspipeline.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten