Aktivitäten
Neuestes
False
Bannerhintergrundbild
Document Understanding-Aktivitäten
Letzte Aktualisierung 10. April 2024

Extract Document Data

UiPath.IntelligentOCR.StudioWeb.Activities.ExtractDocumentDataWithDocumentData<UiPath.IntelligentOCR.StudioWeb.Activities.DataExtraction.ExtendedExtractionResultForDocumentData>

Extrahiert Daten aus einer Eingabedatei oder einem Dokumentdatenobjekt und speichert die Ergebnisse in einem Dokumentdatenobjekt (entweder das als Eingabe empfangene oder ein für die Eingabedatei neu erstelltes).

Hinweis:

Die Aktivität „Extract Document Data“ erfordert eine ihr vorangehende Aktivität, die ein Dokumentdatenobjekt bereitstellen kann (erzeugt als Ausgabe von anderen Document Understanding-Aktivitäten, z. B. Classify Document).

Die Aktivität „Extract Document Data“ erhält als Eingabe eine der folgenden Auswahlmöglichkeiten:
  • Dokumentdaten – aus der Aktivität „Classify Document“
  • Datei – aus den Aktivitäten „Get File/Folder“ oder „Get Newest Email“

Die unterstützten Sprachen für die generativen Modelle sind die gleichen wie die verwendete OCR-Engine. Weitere Informationen finden Sie auf der Seite Von der OCR unterstützte Sprachen .

Projektkompatibilität: plattformübergreifend

Eigenschaften

  • Projekt – Erfordert, dass Sie Ihr Document Understanding-Projekt aus dem Dropdownmenü auswählen. Die verfügbaren Optionen sind:
    • Vordefiniert – Das Standardprojekt
    • Sie können ein benutzerdefiniertes Projekt erstellen, indem Sie Document Understanding aufrufen.
  • Extraktor – Erfordert, dass Sie den Extraktor aus dem ausgewählten Projekt auswählen. Für das vordefinierte Projekt stehen die folgenden Optionen zur Verfügung:
    • Entweder eines der ML-Pakete, die Sie hierfinden
      Hinweis: Die Aktivität „Extract Document Data“ überschreibt den Dokumenttyp mit dem ausgewählten Extraktor. Dies gilt nicht für generative Modelle.
    • Generativ
  • Eingabeaufforderung – Dieses Feld wird angezeigt, wenn Sie die Option Generativ auswählen. Aufforderung zur Identifizierung der zu extrahierenden Felder, die als Schlüssel-Wert-Paare bereitgestellt werden, wobei der Schlüssel den Namen des Felds und der Wert eine Beschreibung des Felds darstellt, die dem Extraktor hilft, den entsprechenden Wert zu identifizieren. Klicken Sie auf das Feld, und Sie erhalten eine Eingabeaufforderung mit den folgenden Optionen, die paarweise bereitgestellt werden:
    • Feldname – Erfordert die Eingabe des zu extrahierenden Feldnamens (z. B. Fälligkeitsdatum) (maximal 30 Zeichen)
    • Generative Aufforderung – Erfordert, dass Sie die Aufforderung als Eingabe für den Generativen Extraktor bereitstellen. (Höchstens 500 Zeichen)
    Tipp: Bewährte Methoden für die Verwendung von generativen Eingabeaufforderungen finden Sie auf der Seite Generativer Extraktor – Bewährte Methoden.
  • Eingabe – Erfordert, dass Sie die Datei selbst oder Dokumentdaten angeben, falls Sie in Ihrem Workflow bereits andere Document Understanding-Aktivitäten verwendet haben (z. B. Classify Document).

Eingabe

  • Timeout (Sekunden) (Vorschau) – Maximale Ausführungszeit (in Sekunden) für den Aufruf des generativen Modells. Wenn der Vorgang dieses Timeout überschreitet, wird er automatisch beendet, um Verzögerungen oder Hängen zu vermeiden. Diese Eigenschaft wird nur angezeigt, wenn der Generative Extractor als Extraktor ausgewählt wird.
Ausgabe
  • Dokumentdaten – Alle extrahierten Felddaten aus der Datei. Informationen können auch von Classify Document empfangen werden.
    Bei Feldern mit mehreren Werten werden alle Werte unter Dokumentdaten zurückgegeben. Die Werte sind in DocumentData.Data.FieldName.MultiValues[] verfügbar. Wenn der MultiValues- Wert null ist, bedeutet dies, dass das jeweilige Feld kein Feld mit mehreren Werten ist. Wenn die Eigenschaft MultiValues ein Array ist (auch wenn sie leer ist []), bedeutet dies, dass das jeweilige Feld ein Feld mit mehreren Werten ist.
Hinweis: Die an den Generative Extractor gesendeten Daten werden an eine LLM-Modellinstanz gesendet, die nicht öffentlich verfügbar ist, werden nicht außerhalb von ihr verwendet und nach der Verarbeitung nicht gespeichert oder für Training verwendet.
Hinweis: Die Aktivität „Extract Document Data“ verwendet öffentliche Endpunkte.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
UiPath Logo weiß
Vertrauen und Sicherheit
© 2005-2024 UiPath. All rights reserved.