UiPath Documentation
activities
latest
false

Document Understanding-Aktivitäten

Letzte Aktualisierung 5. Mai 2026

Dokumentdaten

Dokumentdaten ist eine Ressource, die sowohl als Eingabe- als auch als Ausgabevariable in Ihren Document Understanding-Workflows dient. Das Objekt Dokumentdaten enthält alle erforderlichen Informationen zu einem einzelnen Dokument. Wenn Sie ein Dokument klassifizieren, enthält das Objekt den Dokumenttyp. Wenn Sie Daten extrahieren, enthält das Objekt die entsprechenden extrahierten Felder. Unabhängig von der Aktivität enthalten Dokumentdaten konsistent den Text des Dokuments und das DOM (Dokumentobjektmodell).

Mit Dokumentdaten können Sie: Alle erforderlichen Informationen zu einem Dokument in einer Variablen sammeln, Daten zu jeder Eigenschaft des Objekts speichern und für andere Aktivitäten im Workflow wiederverwenden.

Dokumentdaten enthält Informationen zu den folgenden Attributen:

  • Dokumenttyp: Stellt Daten über den identifizierten Dokumenttyp bereit, der von Aktivitäten wie Classify Document oder Create Classification Validation Task aufgefüllt wird.
  • Daten: Enthält die extrahierten Feldwerte. Sie wird bei Bedarf von der Eigenschaft Daten generieren generiert, die einen Ausgabetyp vom IDocumentData<ExtractorType> generiert. Wenn die Eigenschaft Daten generieren auf False festgelegt ist, können Sie nur über Methoden des Typs Get auf die extrahierten Feldwerte zugreifen.
  • Dateidetails: Enthält Details zur IResource.
    Hinweis:

    IResource ist ein universeller Anzeiger, der Daten findet und darauf zugreift, die in Ihren plattformübergreifenden Workflows verwendet werden. IResource fungiert als Container, der Verweise auf lokale (z. B. lokale Dateien) oder externe Daten (z. B. Cloud-Dateien speichert, die nicht nur in Ihrem aktuellen Workflow gespeichert werden. Diese Daten können aus verschiedenen Quellen stammen. Weitere Informationen zu IResource und den verfügbar gemachten Eigenschaften finden Sie unter Verwenden von Datei- und Ordnerressourcen.

  • Unterdokumente: Enthält eine Sammlung von Dokumentdaten, die von Aktivitäten wie Create Classification Validation Task aufgefüllt werden.
  • Dokumentmetadaten: Enthält Informationen über die Verarbeitung des Dokuments, z. B.:
    • Text in Sprache erkannt
    • Extrahierte Felder als Datentabelle
    • Dokumentobjektmodell (DOM): Enthält das Dokumentobjektmodell, das von allen Aktivitäten verwendet wird. Die Dokumentmetadaten werden von der Aktivität aktualisiert, die das Dokument zuerst verarbeitet. Sobald sie aufgefüllt wurden, werden die Metadaten von allen nachfolgenden Aktivitäten freigegeben und verwendet, die das Dokumentdatenobjekt erhalten.
      Tipp:

      Wenn eine Aktivität nicht die erste Document Understanding-Aktivität ist, die Teil eines Studio-Workflows ist, verwenden Sie Dokumentdaten als Eingabe. Verwenden Sie die Variable Datei nur dann als Eingabe, wenn die Aktivität der erste Document Understanding-Teil eines Studio Workflows ist.

Verstehen und Zugreifen auf Daten

Die Dokumentdaten enthalten detaillierte Informationen zu den Extraktionsergebnissen. Die Daten können von zwei Arten sein, je nachdem, ob Sie sie bei Bedarf generieren, sodass Sie sie in Ihrem Workflow weiter verwenden können, oder ob sie nicht generiert werden sollen, sodass Sie get und set -Methoden damit ausführen können für erweiterte Implementierungen, um die Flexibilität zu erhöhen.

Mit der Eigenschaft Datentyp generieren in der Aktivität Extract Document Data können Sie auswählen, ob Sie die Daten bei Bedarf generieren oder nicht. Dazu gibt es folgende Szenarien:

  • Wenn Sie Datentyp generieren auf True (Standardeinstellung) festlegen: Dokumentdaten werden als IDocumentData<ExtractorType> ausgegeben. Diese Daten werden bei Bedarf und Änderungen generiert, die auf Änderungen in der Aktivität „Extract Document Data“ vorgenommen werden. Mit dieser Einstellung können Sie den Dokumenttyp in der Validation Station nicht ändern und JIT (Just-in-Time) wird standardmäßig ausgewählt.
  • Wenn Sie Datentyp generieren auf False festlegen: Dokumentdatenausgaben als IDocumentData<DictionaryData>. Mit dieser Einstellung wird die Eigenschaft Dokumentdaten nicht mehr generiert und Sie können sie nicht durchsuchen. Sie können je nach Feld-ID mit bestimmten Methoden auf die Daten zugreifen. Diese IDs werden beim Konfigurieren des Dokumenttyps oder beim Abrufen der Informationen über APIs verfügbar. Weitere Informationen finden Sie unter Bearbeiten oder Hinzufügen neuer Felder und Abrufen der Extraktionsanforderung-API .
    • Wenn Sie Datentyp generieren für die generative Extraktion auf False festlegen, entsprechen die abgerufenen Felder den in der Eingabeaufforderung angegebenen Namen. Wenn der Feldname in der Eingabeaufforderung beispielsweise als a b c ( einschließlich der Leerzeichen) definiert ist, sollten Sie den gleichen Namen wie die Feld-ID verwenden, wenn Sie die spezifischen Methoden verwenden.

Übergeben von Dokumentdaten an Aktivitäten

Wenn Sie Dokumentdaten verwenden, wird das erste Ausgabeobjekt aus Ihrer Eingabedatei erstellt. Nachdem Sie dieses Objekt erstellt haben, empfehlen wir Ihnen, es an Ihre nächsten Aktivitäten weiterzugeben. Wenn Sie es an Ihre nächsten Aktivitäten übergeben, können Sie den Text und das DOM aus Ihrer ursprünglichen Datei wiederverwenden. Dieser Ansatz erspart Ihnen jedes Mal die Datei neu zu digitalisieren.

Verbrauchen der Extraktionsergebnisse für Felder mit einem oder mehreren Werten

Wenn Sie ein Dokumenttypfeld so konfigurieren, dass es einen Mehrfachwert hat, erwartet das System mehrere Werte. Ein Beispiel könnte eine Multiple-Choice-Frage in einem Formular sein. Die Ergebnisse werden im Mehrfachwertattribut im Feld angezeigt und als Liste zurückgegeben. Wenn das Dokumenttypfeld als Einzelwert konfiguriert ist, gibt das System standardmäßig das Ergebnis im Wertattribut des Felds zurück.

Die folgende Tabelle zeigt Ihnen, wie Dokumentdaten Felder mit einem und mehreren Werten zurückgibt:

Tabelle 1. Die von Dokumentdaten für Felder mit einem und mehreren Werten zurückgegebenen Werte

hat keinen WertHat einen WertHat zwei oder mehr WerteDocumentData.Data.FieldName.ValueDocumentData.Data.FieldName.MultiValues
EinzelwertJaNeinKeine Angabe""null
EinzelwertNeinJaKeine Angabenull
MehrfachwertJaNeinNein""[] (leeres Array)
MehrfachwertNeinJaNein[<Array mit einem Wert, der identisch mit .Value>] ist
MehrfachwertNeinNeinJa[<Array mit n Werten, wobei der erste Wert identisch mit dem .Value>] ist

Zurückgeben extrahierter Felder als Datentabelle

Sie können die Felder, die Sie aus einem Dokument extrahiert haben, als Datentabelle zurückgeben, indem Sie das Dokumentdatenobjekt verwenden. Anschließend können Sie die Variable Datentabelle in Excel-Aktivitäten verwenden .

Um die extrahierten Felder als Datentabelle zurückzugeben, wählen Sie die Ausgabe ResultsAsDatatable für die Aktivität Extract Document Data .

Eigenschaften

Die Eigenschaften der Dokumentdatenvariablen können von einer oder mehreren Aktivitäten gefüllt und abgerufen werden. Je nach Aktivität, die die Variable füllt, können sich die Eigenschaften unterscheiden. Überprüfen Sie Folgendes:

  • Dokumenttyp – Die Aktivität Classify Document gibt die folgenden Werte an:
    • AnzeigeName (wird für benutzerdefinierte Modelle verwendet): Name des Dokumenttyps.
    • ID (wird für vorgefertigte Modelle verwendet): Name des Dokumenttyps.
    • Konfidenz: Klassifizierungskonfidenz.
    • URL: URL, über die der Zugriff auf den Dokumenttyp möglich ist Dies kann entweder benutzerdefiniert oder vordefiniert sein und wird über das jeweilige Projekt im Document Understanding-Center referenziert.
  • In die Felder Extract Document Data, Create Validation Task, Create Validation Task and Wait, Wait for Validation Task and Resume werden folgende Werte eingetragen:
    • Feldwert – Extraktionswert des Felds.
    • Extraktionskonfidenzwert: Konfidenzwert der Extraktion, wie vom Modell bereitgestellt.
    • OCR-Konfidenzbewertung: Konfidenzbewertung, die vom OCR-Modul bereitgestellt wird.
  • Dateidetails – Aktivitäten, die das Dokumentdatenobjekt erstellen, eine Datei als Eingabe empfangen und die folgenden Werte auffüllen:
    • Vollständiger Name: Der vollständige Name der Datei.
    • Erweiterung: Erweiterung der Datei.
    • Seitenbereich: Seitenbereich der Datei.
  • Unterdokumente: Sammlung von Dokumentdaten, die von der Aktivität Classify Document aufgefüllt werden.
    Hinweis:

    Dieser Bereich ist derzeit noch nicht ausgefüllt und wird in Zukunft zusammen mit der Klassifizierungsvalidierung und den Aufteilungsfunktionen hinzugefügt werden.

  • Dokumentmetadaten:
    • DOM: Das Dokumentobjektmodell, das von allen Aktivitäten verwendet wird. (Aufgefüllt durch Aktivitäten, die das Dokumentdatenobjekt erstellen und eine Datei als Eingabe erhalten.)
    • Text: Der gesamte extrahierte Text. (Aufgefüllt durch Aktivitäten, die das Dokumentdatenobjekt erstellen und eine Datei als Eingabe erhalten.)
    • Sprache: Die im Dokument erkannte Sprache. (Aufgefüllt durch Aktivitäten, die das Dokumentdatenobjekt erstellen und eine Datei als Eingabe erhalten.)
    • Aufteilungskonfidenz: Wenn das Dokument aufgeteilt wird, wird das Dokument vom Aufteilungsmodell zurückgegeben. (Aufgefüllt von der Aktivität Classify Document )
      Hinweis:

      Dieser Bereich ist derzeit noch nicht ausgefüllt und wird in Zukunft zusammen mit der Klassifizierungsvalidierung und den Aufteilungsfunktionen hinzugefügt werden.

    • Ergebnisse als Datentabellen: Felder, die als Datentabelle exportiert werden. (Aufgefüllt von der Aktivität Extract Document Data ).

War diese Seite hilfreich?

Verbinden

Benötigen Sie Hilfe? Support

Möchten Sie lernen? UiPath Academy

Haben Sie Fragen? UiPath-Forum

Auf dem neuesten Stand bleiben