Aktivitäten
Neuestes
False
Bannerhintergrundbild
Document Understanding-Aktivitäten
Letzte Aktualisierung 29. Apr. 2024

Dokumentdaten

Dokumentdaten ist eine Ressource, die sowohl als Eingabe- als auch als Ausgabevariable in Ihren Document Understanding-Workflows dient. Das Objekt Dokumentdaten enthält alle erforderlichen Informationen zu einem einzelnen Dokument. Wenn Sie ein Dokument klassifizieren, enthält das Objekt den Dokumenttyp. Wenn Sie Daten extrahieren, enthält das Objekt die entsprechenden extrahierten Felder. Unabhängig von der Aktivität enthalten Dokumentdaten konsistent den Text des Dokuments und das DOM (Dokumentobjektmodell).

Mit Dokumentdaten können Sie: Alle erforderlichen Informationen zu einem Dokument in einer Variablen sammeln, Daten zu jeder Eigenschaft des Objekts speichern und für andere Aktivitäten im Workflow wiederverwenden.

Dokumentdaten enthält Informationen zu den folgenden Attributen:

  • Dokumenttyp: Stellt Daten zum identifizierten Dokumenttyp bereit, der durch Aktivitäten wie Classify Document oder Create Classification Validation Task aufgefülltwird
  • Daten: Enthält die extrahierten Feldwerte, die von Aktivitäten wie Extract Document Data oder Create Document Validation Task aufgefülltwerden
  • Dateidetails: Enthält Details zum IResource.
  • SubDocuments: Enthält eine Sammlung von Dokumentdaten, die von Aktivitäten wie Create Classification Validation Task aufgefüllt werden.
  • Dokumentmetadaten: Enthält Informationen zur Verarbeitung des Dokuments, z. B.:
    • Text in Sprache erkannt
    • Extrahierte Felder als Datentabelle
    • Dokumentobjektmodell (DOM): Enthält das Dokumentobjektmodell, das von allen Aktivitäten verwendet wird.
    Die DocumentMetadata werden von der Aktivität aktualisiert, die das Dokument zuerst verarbeitet. Nach dem Auffüllen werden die Metadaten für alle nachfolgenden Aktivitäten freigegeben und verwendet, die das Dokumentdatenobjekt erhalten.
    Tipp: Wenn eine Aktivität nicht die erste Document Understanding-Aktivität ist, die Teil eines Studio-Workflows ist, verwenden Sie Dokumentdaten als Eingabe. Verwenden Sie die Variable Datei nur dann als Eingabe, wenn die Aktivität der erste Document Understanding-Teil eines Studio Workflows ist.

Eigenschaften

Die Eigenschaften der Dokumentdatenvariablen können von einer oder mehreren Aktivitäten aufgefüllt und verbraucht werden. Je nach Aktivität, die die Variable auffüllt, können sich die Eigenschaften unterscheiden.

AttributnameEigenschaftenBeschreibungAktivitäten, die den Wert auffüllen
Document TypeAnzeigename (wird für benutzerdefinierte Modelle verwendet)Name des DokumenttypsDokument klassifizieren (Classify Document)
ID (wird für vorgefertigte Modelle verwendet)Name des Dokumenttyps
ConfidenceKlassifizierungskonfidenz
URLURL, über die der Zugriff auf den Dokumenttyp möglich ist; dies kann entweder benutzerdefiniert oder vordefiniert sein und wird über das jeweilige Projekt im Document Understanding-Center referenziert.
FelderFeldwertExtraktionswert des Felds
ExtraktionskonfidenzwertKonfidenzbewertung der Extraktion, wie vom Modell bereitgestellt
OCR-KonfidenzwertKonfidenzbewertung, die vom OCR-Modul bereitgestellt wird
DateidetailsVollerNameDer vollständige Name der DateiAktivitäten, die das Dokumentdatenobjekt erstellen und eine Datei als Eingabe empfangen
ErweiterungErweiterung der Datei
SeitenbereichSeitenbereich der Datei
UnterdokumenteNicht zutreffendErfassung von Dokumentdaten
Hinweis: Dieser Bereich ist derzeit noch nicht ausgefüllt und wird in Zukunft zusammen mit der Klassifizierungsvalidierung und den Aufteilungsfunktionen hinzugefügt werden.
Dokument klassifizieren (Classify Document)
MetadataNicht zutreffendInformationen zur Verarbeitung des DokumentsAktivitäten, die das Dokumentdatenobjekt erstellen und eine Datei als Eingabe empfangen.
DOMNicht zutreffendDas Dokumentobjektmodell, das von allen Aktivitäten verwendet wird
TextNicht zutreffendGesamter extrahierter Text
Sprache erkennenNicht zutreffendDie im Dokument erkannte Sprache
Konfidenz aufteilenNicht zutreffendWenn das Dokument aufgeteilt wird, wird das Dokument vom Aufteilungsmodell zurückgegeben
Hinweis: Dieser Bereich ist derzeit noch nicht ausgefüllt und wird in Zukunft zusammen mit der Klassifizierungsvalidierung und den Aufteilungsfunktionen hinzugefügt werden.
Dokument klassifizieren (Classify Document)
Ergebnisse als DatentabelleNicht zutreffendFelder, die als Datentabelle exportiert wurdenExtract Document Data

Übergeben von Dokumentdaten an Aktivitäten

Wenn Sie Dokumentdaten verwenden, wird das erste Ausgabeobjekt aus Ihrer Eingabedatei erstellt. Nachdem Sie dieses Objekt erstellt haben, empfehlen wir Ihnen, es an Ihre nächsten Aktivitäten weiterzugeben. Wenn Sie es an Ihre nächsten Aktivitäten übergeben, können Sie den Text und das DOM aus Ihrer ursprünglichen Datei wiederverwenden. Dieser Ansatz erspart Ihnen jedes Mal die Datei neu zu digitalisieren.

Verbrauchen der Extraktionsergebnisse für Felder mit einem oder mehreren Werten

Wenn Sie ein Dokumenttypfeld so konfigurieren, dass es einen Mehrfachwert hat, erwartet das System mehrere Werte. Ein Beispiel könnte eine Multiple-Choice-Frage in einem Formular sein. Die Ergebnisse werden im Mehrfachwertattribut im Feld angezeigt und als Liste zurückgegeben. Wenn das Dokumenttypfeld als Einzelwert konfiguriert ist, gibt das System standardmäßig das Ergebnis im Wertattribut des Felds zurück.

Die folgende Tabelle zeigt Ihnen, wie Dokumentdaten Felder mit einem und mehreren Werten zurückgibt:

Feldtyphat keinen WertHat einen WertHat zwei oder mehr WerteDocumentData.Data.FieldName.ValueDocumentData.Data.FieldName.MultiValues
Einzelwert JaNeinKeine Angabe""null
EinzelwertNeinJaKeine Angabe<value that was identified>null
MehrfachwertJaNeinNein""[] (leeres Array)
MehrfachwertNeinJaNein<value that was identified>[<Array mit einem Wert, der identisch mit .Value>] ist
MehrfachwertNeinNeinJa<first value that was identified><Erster Wert, der identifiziert wurde>[<Array mit n Werten, wobei der erste Wert identisch mit dem .Value>] ist

Zurückgeben extrahierter Felder als Datentabelle

Sie können die Felder, die Sie aus einem Dokument extrahiert haben, als Datentabelle zurückgeben, indem Sie das Dokumentdatenobjekt verwenden. Sie können dann die Datentabellenvariable innerhalb von Excel-Aktivitäten verwenden.

Um die extrahierten Felder als Datentabelle zurückzugeben, wählen Sie die Ausgabe ResultsAsDatatable für die Aktivität Extract Document Data aus.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
UiPath Logo weiß
Vertrauen und Sicherheit
© 2005-2024 UiPath. All rights reserved.