- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ContentValidationData-Klasse
- EvaluatedBusinessRulesForFieldValue-Klasse
- EvaluatedBusinessRuleDetails-Klasse
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- FieldValue-Klasse
- FieldValueResult-Klasse
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- Regelklasse
- RuleResult-Klasse
- RuleSet-Klasse
- RuleSetResult-Klasse
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- FieldValueDetails-Klasse
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren einer externen Verbindung
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Extract Document Data – Vorschau
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren der Authentifizierung
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Create Document Validation Artifacts
- Artefakte der Dokumentvalidierung abrufen
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded

Document Understanding-Aktivitäten
PREVIEWExtract Document Data – Vorschau
UiPath.IntelligentOCR.StudioWeb.Activities.ExtractDocumentDataWithDocumentData<UiPath.IntelligentOCR.StudioWeb.Activities.DataExtraction.ExtendedExtractionResultForDocumentData>
Extrahiert Daten aus einer Eingabedatei oder einem Dokumentdatenobjekt und speichert die Ergebnisse in einem Dokumentdatenobjekt.
Der generative vordefinierte Projekttyp und die entsprechenden Extraktoren sind in der Automation Suite nicht verfügbar.
Designer-Panel
- Eingabe – Erfordert, dass Sie die Datei selbst oder Dokumentdaten angeben, falls Sie in Ihrem Workflow bereits andere Document Understanding-Aktivitäten verwendet haben (z. B. Classify Document).
Wichtig: Die maximale Anzahl von Seiten, die eine Datei haben kann, beträgt 500. Dateien, die diesen Grenzwert überschreiten, können nicht extrahiert werden.
- Projekt – Erfordert, dass Sie Ihr Document Understanding-Projekt aus der Dropdownliste auswählen. Die verfügbaren Optionen sind:
- Vordefiniert – Klassischer Projekttyp, der vortrainierte spezialisierte Modelle verwendet, die für Standardszenarien empfohlen werden.
Weitere Informationen zur Abrechnungslogik für das klassische Projekt finden Sie unter Mess- und Abrechnungslogik.
- Generativ vordefiniert – Moderner Projekttyp, der vortrainierte generative Modelle verwendet, die Anweisungen als Eingabe für die Extraktion von Dokumentdaten akzeptieren.
Weitere Informationen zur Abrechnungslogik für moderne Projekte finden Sie unter Mess- und Abrechnungslogik.
- Vorhandene Projekte aus dem Mandanten und Ordner, mit dem Sie verbunden sind.
- Sie können ein benutzerdefiniertes Projekt erstellen, indem Sie Document Understanding aufrufen.
Weitere Informationen finden Sie in der Einführung für das Erstellen von Modellen.
Hinweis: Wenn Sie mehr als 500 Projekte auf Ihrem Mandanten erstellt haben und die Aktivität „Extract Document Data“ verwenden, zeigt UiPath Studio oder Studio Web keine Projekte über die ursprünglichen 500 hinaus an. Daher können diese Projekte nicht verwendet werden. - Vordefiniert – Klassischer Projekttyp, der vortrainierte spezialisierte Modelle verwendet, die für Standardszenarien empfohlen werden.
- Extraktor – Nachdem Sie ein Projekt ausgewählt haben, können Sie auch einen Extraktor auswählen, den Sie verwenden möchten.
- Für das vordefinierte Projekt können Sie ein vortrainiertes Modell auswählen. Eine Liste der vortrainierten Modelle, die Sie verwenden können, finden Sie unter Vorgefertigte Modelle.
Hinweis: Die Aktivität „Extract Document Data“ extrahiert die Informationen für die Felder, die für den gewählten Extraktor im Dokumententyp verfügbar sind (unabhängig vom tatsächlichen Dokumenttyp). Dies gilt nicht für generative Modelle.
- Für das generativ vordefinierte Projekt haben Sie drei Extraktionsoptionen, die auf ein bestimmtes Dokumentlayout zugeschnitten sind:
- Extraktor für lange Dokumente mit einfachem Layout – Empfohlen für Dokumente in langer Form, die hauptsächlich Text und Überschriften enthalten. Sie können z. B. den Extraktor für lange Dokumente mit einfachem Layout für Dokumente wie Mietvereinbarungen, Rahmenvereinbarungen für Dienstleistungen oder andere ähnliche Dokumente verwenden.
- Extraktor für komplexes Layout für lange Dokumente – Empfohlen für lange Dokumente, die Elemente wie Bilder, Handschrift, Formularsteuerelemente, schwebende Popup-Felder oder andere komplexe Layouttypen enthalten. Sie können z. B. den Extraktor für komplexes Layout für lange Dokumente für Dokumente wie Versicherungspolicen oder andere ähnliche Dokumente verwenden.
- Extraktor für komplexes Layout für kurze Dokumente – Empfohlen für kurze Dokumente, die Elemente wie Bilder, Handschrift, Formularsteuerelement, schwebende Popup-Felder oder andere komplexe Layouttypen enthalten. Sie können beispielsweise den Extraktor für komplexe Layouts kurzer Dokumente auf Dokumente wie Regierungsausweise, Aufnahmeformulare für das Gesundheitswesen oder ähnliche Dokumente anwenden.
- Klassifizierungsergebnis verwenden: Wenn die Eigenschaft Datentyp generieren auf „false“ festgelegt ist, können Sie sich für die Option Klassifizierungsergebnis verwenden entscheiden. Diese Option verwendet automatisch einen empfohlenen Extraktor basierend auf dem Dokumenttyp, der sich aus der Aktivität Classify Document ergibt.
Wenn mehrere Extraktoren mit diesem Dokumenttyp arbeiten können, gibt die Aktivität einen Fehler zurück. In diesem Szenario müssen Sie Ihren bevorzugten Extraktor manuell auswählen.
- Für das vordefinierte Projekt können Sie ein vortrainiertes Modell auswählen. Eine Liste der vortrainierten Modelle, die Sie verwenden können, finden Sie unter Vorgefertigte Modelle.
- Dokumenttypdetails – Dieses Feld wird angezeigt, wenn Sie die Option Generativ auswählen. Aufforderung zur Identifizierung der zu extrahierenden Felder, die als Schlüssel-Wert-Paare bereitgestellt werden, wobei der Schlüssel den Namen des Felds und der Wert eine Beschreibung des Felds darstellt, die dem Extraktor hilft, den entsprechenden Wert zu identifizieren. Wählen Sie das Feld aus, und Sie erhalten eine Eingabeaufforderung mit den folgenden Optionen, die paarweise bereitgestellt werden:
- Feldname – Erfordert die Eingabe des zu extrahierenden Feldnamens (z. B. Fälligkeitsdatum) (maximal 30 Zeichen)
- Anweisung – Erfordert, dass Sie Anweisungen darüber geben, welche Informationen für das entsprechende Feld extrahiert werden sollen.. Die maximale Anzahl der zulässigen Zeichen ist 1000. Die Antwort, das Extraktionsergebnis, auch Vervollständigung genannt, hat ein Wortlimit von 700. Dies ist auf 700 Wörter begrenzt. Das bedeutet, dass Sie nicht mehr als 700 Wörter aus einer einzelnen Aufforderung extrahieren können. Wenn Ihre Extraktionsanforderungen diesen Grenzwert überschreiten, können Sie das Dokument auf mehrere Seiten aufteilen, diese einzeln verarbeiten und die Ergebnisse anschließend zusammenführen.
Tipp: Bewährte Methoden zur Verwendung von generativen Eingabeaufforderungen finden Sie auf der Seite Generativer Extraktor – Bewährte Methoden . - Version oder Tag – Verwenden Sie diese Eigenschaft, wenn Sie ein vorhandenes modernes Document Understanding-Projekt verwenden. Wählen Sie das Tag aus, das der Projektversion entspricht, aus der Sie Daten verarbeiten möchten. Wenn Sie beispielsweise das Produktions-Tag auswählen, das Version 3 zugewiesen ist, verarbeitet die Aktivität Daten aus Version 3 Ihres Projekts in der Produktionsumgebung.
Der Standardwert für Version ist Staging. Wenn das Tag Staging im ausgewählten Projekt nicht vorhanden ist, ist der Standardwert Production.
Weitere Informationen zu Versionen finden Sie unter Veröffentlichen von Modellen.
- Dokumenttyp – Wenn Sie im Feld Version ein Tag auswählen, wählt die Aktivität automatisch den ersten bereitgestellten Dokumenttyp aus der entsprechenden Version des von Ihnen gewählten Projekts. Außerdem werden die Extraktionsfelder für den von Ihnen ausgewählten Dokumenttyp angezeigt.
Eigenschaften-Panel
Eingabe
- Timeout (Sekunden) – Maximale Ausführungszeit (in Sekunden) für den Aufruf des generativen Modells. Wenn der Vorgang dieses Timeout überschreitet, wird er automatisch beendet, um Verzögerungen oder Aufhänger zu vermeiden. Diese Eigenschaft wird nur angezeigt, wenn einer der folgenden Extraktoren ausgewählt ist: Einfacher Layout-Extraktor für lange Dokumente, Komplexer Layout-Extraktor für lange Dokumente oder Komplexer Layout-Extraktor für kurze Dokumente.
- Automatische Validierung – Verwenden Sie diese Option, um die automatische Validierung zu aktivieren, eine Funktion, die hilft, die Ergebnisse für die Datenextraktion anhand eines generativen Modells zu validieren. Der Standardwert für das Feld Automatische Validierung ist
False
.- Konfidenz -Schwellenwert – Dieses Feld wird angezeigt, sobald Sie die Automatische Validierung aktivieren. Extraktionsergebnisse, die unter den Schwellenwert fallen, werden mit dem generativen Extraktionsmodell verglichen. Wenn sie übereinstimmen, passt das System die Extraktionskonfidenz an, um den Schwellenwert zu erreichen. Mögliche Schwellenwerte reichen von 0 bis 100.
Wenn der Wert auf 0 festgelegt ist, wird keine Validierung angewendet. Wenn Sie jedoch einen bestimmten Wert festlegen (von 0 bis 100), prüft das System alle Extraktionsergebnisse unter diesem Wert. Wenn Sie z. B. einen Konfidenzschwellenwert von 80 % festlegen, wendet das System die generative Validierung für Felder mit einer Konfidenz unter 80 % an.
Hinweis: Die automatische Validierung ist nur für spezielle Extraktionsmodelle verfügbar.
- Konfidenz -Schwellenwert – Dieses Feld wird angezeigt, sobald Sie die Automatische Validierung aktivieren. Extraktionsergebnisse, die unter den Schwellenwert fallen, werden mit dem generativen Extraktionsmodell verglichen. Wenn sie übereinstimmen, passt das System die Extraktionskonfidenz an, um den Schwellenwert zu erreichen. Mögliche Schwellenwerte reichen von 0 bis 100.
- Datentyp generieren – Wenn auf
True
festgelegt, wird angegeben, dass die Ausgabe basierend auf dem ausgewählten Extraktor generiert werden soll, was zu einemIDocumentData<ExtractorType>
-Objekt führt. Gibt alternativ bei Festlegung aufFalse
an, dass die Datengenerierung übersprungen werden soll, was zu einem generischenIDocumentData<DictionaryData>
-Objekt führt.Weitere Informationen und Einschränkungen für die beiden Objekttypen finden Sie unter Dokumentdaten .
Ausgabe
- Dokumentdaten – Alle extrahierten Felddaten aus der Datei. Informationen können auch von Classify Document empfangen werden.
Unter Dokumentdaten erfahren Sie, wie Dokumentdaten funktionieren und wie die extrahierten Ergebnisse für Felder mit einem oder mehreren Werten verwendet werden.
Externe Verbindung zur Entwurfszeit
Die externe Verbindung zur Entwurfszeit ermöglicht es Ihnen, die Aktivität mithilfe von Document Understanding-Ressourcen aus anderen Projekten oder Mandanten zu nutzen. Bevor Sie diese Eigenschaften konfigurieren, stellen Sie sicher, dass Sie die auf der Seite Konfigurieren der externen Runtime-Verbindung genannten Voraussetzungen erfüllt haben. Nachdem diese Schritte abgeschlossen sind, können Sie mit der Konfiguration der externen Runtime-Verbindung fortfahren.
- App-ID: Geben Sie die App-ID der externen Anwendung ein, die Sie zuvor erstellt haben.
- Geheimer App-Schlüssel: Geben Sie den geheimen App-Schlüssel der externen Anwendung ein, die Sie zuvor erstellt haben.
- Mandanten-URL: Geben Sie die URL des Mandanten ein, in dem Sie die externe Anwendung erstellt haben. Dies ist der Mandant, von dem aus Sie Ressourcen zur Entwurfszeit verwenden werden.
Die URL muss das folgende Format haben:
https://<baseURL>/<OrganizationName>/<TenantName>
.
Externe Runtime-Verbindung
Die externe Runtime-Verbindung ermöglicht es Ihnen, die Aktivität über lokale Roboter auszuführen. Bevor Sie diese Eigenschaften konfigurieren, stellen Sie sicher, dass Sie die auf der Seite Konfigurieren der externen Runtime-Verbindung genannten Voraussetzungen erfüllt haben. Nachdem diese Schritte abgeschlossen sind, können Sie mit der Konfiguration der externen Runtime-Verbindung fortfahren.
- Runtime-Anmeldeinformationen-Asset – Verwenden Sie dieses Feld, wenn Sie auf Document Understanding-Ressourcen zugreifen müssen, während der Roboter mit einem lokalen Orchestrator oder von einem anderen Mandanten aus verbunden ist. Sie können ein Anmeldeinformations-Asset zu Authentifizierungszwecken auf eine der folgenden Arten eingeben:
- Wählen Sie in der Dropdownliste das gewünschte Anmeldeinformations-Asset vom Orchestrator aus, mit dem der UiPath® Robot verbunden ist.
- Geben Sie den Pfad manuell zum Orchestrator-Anmeldeinformations-Asset ein, in dem Sie die Anmeldeinformationen der externen Anwendung für den Zugriff auf das Projekt speichern.
Das Format des Pfads sollte
<OrchestratorFolderName>/<AssetName>
sein.
- Runtime-Mandanten-URL – Verwenden Sie dieses Feld neben dem Feld Runtime-Anmeldeinformationen-Asset. Geben Sie die URL des Mandanten ein, mit dem sich der Roboter verbindet, um die Extraktion auszuführen. Die URL muss das folgende Format haben:
https://<baseURL>/<OrganizationName>/<TenantName>
.
Um schnell mit den generativen Funktionen der Aktivität Extract Document Data zu beginnen, führen Sie die folgenden Schritte aus:
- Fügen Sie eine Aktivität Extract Document Data hinzu.
- Wählen Sie in der Dropdownliste Projekt die Option Generativ vordefiniert aus.
- Wählen Sie für Extraktor einen der folgenden Extraktoren aus: Einfacher Layout-Extraktor für lange Dokumente, Komplexer Layout-Extraktor für lange Dokumente oder Komplexer Layout-Extraktor für kurze Dokumente.
Die Eigenschaft Details zum Dokumenttyp wird im Textkörper der Aktivität angezeigt.
- Geben Sie für das Wörterbuch Ihre Anweisungen als Schlüssel-Wert-Paare im Wörterbuch an, wobei:
- Der Feldname stellt den Namen des Felds dar, das Sie aus dem Dokument extrahieren möchten. Zum Beispiel:
email address
. - Die Anweisung stellt die Anweisung dar, welche Informationen Sie dem Extraktor zum Extrahieren des Felds zur Verfügung stellen möchten. Es ist die Beschreibung, die vom generativen Extraktor verwendet wird, um den entsprechenden Wert zu identifizieren.
Ein Beispiel für Schlüssel-Wert-Paare finden Sie beispielsweise in der folgenden Tabelle:
Tabelle 1. Beispiele für Schlüssel-Wert-Paare für die Eingabeaufforderung des generativen Extraktors Name des Felds Anweisung Name „Wie lautet der Name des Kandidaten?“ Aktueller Auftrag „In welcher Funktion ist der Kandidat derzeit tätig?“ Arbeitgeber „Was ist der aktuelle Arbeitgeber des Kandidaten?“ Abbildung 1. Details zu Schlüssel-Wert-Paaren für den generativen Extraktor
- Der Feldname stellt den Namen des Felds dar, das Sie aus dem Dokument extrahieren möchten. Zum Beispiel: