- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding-Prozess – Studio-Vorlage
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- Dokumentdaten
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Intelligenter Schlüsselwortklassifizierer
- Present Classification Station
- Create Document Validation Action
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Aktuelle Validierungsstation
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Extract Document Data
UiPath.IntelligentOCR.StudioWeb.Activities.ExtractDocumentDataWithDocumentData<UiPath.IntelligentOCR.StudioWeb.Activities.DataExtraction.ExtendedExtractionResultForDocumentData>
Extrahiert Daten aus einer Eingabedatei oder einem Dokumentdatenobjekt und speichert die Ergebnisse in einem Dokumentdatenobjekt.
Die Aktivität „Extract Document Data“ erfordert eine ihr vorangehende Aktivität, die ein Dokumentdatenobjekt bereitstellen kann (erzeugt als Ausgabe von anderen Document Understanding-Aktivitäten, z. B. Classify Document).
- Dokumentdaten – aus der Aktivität „Classify Document“
- Datei – aus den Aktivitäten „Get File/Folder“ oder „Get Newest Email“
Die unterstützten Sprachen für die generativen Modelle sind dieselben wie für die verwendete OCR-Engine, die vom Projekt abhängt. Für vordefinierte Projekte ist die verwendete OCR-Engine UiPath Document OCR. Weitere Informationen finden Sie auf der Seite Von der OCR unterstützte Sprachen .
Projektkompatibilität: plattformübergreifend
Eigenschaften
- Projekt – Erfordert, dass Sie Ihr Document Understanding-Projekt aus dem Dropdownmenü auswählen. Die verfügbaren Optionen sind:
- Vordefiniert – Das Standardprojekt
- Sie können ein benutzerdefiniertes Projekt erstellen, indem Sie Document Understanding aufrufen.
- Extraktor – Erfordert, dass Sie den Extraktor aus dem ausgewählten Projekt auswählen. Für das vordefinierte Projekt stehen die folgenden Optionen zur Verfügung:
- Entweder eines der ML-Pakete, die Sie hierfindenHinweis: Die Aktivität „Extract Document Data“ überschreibt den Dokumenttyp mit dem ausgewählten Extraktor. Dies gilt nicht für generative Modelle.
- Generativ
- Entweder eines der ML-Pakete, die Sie hierfinden
- Eingabeaufforderung – Dieses Feld wird angezeigt, wenn Sie die Option Generativ auswählen. Aufforderung zur Identifizierung der zu extrahierenden Felder, die als Schlüssel-Wert-Paare bereitgestellt werden, wobei der Schlüssel den Namen des Felds und der Wert eine Beschreibung des Felds darstellt, die dem Extraktor hilft, den entsprechenden Wert zu identifizieren. Klicken Sie auf das Feld, und Sie erhalten eine Eingabeaufforderung mit den folgenden Optionen, die paarweise bereitgestellt werden:
- Feldname – Erfordert die Eingabe des zu extrahierenden Feldnamens (z. B. Fälligkeitsdatum) (maximal 30 Zeichen)
- Generative Aufforderung – Erfordert, dass Sie die Aufforderung als Eingabe für den Generativen Extraktor bereitstellen. (Höchstens 500 Zeichen)
Tipp: Bewährte Methoden für die Verwendung von generativen Eingabeaufforderungen finden Sie auf der Seite Generativer Extraktor – Bewährte Methoden. - Eingabe – Erfordert, dass Sie die Datei selbst oder Dokumentdaten angeben, falls Sie in Ihrem Workflow bereits andere Document Understanding-Aktivitäten verwendet haben (z. B. Classify Document).
Eingabe
- Timeout (Sekunden) – Maximale Ausführungszeit (in Sekunden) für den Aufruf des generativen Modells. Wenn der Vorgang dieses Timeout überschreitet, wird er automatisch beendet, um Verzögerungen oder Hängen zu vermeiden. Diese Eigenschaft wird nur angezeigt, wenn der Generative Extractor als Extraktor ausgewählt wird.
Erweitert (Advanced)
- Automatische Validierung – Verwenden Sie diese Option, um die automatische Validierung zu aktivieren, eine Funktion, die hilft, die Ergebnisse für die Datenextraktion anhand eines generativen Modells zu validieren. Der Standardwert für das Feld Automatische Validierung ist
False
. - Konfidenz -Schwellenwert – Dieses Feld wird angezeigt, sobald Sie die Automatische Validierung aktivieren. Extraktionsergebnisse, die unter den Schwellenwert fallen, werden mit dem generativen Extraktionsmodell verglichen. Wenn sie übereinstimmen, passt das System die Extraktionskonfidenz an, um den Schwellenwert zu erreichen. Mögliche Schwellenwerte reichen von 0 bis 100.
Wenn der Wert auf 0 festgelegt ist, wird keine Validierung angewendet. Wenn Sie jedoch einen bestimmten Wert festlegen (von 0 bis 100), prüft das System alle Extraktionsergebnisse unter diesem Wert. Wenn Sie z. B. einen Konfidenzschwellenwert von 80 % festlegen, wendet das System die generative Validierung für Felder mit einer Konfidenz unter 80 % an.
Hinweis: Die automatische Validierung ist nur für spezielle Extraktionsmodelle verfügbar.
Ausgabe
- Dokumentdaten – Alle extrahierten Felddaten aus der Datei. Informationen können auch von Classify Document empfangen werden.
Unter Dokumentdaten erfahren Sie, wie Dokumentdaten funktionieren und wie die extrahierten Ergebnisse für Felder mit einem oder mehreren Werten verwendet werden.
- Öffentliche Endpunkte für vorgefertigte Modelle.
- Benutzerdefinierte ML-Modelle, die in Document Understanding-App-Projekten bereitgestellt werden.
- Generatives Extraktionsmodell.