- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren der Authentifizierung
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Aktuelle Validierungsstation
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Document Understanding-Aktivitäten
Validierungsstation
Auf dieser Seite erfahren Sie, wie Sie einen Workflow erstellen, der Aktivitäten wie Digitize Document, Data Extraction Scope und Present Validation Station enthält.
Sie können diese Aktivitäten verwenden, wenn Sie die Datenextraktion und Validierung aus Dokumenten desselben Typs automatisieren möchten. Rechnungen oder Bestellungen eignen sich hervorragend für diese Art von Aufgaben.
Der folgende Workflow konzentriert sich auf die Verwendung der Aktivität Digitize Document auf einer Rechnung, gefolgt von der Validierung der Informationen mit der Aktivität Present Validation Station. Das für diesen Workflow ausgewählte OCR-Modul ist UiPath® Document OCR, Sie können es jedoch durch jedes andere unserer OCR-Module ersetzen. Es wird eine einfache Taxonomie verwendet, die basierend auf dem ausgewählten Rechnungsdokument erstellt wird. Unter Taxonomieübersicht erfahren Sie, wie Sie Ihre Taxonomie erstellen.
- Öffnen Sie Studio und erstellen Sie einen neuen Prozess, der standardmäßig als Main benannt ist.
- Ziehen Sie einen Sequence-Container in den Workflow-Designer.
- Wählen Sie den Sequence-Container aus und erstellen Sie die folgende Variable:
- Variablenname:
taxonomy
- Variablentyp: DocumentTaxonomy;
- Standardwert: Keiner.
- Variablenname:
- Fügen Sie eine Load Taxonomy-Aktivität innerhalb des Sequence-Containers hinzu.
Fügen Sie die Variable
taxonomy
im Feld Taxonomie hinzu. - Fügen Sie eine For Each-Aktivität nach der Aktivität Load Taxonomy und innerhalb des Sequence-Containers hinzu.
- Fügen Sie den Ausdruck
doc
im Feld ForEach hinzu. - Fügen Sie den Ausdruck
directory.GetFiles("TestData\InputDocs\")
im Feld In hinzu. - Wählen Sie im Eigenschaftenbereich die Option String aus der Dropdownliste TypArgument aus.
- Fügen Sie den Ausdruck
- Wählen Sie den Container Textkörper der Aktivität For Each aus und erstellen Sie die in der folgenden Tabelle angezeigten Variablen:
Tabelle 1. Die zu erstellenden Variablen Variablentyp
Standardwert
docName
GenericValue
Keine Angabe dom
Document
Keine Angabe text
String
Keine Angabe extractionResults
Extraktionsergebnis
Keine Angabe validatedResults
Extraktionsergebnis
Keine Angabe - Fügen Sie eine Assign-Aktivität innerhalb des Textkörper-Containers hinzu.
- Fügen Sie die Variable
docName
im Feld An hinzu. - Fügen Sie den Ausdruck
System.IO.Path.GetFileNameWithoutExtension(doc)
in das Feld Wert ein.
- Fügen Sie die Variable
- Fügen Sie eine Write Line-Aktivität nach der Assign-Aktivität hinzu.
Fügen Sie den Ausdruck
"Digitizing "+docName
in das Feld Text ein. - Fügen Sie eine Digitize Document-Aktivität nach der Write Line-Aktivität hinzu.
- Legen Sie den DocumentPath als
doc
. - Fügen Sie die Variable
text
im Feld Dokumenttext hinzu. - Fügen Sie die Variable
dom
im Feld DocumentObjectModel hinzu.
- Legen Sie den DocumentPath als
- Ziehen Sie ein OCR-Modul in die Aktivität Dokument digitalisieren . In diesem Beispiel wirdUiPath Document OCR verwendet.
- Fügen Sie eine Write Line- Aktivität nach der Digitize Document -Aktivität hinzu.
Fügen Sie den Ausdruck
docName+" was digitized."
in das Feld Text ein. - Fügen Sie eine Write Line-Aktivität nach der Write Line-Aktivität hinzu.
Fügen Sie den Ausdruck
"Opening the Validation Station"
in das Feld Text ein. - Fügen Sie eine Try Catch-Aktivität nach der Aktivität Write Line hinzu.
- Fügen Sie einen Sequence- Container im Abschnitt „ Try “ hinzu.
- Fügen Sie eine „Present Validation Station“ -Aktivität innerhalb des Sequence- Containers hinzu.
- Fügen Sie
doc
als Wert im Feld DocumentPath hinzu. - Fügen Sie die Variable
text
im Feld Dokumenttext hinzu. - Fügen Sie die Variable
dom
im Feld DocumentObjectMOdel hinzu. - Fügen Sie die Variable
taxonomy
im Feld Taxonomie hinzu. - Fügen Sie die Variable
extractedResults
im Feld AutomaticExtractionResults hinzu. - Fügen Sie die Variable
validatedResults
im Feld ValidatedExtractionResults hinzu .
- Fügen Sie
- Fügen Sie eine Write Text File-Aktivität nach der Present Validation Station-Aktivität hinzu.
- Führen Sie den Prozess aus. Der Roboter extrahiert Daten automatisch, klassifiziert die Dokumente, extrahiert bestimmte Felder, bereitet die Daten für die Validierung vor und zeigt die extrahierten Dokumente an.
ZIP
-Archiv des Beispiels herunterzuladen: Beispiel.
Beim Ausführen des Workflows wird der Assistent der Validierungsstation geöffnet. Hier können Sie die extrahierten Informationen überprüfen oder selbst extrahieren, indem Sie die Optionen Token oder Benutzerdefinierter Bereich verwenden. Wenn Sie ein Feld in der Taxonomie als Mehrfachwert festlegen, können mehrere Werte für dieses Feld extrahiert werden. Dies kann für Dokumente mit mehreren Adressen, verschiedenen Währungen usw. nützlich sein.