- Überblick
- Verträge zur Dokumentverarbeitung
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding-Prozess – Studio-Vorlage
- Document Understanding-Aktivitäten
- Über das Document Understanding-Paket
- Projektkompatibilität
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Intelligenter Schlüsselwortklassifizierer
- Present Classification Station
- Create Document Validation Action
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Aktuelle Validierungsstation
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Validierungsstation
Mit dem Validation Station-Assistenten kann Datenextraktion und -validierung Spaß machen und einfach sein. Nachfolgend finden Sie Details zum Erstellen eines Workflows, der Aktivitäten wie Digitize Document, Data Extraction Scopeund Present Validation Stationenthält.
Sie können diese Aktivitäten bei Bedarf verwenden, um die Datenextraktion und -validierung aus Dokumenten desselben Typs zu automatisieren. Rechnungen oder Bestellungen eignen sich hervorragend für diese Art von Aufgaben.
Der folgende Workflow konzentriert sich auf die Verwendung der Aktivität Dokument digitalisieren auf einer Rechnung, gefolgt von der Validierung der Informationen mit der Aktivität Present Validation Station . Die für diesen Workflow ausgewählte OCR-Engine ist UiPath Document OCR , aber Sie können sie auch durch eine andere unserer OCR-Engines ersetzen.
Die Taxonomie ist ebenfalls eine einfache, die auf der Grundlage des verwendeten Rechnungsdokuments erstellt wurde. Hier finden Sie weitere Details zum Erstellen Ihrer Taxonomie.
Erstellen des Workflows
So kann der Automatisierungsprozess erstellt werden:
- Öffnen Sie Studio und erstellen Sie einen neuen Prozess, der standardmäßig als Main benannt ist.
- Ziehen Sie einen Sequence-Container in den Workflow-Designer.
-
Wählen Sie den Sequence-Container aus und erstellen Sie die folgende Variable:
Variablenname
Variablentyp
Standardwert
taxonomy
DocumentTaxonomy
-
Ziehen Sie eine Aktivität Load Taxonomy in den Sequence- Container.
- Fügen Sie die Variable
taxonomy
im Feld Taxonomie hinzu.
- Fügen Sie die Variable
-
Ziehen Sie eine For Each-Aktivität unter die Aktivität Load Taxonomy .
- Fügen Sie den Ausdruck
doc
im Feld ForEach hinzu. - Fügen Sie den Ausdruck
directory.GetFiles("TestData\InputDocs\")
im Feld In hinzu. - Wählen Sie im Eigenschaftenbereich die Option String aus der Dropdownliste TypArgument aus.
- Fügen Sie den Ausdruck
-
Wählen Sie den Container Textkörper der Aktivität For Each aus und erstellen Sie die folgenden Variablen:
Variablenname
Variablentyp
Standardwert
docName
GenericValue
dom
Document
text
String
extractionResults
Extraktionsergebnis
validatedResults
Extraktionsergebnis
-
Fügen Sie eine Assign-Aktivität innerhalb des Textkörper-Containers hinzu.
- Fügen Sie die Variable
docName
im Feld An hinzu. - Fügen Sie den Ausdruck
System.IO.Path.GetFileNameWithoutExtension(doc)
in das Feld Wert ein.
- Fügen Sie die Variable
-
Fügen Sie unter der Aktivität Assign eine Write Line-Aktivität hinzu.
- Fügen Sie den Ausdruck
"Digitizing "+docName
in das Feld Text ein.
- Fügen Sie den Ausdruck
-
Fügen Sie unter der Aktivität „ Write Line “ eine Aktivität „Dokument digitalisieren “ hinzu.
- Legen Sie den DocumentPath als
doc
. - Fügen Sie die Variable
text
im Feld Dokumenttext hinzu. - Fügen Sie die Variable
dom
im Feld DocumentObjectModel hinzu.
- Legen Sie den DocumentPath als
- Ziehen Sie ein OCR-Modul in die Aktivität Dokument digitalisieren . In diesem Beispiel wirdUiPath Document OCR verwendet.
-
Fügen Sie die Aktivität „ Write Line “ unter der Aktivität „Dokument digitalisieren“ hinzu .
- Fügen Sie den Ausdruck
docName+" was digitized."
in das Feld Text ein.
- Fügen Sie den Ausdruck
-
Fügen Sie eine Write Line-Aktivität unter der Write Line-Aktivität hinzu.
- Fügen Sie den Ausdruck
"Opening the Validation Station"
in das Feld Text ein.
- Fügen Sie den Ausdruck
- Fügen Sie eine Try Catch-Aktivität unter der Aktivität Write Line hinzu.
- Fügen Sie einen Sequence- Container im Abschnitt „ Try “ hinzu.
-
Fügen Sie eine „Present Validation Station“ -Aktivität innerhalb des Sequence- Containers hinzu.
- Fügen Sie
doc
als Wert im Feld DocumentPath hinzu. - Fügen Sie die Variable
text
im Feld Dokumenttext hinzu. - Fügen Sie die Variable
dom
im Feld DocumentObjectMOdel hinzu. - Fügen Sie die Variable
taxonomy
im Feld Taxonomie hinzu. - Fügen Sie die Variable
extractedResults
im Feld AutomaticExtractionResults hinzu. - Fügen Sie die Variable
validatedResults
im Feld ValidatedExtractionResults hinzu .
- Fügen Sie
- Fügen Sie die Aktivität „ Write Text File “ unter der Aktivität „ Present Validation Station “ hinzu.
- Führen Sie den Prozess aus. Der Roboter extrahiert Daten automatisch, klassifiziert die Dokumente, extrahiert bestimmte Felder, bereitet die Daten für die Validierung vor und zeigt die extrahierten Dokumente an.
Laden Sie das Beispiel hier herunter.
Verwendung der Validierungsstation
Beim Ausführen des Workflows wird der Assistent der Validierungsstation geöffnet. Hier können Sie die extrahierten Informationen überprüfen oder selbst extrahieren, indem Sie die Optionen Token oder Benutzerdefinierter Bereich verwenden. Wenn Sie ein Feld in der Taxonomie als Mehrfachwert festlegen, können mehrere Werte für dieses Feld extrahiert werden. Dies kann für Dokumente mit mehreren Adressen, verschiedenen Währungen usw. nützlich sein.
Sehen wir uns an, wie Sie zwischen den Optionen „ Token “ und „ Benutzerdefinierter Bereich “ wechseln können.
Hier ist ein Beispiel dafür, wie einem Feld ein zusätzlicher Wert hinzugefügt wird.
Weitere Informationen zur Verwendung und Anpassung der Validation Station finden Sie hier.