- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- FieldValueDetails Class
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- BasicDataPoint-Klasse – Vorschau
- ExtractionResultHandler-Klasse – Vorschau
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren einer externen Verbindung
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Create Document Validation Artifacts
- Artefakte der Dokumentvalidierung abrufen
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Dokument zensieren
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Generativer Klassifizierer
- Generativer Extraktor
- Konfigurieren der Authentifizierung
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- Versionshinweise
- Über das PDF-Aktivitätspaket
- Projektkompatibilität
- Get PDF Page Count
- PDF-Text lesen (Read PDF Text)
- PDF über OCR lesen (Read PDF With OCR)
- XPS-Text lesen (Read XPS Text)
- XPS über OCR lesen (Read XPS With OCR)
- Exportieren einer PDF-Seite als Bild
- Bilder aus PDF exportieren
- Extract Attachments from PDF
- PDF-Seitenbereich extrahieren
- PDF-Dateien zusammenfügen
- Verwalten des PDF-Passworts
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Document Understanding-Aktivitäten
Auf dieser Seite erfahren Sie, wie Sie einen Workflow erstellen, der Aktivitäten wie Digitize Document, Data Extraction Scope und Present Validation Station enthält.
Sie können diese Aktivitäten verwenden, wenn Sie die Datenextraktion und Validierung aus Dokumenten desselben Typs automatisieren möchten. Rechnungen oder Bestellungen eignen sich hervorragend für diese Art von Aufgaben.
Der folgende Workflow konzentriert sich auf die Verwendung der Aktivität Digitize Document auf einer Rechnung, gefolgt von der Validierung der Informationen mit der Aktivität Present Validation Station . Das für diesen Workflow ausgewählte OCR-Modul ist UiPath® Document OCR, Sie können es jedoch durch jedes andere unserer OCR-Module ersetzen. Es wird eine einfache Taxonomie verwendet, die basierend auf dem ausgewählten Rechnungsdokument erstellt wird. Unter Taxonomieübersicht erfahren Sie, wie Sie Ihre Taxonomie erstellen.
Erstellen des Workflows
-
Öffnen Sie Studio und erstellen Sie einen neuen Prozess, der standardmäßig als Main benannt ist.
-
Drag a Sequence container into the Workflow Designer.
-
Wählen Sie den Sequence-Container aus und erstellen Sie die folgende Variable:
- Variablenname:
taxonomy - Variablentyp: DocumentTaxonomy;
- Standardwert: Keiner.
- Variablenname:
-
Fügen Sie eine Load Taxonomy-Aktivität innerhalb des Sequence-Containers hinzu.
Add the variable
taxonomyin the Taxonomy field. -
Fügen Sie eine For Each-Aktivität nach der Aktivität Load Taxonomy und innerhalb des Sequence-Containers hinzu.
- Add the expression
docin the ForEach field. - Add the expression
directory.GetFiles("TestData\InputDocs\")in the In field. - In the Properties panel, select the option String from the TypeArgument dropdown list.
- Add the expression
-
Wählen Sie den Container Textkörper der Aktivität For Each aus und erstellen Sie die Variablen, die in der folgenden Tabelle angezeigt werden:
Tabelle 1. Die zu erstellenden Variablen
Variablentyp Standardwert docNameGenericValue Keine Angabe domDocument Keine Angabe textString Keine Angabe extractionResultsExtraktionsergebnis Keine Angabe validatedResultsExtraktionsergebnis Keine Angabe -
Add an Assign activity inside the Body container.
- Fügen Sie die Variable
docNameim Feld An hinzu. - Fügen Sie den Ausdruck
System.IO.Path.GetFileNameWithoutExtension(doc)in das Feld Wert ein.
- Fügen Sie die Variable
-
Fügen Sie eine Write Line-Aktivität nach der Assign-Aktivität hinzu.
Fügen Sie den Ausdruck
"Digitizing "+docNamein das Feld Text ein. -
Fügen Sie eine Digitize Document-Aktivität nach der Write Line-Aktivität hinzu.
- Set the DocumentPath as
doc. - Add the variable
textin the DocumentText field. - Add the variable
domin the DocumentObjectModel field.
- Set the DocumentPath as
-
Drag an OCR engine into the Digitize Document activity. UiPath Document OCR is used for this example.
-
Fügen Sie eine Write Line- Aktivität nach der Digitize Document- Aktivität hinzu.
Fügen Sie den Ausdruck
docName+" was digitized."in das Feld Text ein. -
Fügen Sie eine Write Line-Aktivität nach der Write Line-Aktivität hinzu.
Fügen Sie den Ausdruck
"Opening the Validation Station"in das Feld Text ein. -
Fügen Sie eine Try Catch-Aktivität nach der Aktivität Write Line hinzu.
-
Add a Sequence container in the Try section.
-
Add a Present Validation Station activity inside the Sequence container.
- Add
docas value in the DocumentPath field. - Add the variable
textin the DocumentText field. - Add the variable
domin the DocumentObjectMOdel field. - Add the variable
taxonomyin the Taxonomy field. - Add the variable
extractedResultsin the AutomaticExtractionResults field. - Add the variable
validatedResultsin the ValidatedExtractionResults field.
- Add
-
Fügen Sie eine Write Text File-Aktivität nach der Present Validation Station-Aktivität hinzu.
-
Führen Sie den Prozess aus. Der Roboter extrahiert Daten automatisch, klassifiziert die Dokumente, extrahiert bestimmte Felder, bereitet die Daten für die Validierung vor und zeigt die extrahierten Dokumente an.
Besuchen Sie den folgenden Link, um ein ZIP -Archiv des Beispiels herunterzuladen: Beispiel.
Verwendung der Validierungsstation
Running the workflow opens the Validation Station wizard. Here you can verify the extracted information or extract it yourself by using the Tokens or Custom Area options. If you set a field in the taxonomy as multi-value, then multiple values can be extracted for that field. This can be useful for documents with multiple addresses, different currencies, etc.