- Überblick
- Verträge zur Dokumentverarbeitung
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding-Prozess – Studio-Vorlage
- Document Understanding-Aktivitäten
- Über das Document Understanding-Paket
- Projektkompatibilität
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Intelligenter Schlüsselwortklassifizierer
- Present Classification Station
- Create Document Validation Action
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Aktuelle Validierungsstation
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- Manuelle Validierung für "Digitize Documents"
- Datenextraktion mit FlexiCapture
- Ankerbasierte Datenextraktion mit Intelligent Form Extractor
- Validierungsstation
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Manuelle Validierung für "Digitize Documents"
Im folgenden Beispiel wird erklärt, wie Daten manuell aus einem Bild extrahiert und die Ausgabe in einer separaten Datei dargestellt werden. Dabei werden Aktivitäten wie Digitize Document oder Present Validation Station verwendet. Diese Aktivitäten finden Sie im Paket UiPath.IntelligentOCR.Activities .
So kann der Automatisierungsprozess erstellt werden:
-
Öffnen Sie Studio und erstellen Sie einen neuen Prozess, der standardmäßig als Main benannt ist.
Hinweis: Stellen Sie sicher, dass Sie alle erforderlichen Dateien (.json
-Dateien und alle Bilder) im Projektordner hinzufügen. -
Ziehen Sie einen Sequence-Container in den Workflow-Designer und erstellen Sie die folgenden Variablen:
Variablenname
Variablentyp
Standardwert
Text
String
DOM
UiPath.DocumentProcessing.Contracts.Dom.Document
Data
UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
DocumentTaxonomy
UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
TaxonomyJSON
String
HumanValidated
UiPath.DocumentProcessing.Contracts.Results.ExtractionResult
-
Ziehen Sie eine Aktivität „Textdatei lesen“ in die Sequence.
- Fügen Sie im Eigenschaftenbereich den Namen der Datei, in diesem Fall
"taxonomy.json"
, in das Feld Dateiname ein. - Fügen Sie die Variable
TaxonomyJSON
in das Feld Inhalt ein.
- Fügen Sie im Eigenschaftenbereich den Namen der Datei, in diesem Fall
-
Fügen Sie eine „ Assign “-Aktivität unter der Aktivität „ Read Text File “ hinzu.
- Fügen Sie die Variable
Data
im Feld An und den AusdruckDocumentTaxonomy.Deserialize(TaxonomyJSON)
im Feld Wert hinzu. Diese Aktivität erstellt die Taxonomie für die Extraktion.
- Fügen Sie die Variable
-
Ziehen Sie eine Aktivität „ Dokument digitalisieren“ unter die Aktivität „Zuweisen“ .
- Fügen Sie im Eigenschaftenbereich den Wert
1
in das Feld Parallelitätsgrad ein. - Fügen Sie den Ausdruck
"Input\Invoice01.tif"
in das Feld Dokumentpfad ein. - Fügen Sie die Variable
DOM
im Feld DocumentObjectModel hinzu. - Fügen Sie die Variable
Text
im Feld Dokumenttext hinzu.
- Fügen Sie im Eigenschaftenbereich den Wert
-
Legen Sie eine Google OCR -Engine in der Aktivität „Dokument digitalisieren“ ab .
- Fügen Sie im Eigenschaftenbereich die Variable
Image
in das Feld Bild ein. - Aktivieren Sie das Kontrollkästchen für die Option Wörter extrahieren . Diese Option extrahiert die Position aller erkannten Wörter auf dem Bildschirm.
- Fügen Sie den Ausdruck
"eng"
in das Feld Sprache ein. - Wählen Sie in der Dropdownliste Profil die Option
Legacy
aus. - Fügen Sie den Wert
2
in das Feld Skalierung ein.
- Fügen Sie im Eigenschaftenbereich die Variable
-
Platzieren Sie eine „Presentation Validation Station“ -Aktivität unter der Aktivität „Dokument digitalisieren“ .
- Fügen Sie im Panel Eigenschaften die Variable
DOM
im Feld DocumentObjectModel hinzu. - Fügen Sie den Ausdruck
"Input\Invoice01.tif"
in das Feld Dokumentpfad ein. - Fügen Sie die Variable
Text
im Feld Dokumenttext hinzu. - Fügen Sie die Variable
Data
im Feld Taxonomie hinzu. - Fügen Sie die Variable
HumanValidated
im Feld ValidatedExtractionResults hinzu .
- Fügen Sie im Panel Eigenschaften die Variable
-
Ziehen Sie eine For Each- Aktivität unter die Aktivität Present Validation Station .
- Wählen Sie im Eigenschaftenbereich die Option
UiPath.DocumentProcessing.Contracts.Results.ResultsDataPoint
aus der TypeArgument-Dropdownliste aus. - Fügen Sie den Ausdruck
HumanValidated.ResultsDocument.Fields
in das Feld Werte ein.
- Wählen Sie im Eigenschaftenbereich die Option
-
Ziehen Sie eine „Log Message“ -Aktivität in den Textkörper der „ For Each“ -Aktivität.
- Wählen Sie in der Dropdownliste Ebene die Option
Info
aus. - Fügen Sie den Ausdruck
item.FieldName
in das Feld Nachricht ein.
- Wählen Sie in der Dropdownliste Ebene die Option
-
Ziehen Sie eine Log Message-Aktivität unter die vorherige Aktivität Log Message.
- Wählen Sie in der Dropdownliste Ebene die Option
Info
aus. - Fügen Sie den Ausdruck
item.Values(0).Value.ToString
in das Feld Nachricht ein.
- Wählen Sie in der Dropdownliste Ebene die Option
-
Ziehen Sie eine „Write Line “-Aktivität unter die „Log Message“ -Aktivitäten.
- Fügen Sie den Wert
""
in das Feld Text ein.
- Fügen Sie den Wert
- Führen Sie den Prozess aus. Der Roboter verwendet die IntelligentOCR-Aktivitäten, um die Daten manuell zu verarbeiten und die Ergebnisse zu präsentieren.
Laden Sie das Beispiel hier herunter.