activities
latest
false
- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren der Authentifizierung
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Aktuelle Validierungsstation
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- Manuelle Validierung für "Digitize Documents"
- Ankerbasierte Datenextraktion mit Intelligent Form Extractor
- Validierungsstation
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Manuelle Validierung für "Digitize Documents"
Document Understanding-Aktivitäten
Letzte Aktualisierung 5. Dez. 2024
Manuelle Validierung für "Digitize Documents"
Im folgenden Beispiel wird erklärt, wie Daten manuell aus einem Bild extrahiert und die Ausgabe in einer separaten Datei dargestellt werden. Dabei werden Aktivitäten wie Digitize Document oder Present Validation Station verwendet. Diese Aktivitäten finden Sie im Paket UiPath.IntelligentOCR.Activities .
Hinweis: Dieser Workflow verwendet eine ältere Version des UiPath.IntelligentOCR.Activities -Pakets.
Steps:
- Öffnen Sie Studio und erstellen Sie einen neuen Prozess, der standardmäßig als Main benannt ist.
Hinweis: Stellen Sie sicher, dass Sie alle erforderlichen Dateien (
.json
-Dateien und alle Bilder) im Projektordner hinzufügen. - Fügen Sie einen Sequence-Container im Workflow-Designer hinzu und erstellen Sie die in der folgenden Tabelle angezeigten Variablen:
Tabelle 1. Zu erstellende Variablen Variablentyp
Standardwert
Text
String
DOM
UiPath.DocumentProcessing.Contracts.Dom.Document
Data
UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
DocumentTaxonomy
UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
TaxonomyJSON
String
HumanValidated
UiPath.DocumentProcessing.Contracts.Results.ExtractionResult
- Fügen Sie eine Read Text File-Aktivität in die Sequence ein.
- Fügen Sie im Eigenschaftenbereich den Namen der Datei, in diesem Fall
"taxonomy.json"
, in das Feld Dateiname ein. - Fügen Sie die Variable
TaxonomyJSON
in das Feld Inhalt ein.
- Fügen Sie im Eigenschaftenbereich den Namen der Datei, in diesem Fall
- Fügen Sie eine Assign-Aktivität nach der Aktivität Read Text File hinzu.
- Fügen Sie die Variable
Data
im Feld An und den AusdruckDocumentTaxonomy.Deserialize(TaxonomyJSON)
im Feld Wert hinzu. Diese Aktivität erstellt die Taxonomie für die Extraktion.
- Fügen Sie die Variable
- Fügen Sie nach der Aktivität Assign eine Digitize Document-Aktivität hinzu.
- Fügen Sie im Eigenschaftenbereich den Wert
1
in das Feld Parallelitätsgrad ein. - Fügen Sie den Ausdruck
"Input\Invoice01.tif"
in das Feld Dokumentpfad ein. - Fügen Sie die Variable
DOM
im Feld DocumentObjectModel hinzu. - Fügen Sie die Variable
Text
im Feld Dokumenttext hinzu.
- Fügen Sie im Eigenschaftenbereich den Wert
- Fügen Sie ein Google OCR-Modul innerhalb der Aktivität Digitize Document hinzu.
- Fügen Sie im Eigenschaftenbereich die Variable
Image
in das Feld Bild ein. - Aktivieren Sie das Kontrollkästchen für die Option Wörter extrahieren . Diese Option extrahiert die Position aller erkannten Wörter auf dem Bildschirm.
- Fügen Sie den Ausdruck
"eng"
in das Feld Sprache ein. - Wählen Sie in der Dropdownliste Profil die Option
Legacy
aus. - Fügen Sie den Wert
2
in das Feld Skalierung ein.
- Fügen Sie im Eigenschaftenbereich die Variable
- Fügen Sie eine Aktivität Present Validation Station nach der Aktivität Digitize Document hinzu.
- Fügen Sie im Panel Eigenschaften die Variable
DOM
im Feld DocumentObjectModel hinzu. - Fügen Sie den Ausdruck
"Input\Invoice01.tif"
in das Feld Dokumentpfad ein. - Fügen Sie die Variable
Text
im Feld Dokumenttext hinzu. - Fügen Sie die Variable
Data
im Feld Taxonomie hinzu. - Fügen Sie die Variable
HumanValidated
im Feld ValidatedExtractionResults hinzu .
- Fügen Sie im Panel Eigenschaften die Variable
- Fügen Sie eine For Each-Aktivität unter der Aktivität Present Validation Station hinzu.
- Wählen Sie im Eigenschaftenbereich die Option
UiPath.DocumentProcessing.Contracts.Results.ResultsDataPoint
aus der TypeArgument-Dropdownliste aus. - Fügen Sie den Ausdruck
HumanValidated.ResultsDocument.Fields
in das Feld Werte ein.
- Wählen Sie im Eigenschaftenbereich die Option
- Fügen Sie eine Protokollnachricht- Aktivität im Textkörper der For Each- Aktivität hinzu.
- Wählen Sie in der Dropdownliste Ebene die Option
Info
aus. - Fügen Sie den Ausdruck
item.FieldName
in das Feld Nachricht ein.
- Wählen Sie in der Dropdownliste Ebene die Option
- Fügen Sie eine Log Message-Aktivität unter der vorherigen Log Message-Aktivität ein.
- Wählen Sie in der Dropdown-Liste Ebene die Option
Info
aus. - Fügen Sie den Ausdruck
item.Values(0).Value.ToString
in das Feld Nachricht ein.
- Wählen Sie in der Dropdown-Liste Ebene die Option
- Fügen Sie eine Write Line-Aktivität unterhalb der Log Message-Aktivitäten hinzu.
- Fügen Sie den Wert
""
in das Feld Text ein.
- Fügen Sie den Wert
- Führen Sie den Prozess aus. Der Roboter verwendet die IntelligentOCR-Aktivitäten, um die Daten manuell zu verarbeiten und die Ergebnisse zu präsentieren.
Besuchen Sie den folgenden Link, um das Beispiel als
ZIP
-Datei herunterzuladen: Beispiel.