- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- FieldValueDetails Class
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- BasicDataPoint-Klasse – Vorschau
- ExtractionResultHandler-Klasse – Vorschau
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren einer externen Verbindung
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Create Document Validation Artifacts
- Artefakte der Dokumentvalidierung abrufen
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Dokument zensieren
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Generativer Klassifizierer
- Generativer Extraktor
- Konfigurieren der Authentifizierung
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded

Document Understanding-Aktivitäten
Manuelle Validierung für "Digitize Documents"
Im folgenden Beispiel wird erklärt, wie Daten manuell aus einem Bild extrahiert und die Ausgabe in einer separaten Datei präsentiert werden. Es enthält Aktivitäten wie Digitize Document oder Present Validation Station. Diese Aktivitäten finden Sie im Paket UiPath.IntelligentOCR.Activities .
This workflow is using an older version of the UiPath.IntelligentOCR.Activities package.
Steps:
-
Öffnen Sie Studio und erstellen Sie einen neuen Prozess, der standardmäßig als Main benannt ist.
Hinweis:Make sure to add all the needed files (
.jsonfiles and all the images) inside the project folder. -
Fügen Sie einen Sequence-Container im Workflow-Designer hinzu und erstellen Sie die in der folgenden Tabelle angezeigten Variablen:
Tabelle 1. Zu erstellende Variablen
Variablentyp Standardwert TextString DOMUiPath.DocumentProcessing.Contracts.Dom.Document DataUiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy DocumentTaxonomyUiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy TaxonomyJSONString HumanValidatedUiPath.DocumentProcessing.Contracts.Results.ExtractionResult -
Fügen Sie eine Read Text File-Aktivität in die Sequence ein.
- In the Properties panel, add the name of the file, in this case
"taxonomy.json", in the FileName field. - Add the variable
TaxonomyJSONin the Content field.
- In the Properties panel, add the name of the file, in this case
-
Fügen Sie eine Assign-Aktivität nach der Aktivität Read Text File hinzu.
- Add the variable
Datain the To field and the expressionDocumentTaxonomy.Deserialize(TaxonomyJSON)in the Value field. This activity builds the taxonomy for extraction.
- Add the variable
-
Fügen Sie nach der Aktivität Assign eine Digitize Document-Aktivität hinzu.
- In the Properties panel, add the value
1in the DegreeOfParallelism field. - Add the expression
"Input\Invoice01.tif"in the DocumentPath field. - Add the variable
DOMin the DocumentObjectModel field. - Add the variable
Textin the DocumentText field.
- In the Properties panel, add the value
-
Fügen Sie ein Google OCR-Modul innerhalb der Aktivität Digitize Document hinzu.
- Fügen Sie im Eigenschaftenbereich die Variable
Imagein das Feld Bild ein. - Select the check box for the ExtractWords option. This option extracts the on-screen position of all detected words.
- Add the expression
"eng"in the Language field. - Select the option
Legacyfrom the Profile drop-down list. - Fügen Sie den Wert
2in das Feld Skalierung ein.
- Fügen Sie im Eigenschaftenbereich die Variable
-
Fügen Sie eine Present Validation Station -Aktivität nach der Digitize Document- Aktivität hinzu.
- In the Properties panel, add the variable
DOMin the DocumentObjectModel field. - Add the expression
"Input\Invoice01.tif"in the DocumentPath field. - Add the variable
Textin the DocumentText field. - Add the variable
Datain the Taxonomy field. - Add the variable
HumanValidatedin the ValidatedExtractionResults field.
- In the Properties panel, add the variable
-
Fügen Sie eine For Each-Aktivität unter der Aktivität Present Validation Station hinzu.
- In the Properties panel, select the option
UiPath.DocumentProcessing.Contracts.Results.ResultsDataPointfrom the TypeArgument drop-down list. - Add the expression
HumanValidated.ResultsDocument.Fieldsin the Values field.
- In the Properties panel, select the option
-
Add a Log Message activity inside the Body of the For Each activity.
- Select the option
Infofrom the Level drop-down list. - Fügen Sie den Ausdruck
item.FieldNamein das Feld Nachricht ein.
- Select the option
-
Fügen Sie eine Log Message-Aktivität unter der vorherigen Log Message-Aktivität ein.
- Wählen Sie in der Dropdown-Liste Ebene die Option
Infoaus. - Fügen Sie den Ausdruck
item.Values(0).Value.ToStringin das Feld Nachricht ein.
- Wählen Sie in der Dropdown-Liste Ebene die Option
-
Fügen Sie eine Write Line-Aktivität unterhalb der Log Message-Aktivitäten hinzu.
- Add the value
""in the Text field.
- Add the value
-
Führen Sie den Prozess aus. Der Roboter verwendet die IntelligentOCR-Aktivitäten, um die Daten manuell zu verarbeiten und die Ergebnisse zu präsentieren.
Besuchen Sie den folgenden Link, um das Beispiel als ZIP -Datei herunterzuladen: Beispiel.