- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- FieldValueDetails Class
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- BasicDataPoint-Klasse – Vorschau
- ExtractionResultHandler-Klasse – Vorschau
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren einer externen Verbindung
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Create Document Validation Artifacts
- Artefakte der Dokumentvalidierung abrufen
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Dokument zensieren
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Generativer Klassifizierer
- Generativer Extraktor
- Konfigurieren der Authentifizierung
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Document Understanding-Aktivitäten
UiPath.OmniPage.Activities
Die Handschrifterkennung funktioniert nur bei handschriftlichen Texten, bei denen die Zeichen keine Verbindung haben. Die ideale Größe für ein Dokument liegt zwischen 25 und 45 Pixeln.
Beschreibung
Extrahiert mit dem OmniPage OCR- Modul einen String und seine Informationen aus einem angegebenen UI-Element oder Bild. Die OmniPage OCR ist eine Alternative zu den anderen OCR-Engines in allen Aktivitäten, die OCR-Engine-Implementierungen erfordern. Hier sind einige Beispiele für Aktivitäten, die zusammen mit OmniPage OCR verwendet werden können:Click OCR Text, Hover OCR Text, Double Click OCR Text, Get OCR Text, Find OCR Text Position, Digitize Document, CV Screen Scope, CV Get Text.
Das Paket UiPath.OmniPage.Activities, v1.9.0 oder höher, wurde auf .NET5 Core aktualisiert. Diese Änderung impliziert, dass das .NET5-Framework auf Ihrer Maschine installiert sein muss, wenn das Paket in einem Workflow außerhalb von Windows ausgeführt wird.
Die Aktivität OmniPage OCR ist kompatibel mit dem Paket UiPath.IntelligentOCR.Activities, v2.0.0 oder höher, und kann in jedem OCR-Kontext verwendet werden.
Projektkompatibilität
Windows-Legacy | Windows
Konfiguration
Eigenschaften-Panel
Allgemein
- AnzeigeName (DisplayName) - Der Anzeigename der Aktivität.
Eingabe
- Bild (Image) - Das Bild, das Sie verarbeiten möchten. Dieses Feld unterstützt nur
Image-Variablen.
Sonstiges
- Privat (Private) - Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.
Optionen
-
EnginePack - Gibt an, welche eingebettete Engine für die Bildverarbeitung verwendet werden muss. Es gibt zwei folgende Optionen: Basic – unterstützt eine Vielzahl von Sprachen, Extended – enthält zusätzliche Unterstützung für die Sprachen Asien, Arabisch, Thailändisch, Hebräisch und Vietnamesisch. Überprüfen Sie die Liste aller verfügbaren Sprachen für das Basispaket am Ende dieser Seite.
Hinweis:Um das erweiterte Modul verwenden zu können, müssen Sie das Paket UiPath.OmniPage.Bundle.Extended im aktuellen Projekt über den Paketmanager manuell installieren.
-
ExtractWords - If selected, extracts the on-screen position of all detected words.
-
Language - The language used by the OCR engine. The default option is auto, meaning that the language is automatically detected. Multiple languages can be used separated by commas.
Hinweis:You can use settings for multiple languages at the same time. For example, you can set "eng,fra" to process images that contain both English as well as French content.
Beachten Sie, dass die Spracheinstellungen für Japanisch, Koreanisch und Chinesisch eine eigene Erkennungs-Engine aufrufen. Es sollte jeweils nur eine dieser Sprachen ausgewählt werden und nicht mit einer nicht- Schritt für Schritt kombiniert werden.
Kurze eingebettete Texte in Englisch können erkannt werden, ohne dass Englisch als Erkennungssprache ausgewählt wird.
-
Profil – Wählen Sie ein Vorverarbeitungsprofil für das angegebene Bild oder UI-Element aus, um eine bessere OCR-Lesefunktion zu erzielen. Die folgenden Optionen sind verfügbar:
- Keines – wendet kein Vorverarbeitungsprofil an, dies ist die Standardoption;
- Screen - Vorverarbeitung geeignet für Remote-Desktop-Anwendungen;
- Scan – Vorverarbeitung geeignet für gescannte Dateien;
- Legacy – verwendet die Standardeinstellungen des Moduls für die Vorverarbeitung von Bildern.
-
Skalierung (Scale) - Der Skalierungsfaktor des ausgewählten UI-Elements oder Bilds. Je größer die Zahl, desto höher die Vergrößerung des Bilds. So kann das OCR-Lesen besser funktionieren, und wir empfehlen dieses Vorgehen bei kleinen Bildern. Zum Verkleinern sind auch Werte zwischen 0 und 1 möglich. Standardmäßig ist der Wert auf 1 gesetzt.
Hinweis:Wenn Sie diese OCR-Aktivität aus dem Paket UiPath.OmniPage.Activities v1.8.0 in Studio v19.10 verwenden möchten, installieren Sie das UiPath.CoreIPC -Paket, Version 2.0.1 oder höher.
Wichtig:Große Bilder können zu einem Fehler führen, wenn der Skalierungsfaktor größer als 1 ist.
Ausgabe
- Result - The text extracted by the OCR engine along with their on-screen position, stored in a
KeyValuePair<Rectangle,String>. This field supports onlyKeyValuePair<Rectangle,String>. - Text - The text extracted by the OCR engine, stored in a String variable. This field supports only
Stringvariables.
Unterstützte Sprachen
Die folgende Tabelle zeigt eine Liste aller von OmniPage OCR unterstützten Sprachen sowie deren entsprechende Sprachcodes.
Tabelle 1. Unterstützte Sprachen und Sprachcodes für OmniPage OCR – Basic Pack-Sprachen
| Sprachcode | |
|---|---|
| Afrikaans | AFR |
| Albanisch | SQI |
| Aymara | AYM |
| Baskisch | EUS |
| Bemba | BEM |
| Schwarzfuß | BLA |
| Brasilianisch | QBP |
| Bretonisch | BRE |
| Bugotu | BGT |
| Bulgarisch | BUL |
| Weißrussisch | BEL |
| Katalanisch | CAT |
| Chamorro | CHA |
| Tschetschenien | CHE |
| Korsisch | COS |
| Kroatisch | HRV |
| Krähe | CRO |
| Tschechisch | CES |
| Dänisch | DAN |
| Niederländisch | NLD |
| Englisch | ENG |
| Eskimo (Inuit) | QES |
| Esperanto | EPO |
| Estnisch | EST |
| Färöisch | FAO |
| Fidschi | FIJ |
| Finnisch | FIN |
| Französisch | FRA |
| Friesisch | FRY |
| Friaulisch | FUR |
| Gälisch (Irisch) | GLE |
| Gälisch (Schottisch) | GLA |
| Galizisch | GLG |
| Ganda | LUG |
| Deutsch | DEU |
| Griechisch | ELL |
| Guarani | GRN |
| Hani * | HNI |
| Hawaiianisch | HAW |
| Ungarisch | HUN |
| Isländisch | ISL |
| Ido | IDO |
| Indonesisch | IND |
| Interlingua | INA |
| Italienisch | ITA |
| Kasub | CSB |
| Kawa * | WBM |
| Kikuyu | KIK |
| Kongo | KON |
| Kpelle | KPE |
| Kurdisch * | KUR |
| Latein | LAT |
| Lettisch | LAV |
| Litauisch | LIT |
| Luba | LUA |
| Luxemburgisch | LTZ |
| Mazedonisch | MKD |
| Madagassisch | MLG |
| Malaiisch | MSA |
| Malinke | MLQ |
| Maltesisch | MLT |
| Maori | MRI |
| Maya | MYN |
| Miao * | HMN |
| Minangkabau | min |
| Mohawk | MOH |
| Moldauisch | MOL |
| Nahuatl | NAH |
| Norwegisch | NOR |
| Nyanja | NYA |
| Okzidental | OCC |
| Ojibway | OJI |
| Papiamento | PAP |
| Pidgin Englisch | TPI |
| Polnisch | POL |
| Portugiesisch | POR |
| Provenzalisch | PRV |
| Quechua | QUE |
| Rätisch | ROH |
| Rumänisch | RON |
| Romani | ROM |
| Ruanda | KIN |
| Rundi | Ausführen (Run) |
| Russisch | RUS |
| Samisch | SMI |
| Sami, Lule | SMJ |
| Samisch, Norden | SME |
| Samisch, Südstaaten | SMA |
| Samoanisch | SMO |
| Sardisch | SRD |
| Serbisch | SRP |
| Serbisch, Latino | QSL |
| Shona | SNA |
| Sioux | DAK |
| Slowakisch | SLK |
| Slowenisch | SLV |
| Somalisch | SOM |
| Sorbisch (Wend) | WEN |
| Sotho | SOT |
| Spanisch | SPA |
| Sundanesisch | Son |
| Swahili | SWA |
| Swasiland | SSW |
| Schwedisch | SWE |
| Tagalog | TGL |
| Tahiti | TAH |
| Pireza | QTI |
| Tongaisch | TON |
| Tswana (Chuana) | TSN |
| Tun * | TUG |
| Türkisch | TUR |
| Ukrainisch | UKR |
| Visayan | QIS |
| Walisisch | CYM |
| Wolof | WOL |
| Xhosa | XHO |
| Zapoteken | ZAP |
| Zulu | ZUL |
| = Diese Sprache kann nur verarbeitet werden, wenn sie mit dem lateinischen Alphabet geschrieben ist. |
Tabelle 2. Unterstützte Sprachen und Sprachcodes für OmniPage OCR – Extended Pack-Sprachen
| Sprachcode | |
|---|---|
| Alle im Basispaket enthaltenen Sprachen | |
| Japanisch | JPN |
| Vereinfachtes Chinesisch | QCS |
| Traditionelles Chinesisch | QCT |
| Koreanisch | KOR |
| Thai | THA |
| Arabisch | ARA |
| Hebräisch | HEB |
| Vietnamesisch (Latein) | VIE |
The Extended Pack can be used with the ISO/DIS 639-3 language codes mentioned above, with the ISO 639-1 and ISO 639-2 language codes, or with the actual name of the language.