- Überblick
- Verträge zur Dokumentverarbeitung
- Versionshinweise
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Versionshinweise
- Über das Document Understanding-Aktivitätspaket
- Projektkompatibilität
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Versionshinweise
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Konfigurieren der Authentifizierung
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Document Understanding-Projektklassifizierer
- Intelligenter Schlüsselwortklassifizierer
- Create Document Validation Action
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Document Understanding-Projektextraktor
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Aktuelle Validierungsstation
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
Document Understanding-Aktivitäten
OmniPage OCR
UiPath.OmniPage.Activities
Extrahiert eine Zeichenfolge und ihre Informationen aus einem angegebenen UI-Element oder Bild mithilfe der OmniPage OCR Engine. OmniPage OCR ist eine Alternative zu den anderen OCR-Engines bei allen Aktivitäten, die OCR-Engine-Implementierungen erfordern. Hier sind einige Beispiele für Aktivitäten, die zusammen mit OmniPage OCRverwendet werden können:Klicken Sie auf OCR Text, OCR Text bewegen, Doppelklick auf OCR Text, Get OCR Text, Find OCR Text Position, Dokument digitalisieren, CV Screen Scope, CV Get Text.
Eigenschaften-Panel
Allgemein
- AnzeigeName (DisplayName) - Der Anzeigename der Aktivität.
Eingabe
- Bild – Das Bild, das Sie verarbeiten möchten. Dieses Feld unterstützt nur
Image
Variablen.
Sonstiges
- Privat (Private) - Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.
Optionen
- EnginePaket (EnginePack) - Gibt an, welche eingebettete Engine für die Bildverarbeitung verwendet werden muss. Es gibt die folgenden zwei Optionen: Standard – unterstützt eine Vielzahl von Sprachen, Erweitert – Enthält zusätzliche Unterstützung für asiatische, arabische, tray, hebräische und Vietnamesische Sprachen. Überprüfen Sie die Liste aller verfügbaren Sprachen für das Basis -Paket am Ende dieser Seite.
Hinweis: Um die Extended -Engine zu verwenden, müssen Sie das Paket UiPath.OmniPage.Bundle.Extended manuell im aktuellen Projekt über den Paket-Managerinstallieren.
- Wörter extrahieren – Wenn diese Option ausgewählt ist, wird die Position aller erkannten Wörter auf dem Bildschirm extrahiert.
- Sprache – Die von der OCR-Engine verwendete Sprache. Die Standardoption ist auto, was bedeutet, dass die Sprache automatisch erkannt wird. Mehrere Sprachen können durch Kommas getrennt verwendet werden.
Hinweis:
You can use settings for multiple languages at the same time. For example, you can set "eng,fra" to process images that contain both English as well as French content.
Beachten Sie, dass die Spracheinstellungen für Japanisch, Koreanisch und Chinesisch eine eigene Erkennungs-Engine aufrufen. Es sollte jeweils nur eine dieser Sprachen ausgewählt werden und nicht mit einer nicht- Schritt für Schritt kombiniert werden.
Kurze eingebettete Texte in Englisch können erkannt werden, ohne dass Englisch als Erkennungssprache ausgewählt wird.
- Profil – Wählen Sie ein Vorverarbeitungsprofil für das angegebene Bild oder UI-Element aus, um eine bessere OCR-Lesefunktion zu erzielen. Die folgenden Optionen sind verfügbar:
- Keines – wendet kein Vorverarbeitungsprofil an, dies ist die Standardoption;
- Screen – Vorverarbeitung, geeignet für Remotedesktopanwendungen;
- Scan – Vorverarbeitung geeignet für gescannte Dateien;
- Legacy – Verwendet die Standardeinstellungen der Engine für die Vorverarbeitung von Bildern.
- Skalierung (Scale) - Der Skalierungsfaktor des ausgewählten UI-Elements oder Bilds. Je größer die Zahl, desto höher die Vergrößerung des Bilds. So kann das OCR-Lesen besser funktionieren, und wir empfehlen dieses Vorgehen bei kleinen Bildern. Zum Verkleinern sind auch Werte zwischen 0 und 1 möglich. Standardmäßig ist der Wert auf 1 gesetzt.
Hinweis: Wenn Sie diese OCR-Aktivität aus dem Paket UiPath.OmniPage.Activities v1.8.0 in Studio v19.10 verwenden möchten, installieren Sie das UiPath.CoreIPC- Paket, Version 2.0.1 oder höher.Wichtig: Große Bilder können zu einem Fehler führen, wenn der Skalierungsfaktor größer als 1 ist.
Ausgabe
- Ergebnis – Der von der OCR-Engine extrahierte Text zusammen mit seiner Position auf dem Bildschirm, gespeichert in einem
KeyValuePair<Rectangle,String>
. Dieses Feld unterstützt nurKeyValuePair<Rectangle,String>
. - Text – Der von der OCR-Engine extrahierte Text, der in einer String-Variablen gespeichert ist. Dieses Feld unterstützt nur
String
Variablen.
Die folgende Tabelle zeigt eine Liste aller von OmniPage OCR unterstützten Sprachen sowie deren entsprechende Sprachcodes.
Sprachcode | |
---|---|
Afrikaans |
AFR |
Albanisch |
SQI |
Aymara |
AYM |
Baskisch |
EUS |
Bemba |
BEM |
Schwarzfuß |
BLA |
Brasilianisch |
QBP |
Bretonisch |
BRE |
Bugotu |
BGT |
Bulgarisch |
BUL |
Weißrussisch |
BEL |
Katalanisch |
CAT |
Chamorro |
CHA |
Tschetschenien |
CHE |
Korsisch |
COS |
Kroatisch |
HRV |
Krähe |
CRO |
Tschechisch |
CES |
Dänisch |
DAN |
Niederländisch |
NLD |
Englisch |
ENG |
Eskimo (Inuit) |
QES |
Esperanto |
EPO |
Estnisch |
EST |
Färöisch |
FAO |
Fidschi |
FIJ |
Finnisch |
FIN |
Französisch |
FRA |
Friesisch |
FRY |
Friaulisch |
FUR |
Gälisch (Irisch) |
GLE |
Gälisch (Schottisch) |
GLA |
Galizisch |
GLG |
Ganda |
LUG |
Deutsch |
DEU |
Griechisch |
ELL |
Guarani |
GRN |
Hani * |
HNI |
Hawaiianisch |
HAW |
Ungarisch |
HUN |
Isländisch |
ISL |
Ido |
IDO |
Indonesisch |
IND |
Interlingua |
INA |
Italienisch |
ITA |
Kasub |
CSB |
Kawa * |
WBM |
Kikuyu |
KIK |
Kongo |
KON |
Kpelle |
KPE |
Kurdisch * |
KUR |
Latein |
LAT |
Lettisch |
LAV |
Litauisch |
LIT |
Luba |
LUA |
Luxemburgisch |
LTZ |
Mazedonisch |
MKD |
Madagassisch |
MLG |
Malaiisch |
MSA |
Malinke |
MLQ |
Maltesisch |
MLT |
Maori |
MRI |
Maya |
MYN |
Miao * |
HMN |
Minangkabau |
min |
Mohawk |
MOH |
Moldauisch |
MOL |
Nahuatl |
NAH |
Norwegisch |
NOR |
Nyanja |
NYA |
Okzidental |
OCC |
Ojibway |
OJI |
Papiamento |
PAP |
Pidgin Englisch |
TPI |
Polnisch |
POL |
Portugiesisch |
POR |
Provenzalisch |
PRV |
Quechua |
QUE |
Rätisch |
ROH |
Rumänisch |
RON |
Romani |
ROM |
Ruanda |
KIN |
Rundi |
Ausführen (Run) |
Russisch |
RUS |
Samisch |
SMI |
Sami, Lule |
SMJ |
Samisch, Norden |
SME |
Samisch, Südstaaten |
SMA |
Samoanisch |
SMO |
Sardisch |
SRD |
Serbisch |
SRP |
Serbisch, Latino |
QSL |
Shona |
SNA |
Sioux |
DAK |
Slowakisch |
SLK |
Slowenisch |
SLV |
Somalisch |
SOM |
Sorbisch (Wend) |
WEN |
Sotho |
SOT |
Spanisch |
SPA |
Sundanesisch |
Son |
Swahili |
SWA |
Swasiland |
SSW |
Schwedisch |
SWE |
Tagalog |
TGL |
Tahiti |
TAH |
Pireza |
QTI |
Tongaisch |
TON |
Tswana (Chuana) |
TSN |
Tun * |
TUG |
Türkisch |
TUR |
Ukrainisch |
UKR |
Visayan |
QIS |
Walisisch |
CYM |
Wolof |
WOL |
Xhosa |
XHO |
Zapoteken |
ZAP |
Zulu |
ZUL |
= Diese Sprache kann nur verarbeitet werden, wenn sie mit dem lateinischen Alphabet geschrieben ist. |
Sprachcode | |
---|---|
Alle im Basispaket enthaltenen Sprachen | |
Japanisch |
JPN |
Vereinfachtes Chinesisch |
QCS |
Traditionelles Chinesisch |
QCT |
Koreanisch |
KOR |
Thai |
THA |
Arabisch |
ARA |
Hebräisch |
HEB |
Vietnamesisch (Latein) |
VIE |