- Überblick
- Verträge zur Dokumentverarbeitung
- Über die DocumentProcessing-Verträge
- Box-Klasse
- IPersistedActivity-Schnittstelle
- PrettyBoxConverter-Klasse
- IClassifierActivity-Schnittstelle
- IClassifierCapabilitiesProvider-Schnittstelle
- ClassifierDocumentType-Klasse
- ClassifierResult-Klasse
- ClassifierCodeActivity-Klasse
- ClassifierNativeActivity-Klasse
- ClassifierAsyncCodeActivity-Klasse
- ClassifierDocumentTypeCapability-Klasse
- ExtractorAsyncCodeActivity-Klasse
- ExtractorCodeActivity-Klasse
- ExtractorDocumentType-Klasse
- ExtractorDocumentTypeCapabilities-Klasse
- ExtractorFieldCapability-Klasse
- ExtractorNativeActivity-Klasse
- ExtractorResult-Klasse
- ICapabilitiesProvider-Schnittstelle
- IExtractorActivity-Schnittstelle
- ExtractorPayload-Klasse
- DocumentActionPriority-Enumeration
- DocumentActionData-Klasse
- DocumentActionStatus-Enumeration
- DocumentActionType-Enumeration
- DocumentClassificationActionData-Klasse
- DocumentValidationActionData-Klasse
- UserData-Klasse
- Document-Klasse
- DocumentSplittingResult-Klasse
- DomExtensions-Klasse
- Page-Klasse
- PageSection-Klasse
- Polygon-Klasse
- PolygonConverter-Klasse
- Metadatenklasse
- WordGroup-Klasse
- Word-Klasse
- ProcessingSource-Enumeration
- ResultsTableCell-Klasse
- ResultsTableValue-Klasse
- ResultsTableColumnInfo-Klasse
- ResultsTable-Klasse
- Rotation-Enumeration
- SectionType-Enumeration
- WordGroupType-Enumeration
- IDocumentTextProjection-Schnittstelle
- ClassificationResult-Klasse
- ExtractionResult-Klasse
- ResultsDocument-Klasse
- ResultsDocumentBounds-Klasse
- ResultsDataPoint-Klasse
- ResultsValue-Klasse
- ResultsContentReference-Klasse
- ResultsValueTokens-Klasse
- ResultsDerivedField-Klasse
- ResultsDataSource-Enumeration
- ResultConstants-Klasse
- SimpleFieldValue-Klasse
- TableFieldValue-Klasse
- DocumentGroup-Klasse
- DocumentTaxonomy-Klasse
- DocumentType-Klasse
- Field-Klasse
- FieldType-Enumeration
- LanguageInfo-Klasse
- MetadataEntry-Klasse
- TextType-Aufzählung
- TypeField-Klasse
- ITrackingActivity-Schnittstelle
- ITrainableActivity-Schnittstelle
- ITrainableClassifierActivity-Schnittstelle
- ITrainableExtractorActivity-Schnittstelle
- TrainableClassifierAsyncCodeActivity-Klasse
- TrainableClassifierCodeActivity-Klasse
- TrainableClassifierNativeActivity-Klasse
- TrainableExtractorAsyncCodeActivity-Klasse
- TrainableExtractorCodeActivity-Klasse
- TrainableExtractorNativeActivity-Klasse
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding-Prozess – Studio-Vorlage
- Document Understanding-Aktivitäten
- Über das Document Understanding-Paket
- Projektkompatibilität
- PDF-Passwort festlegen
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- PDF-Seitenbereich extrahieren
- Extract Document Data
- Validierungsaufgabe erstellen und warten
- Wait for Validation Task and Resume
- Create Validation Task
- Dokument klassifizieren (Classify Document)
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Wait For Classification Validation Task And Resume
- IntelligentOCR
- Über das IntelligentOCR-Aktivitätspaket
- Projektkompatibilität
- Taxonomie laden (Load Taxonomy)
- Digitalisieren von Dokumenten
- Dokumentbereich klassifizieren (Classify Document Scope)
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Intelligenter Schlüsselwortklassifizierer
- Present Classification Station
- Create Document Validation Action
- Wait For Document Classification Action And Resume
- Klassifizierer-Scope trainieren
- Keyword Based Classifier Trainer
- Intelligent Keyword Classifier Trainer
- Datenextraktionsumfang
- Regex Based Extractor
- Form Extractor
- Extraktor für intelligente Formulare
- Aktuelle Validierungsstation
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Train Extractors Scope
- Extraktionsergebnisse exportieren
- ML-Services
- OCR
- OCR-Verträge
- Versionshinweise
- Über die OCR-Verträge
- Projektkompatibilität
- IOCRActivity-Schnittstelle
- OCRAsyncCodeActivity-Klasse
- OCRCodeActivity-Klasse
- OCRNativeActivity-Klasse
- Character-Klasse
- OCRResult-Klasse
- Word-Klasse
- FontStyles-Enumeration
- OCRRotation-Enumeration
- OCRCapabilities-Klasse
- OCRScrapeBase-Klasse
- OCRScrapeFactory-Klasse
- ScrapeControlBase-Klasse
- ScrapeEngineUsages-Enumeration
- ScrapeEngineBase
- ScrapeEngineFactory-Klasse
- ScrapeEngineProvider-Klasse
- OmniPage
- PDF
- [Nicht aufgeführt] Abbyy
- Versionshinweise
- Über das Abbyy-Aktivitätspaket
- Projektkompatibilität
- Abbyy OCR
- Abbyy Cloud OCR
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Dokument klassifizieren (Classify Document)
- Dokument verarbeiten (Process Document)
- Dokument validieren (Validate Document)
- Dokument exportieren (Export Document)
- Feld erhalten (Get Field)
- Tabelle erhalten (Get Table)
- Vorbereiten der Validierungsstationsdaten
- [Nicht aufgeführt] Abbyy Embedded
OmniPage OCR
UiPath.OmniPage.Activities
Extrahiert eine Zeichenfolge und ihre Informationen aus einem angegebenen UI-Element oder Bild mithilfe der OmniPage OCR Engine. OmniPage OCR ist eine Alternative zu den anderen OCR-Engines bei allen Aktivitäten, die OCR-Engine-Implementierungen erfordern. Hier sind einige Beispiele für Aktivitäten, die zusammen mit OmniPage OCRverwendet werden können:Klicken Sie auf OCR Text, OCR Text bewegen, Doppelklick auf OCR Text, Get OCR Text, Find OCR Text Position, Dokument digitalisieren, CV Screen Scope, CV Get Text.
Wichtig
Die Handschrifterkennung funktioniert nur für handgedruckten Text, bei dem die Zeichen keine Verbindung haben. Die ideale Größe für ein Dokument liegt zwischen 25 und 45 Pixel.
Allgemein
- AnzeigeName (DisplayName) - Der Anzeigename der Aktivität.
Eingabe
- Bild – Das Bild, das Sie verarbeiten möchten. Dieses Feld unterstützt nur
Image
Variablen.
Sonstiges
- Privat (Private) - Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.
Optionen
-
EnginePack – Gibt an, welche eingebettete Engine für die Bildverarbeitung verwendet werden muss. Es gibt zwei Optionen: Einfach – Unterstützt eine Vielzahl von Sprachen, Erweitert – Enthält zusätzliche Unterstützung für asiatische, arabische, thailändische, hebräische und vietnamesische Sprachen. Sehen Sie sich die Liste aller verfügbaren Sprachen für das Basispaket unten auf dieser Seite an.
Hinweis: Um die Extended -Engine zu verwenden, müssen Sie das Paket UiPath.OmniPage.Bundle.Extended manuell im aktuellen Projekt über den Paket-Managerinstallieren. - Wörter extrahieren – Wenn diese Option ausgewählt ist, wird die Position aller erkannten Wörter auf dem Bildschirm extrahiert.
-
Sprache – Die von der OCR-Engine verwendete Sprache. Die Standardoption ist auto, was bedeutet, dass die Sprache automatisch erkannt wird. Mehrere Sprachen können durch Kommas getrennt verwendet werden.
Hinweis:You can use settings for multiple languages at the same time. For example, you can set "eng,fra" to process images that contain both English as well as French content.
Bitte beachten Sie, dass die Spracheinstellungen für Japanisch, Koreanisch und Chinesisch eine dedizierte Erkennungs-Engine aufrufen. Es sollte jeweils nur eine dieser Sprachen ausgewählt und nicht mit einer nicht-asiatischen Sprache kombiniert werden.
Kurze eingebettete Texte in Englisch können erkannt werden, ohne dass Englisch als Erkennungssprache ausgewählt wird.
- Profil – Wählen Sie ein Vorverarbeitungsprofil für das angegebene Bild oder UI-Element aus, um eine bessere OCR-Lesefunktion zu erzielen. Die folgenden Optionen sind verfügbar: Keine – wendet kein Vorverarbeitungsprofil an, dies ist die Standardoption; Bildschirm – Vorverarbeitung geeignet für Remote-Desktopanwendungen; Scannen – Vorverarbeitung geeignet für gescannte Dateien; Legacy – verwendet die Standardeinstellungen der Engine für die Vorverarbeitung von Bildern.
-
Skalierung (Scale) - Der Skalierungsfaktor des ausgewählten UI-Elements oder Bilds. Je größer die Zahl, desto höher die Vergrößerung des Bilds. So kann das OCR-Lesen besser funktionieren, und wir empfehlen dieses Vorgehen bei kleinen Bildern. Zum Verkleinern sind auch Werte zwischen 0 und 1 möglich. Standardmäßig ist der Wert auf 1 gesetzt.
Hinweis: Wenn Sie diese OCR-Aktivität aus dem Paket UiPath.OmniPage.Activities v1.8.0 in Studio v19.10 verwenden möchten, installieren Sie bitte das UiPath.CoreIPC -Paket, Version 2.0.1 oder höher."Wichtig: Große Bilder können zu einem Fehler führen, wenn der Skalierungsfaktor größer als 1 ist.
Ausgabe
- Ergebnis – Der von der OCR-Engine extrahierte Text zusammen mit seiner Position auf dem Bildschirm, gespeichert in einem
KeyValuePair<Rectangle,String>
. Dieses Feld unterstützt nurKeyValuePair<Rectangle,String>
. - Text – Der von der OCR-Engine extrahierte Text, der in einer String-Variablen gespeichert ist. Dieses Feld unterstützt nur
String
Variablen.
Basispaket – Sprachen |
Sprachcode |
---|---|
Afrikaans |
AFR |
Albanisch |
SQI |
Aymara |
AYM |
Baskisch |
EUS |
Bemba |
BEM |
Schwarzfuß |
BLA |
Brasilianisch |
QBP |
Bretonisch |
BRE |
Bugotu |
BGT |
Bulgarisch |
BUL |
Weißrussisch |
BEL |
Katalanisch |
CAT |
Chamorro |
CHA |
Tschetschenien |
CHE |
Korsisch |
COS |
Kroatisch |
HRV |
Krähe |
CRO |
Tschechisch |
CES |
Dänisch |
DAN |
Niederländisch |
NLD |
Englisch |
ENG |
Eskimo (Inuit) |
QES |
Esperanto |
EPO |
Estnisch |
EST |
Färöisch |
FAO |
Fidschi |
FIJ |
Finnisch |
FIN |
Französisch |
FRA |
Friesisch |
FRY |
Friaulisch |
FUR |
Gälisch (Irisch) |
GLE |
Gälisch (Schottisch) |
GLA |
Galizisch |
GLG |
Ganda |
LUG |
Deutsch |
DEU |
Griechisch |
ELL |
Guarani |
GRN |
Hani * |
HNI |
Hawaiianisch |
HAW |
Ungarisch |
HUN |
Isländisch |
ISL |
Ido |
IDO |
Indonesisch |
IND |
Interlingua |
INA |
Italienisch |
ITA |
Kasub |
CSB |
Kawa * |
WBM |
Kikuyu |
KIK |
Kongo |
KON |
Kpelle |
KPE |
Kurdisch * |
KUR |
Latein |
LAT |
Lettisch |
LAV |
Litauisch |
LIT |
Luba |
LUA |
Luxemburgisch |
LTZ |
Mazedonisch |
MKD |
Madagassisch |
MLG |
Malaiisch |
MSA |
Malinke |
MLQ |
Maltesisch |
MLT |
Maori |
MRI |
Maya |
MYN |
Miao * |
HMN |
Minangkabau |
min |
Mohawk |
MOH |
Moldauisch |
MOL |
Nahuatl |
NAH |
Norwegisch |
NOR |
Nyanja |
NYA |
Okzidental |
OCC |
Ojibway |
OJI |
Papiamento |
PAP |
Pidgin Englisch |
TPI |
Polnisch |
POL |
Portugiesisch |
POR |
Provenzalisch |
PRV |
Quechua |
QUE |
Rätisch |
ROH |
Rumänisch |
RON |
Romani |
ROM |
Ruanda |
KIN |
Rundi |
Ausführen (Run) |
Russisch |
RUS |
Samisch |
SMI |
Sami, Lule |
SMJ |
Samisch, Norden |
SME |
Samisch, Südstaaten |
SMA |
Samoanisch |
SMO |
Sardisch |
SRD |
Serbisch |
SRP |
Serbisch, Latino |
QSL |
Shona |
SNA |
Sioux |
DAK |
Slowakisch |
SLK |
Slowenisch |
SLV |
Somalisch |
SOM |
Sorbisch (Wend) |
WEN |
Sotho |
SOT |
Spanisch |
SPA |
Sundanesisch |
Son |
Swahili |
SWA |
Swasiland |
SSW |
Schwedisch |
SWE |
Tagalog |
TGL |
Tahiti |
TAH |
Pireza |
QTI |
Tongaisch |
TON |
Tswana (Chuana) |
TSN |
Tun * |
TUG |
Türkisch |
TUR |
Ukrainisch |
UKR |
Visayan |
QIS |
Walisisch |
CYM |
Wolof |
WOL |
Xhosa |
XHO |
Zapoteken |
ZAP |
Zulu |
ZUL |
= Diese Sprache kann nur verarbeitet werden, wenn sie mit dem lateinischen Alphabet geschrieben ist. |
Erweitertes Paket – Sprachen |
Sprachcode |
---|---|
Alle im Basispaket enthaltenen Sprachen | |
Japanisch |
JPN |
Vereinfachtes Chinesisch |
QCS |
Traditionelles Chinesisch |
QCT |
Koreanisch |
KOR |
Thai |
THA |
Arabisch |
ARA |
Hebräisch |
HEB |
Vietnamesisch (Latein) |
VIE |