document-understanding
2024.10
false
- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Deep Learning
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Document Understanding-Benutzerhandbuch.
Last updated 11. Nov. 2024
OCR
Each OCR engine is tailored to deliver efficient and effective optical character recognition, regardless of your specific needs or deployment. This page provides information on the supported languages for UiPath® OCR engines:
- UiPath Document OCR: Die Standardeinstellung für UiPath OCR, die regelmäßig aktualisiert und verbessert wird. Sie können sie entweder auf der GPU oder CPU verwenden und liefern in beiden Fällen die gleiche Genauigkeit.
- UiPath Document OCR_CPU: Speziell für die Ausführung auf CPU optimiert.
- UiPath Extended Languages OCR: Kann Dokumente in über 200 Sprachen verarbeiten, insbesondere in Chinesisch, Koreanisch, Vietnamesisch, Thailändisch, den wichtigsten indischen Sprachen und Sprachen, die das kyrillische oder griechische Alphabet verwenden.
- : available as an endpoint and only for CPU deployments.
Tipp: Die Auswahl des richtigen OCR-Moduls für Ihre Dokumente ist einfach. Verwenden Sie standardmäßig UiPath Document OCR, das regelmäßig aktualisiert und verbessert wird. Wenn dieses Ihre Dokumentsprache nicht unterstützt oder nicht gut funktioniert, wechseln Sie zu einem unserer anderen OCR-Module, z. B. UiPath Extended Languages OCR.
Sprache (Sprachcode) | UiPath Document OCR und UiPath Document OCR_CPU | UiPath OCR für erweiterte Sprachen | OCR für Chinesisch, Japanisch, Koreanisch |
---|---|---|---|
Adygeisch (ADY) | |||
Afar (AA) | |||
Afrikaans (AFR) | |||
Akan (AK) | |||
Albanisch (SQI) | |||
Algonkin (ALQ) | |||
Angika (Devanagari) (ANP) | |||
Arabisch (ARA) | (Preview) | ||
Asturisch (AST) | |||
Asu (ASA) | |||
Awarisch (AV) | |||
Awadhi-Hindi (Devanagari) (AWA) | |||
Aymara (AYM) | |||
Aserbaidschanisch (lateinisch) (AZ) | |||
Bafia (KSF) | |||
Bagheli (BFY) | |||
Bambara (BM) | |||
Baschkirisch (BA) | |||
Baskisch (EU) | |||
Belarussisch (kyrillisch) (BE, BE-CYRL) | |||
Belarussisch (lateinisch) (BE, BE-LATN) | |||
Bemba (BEM) | |||
Bena (BEZ) | |||
Bhojpuri-Hindi (Devanagari) (BHO) | |||
Bikolano (BIK) | |||
Bislama (BI) | |||
Bodo (Devanagari) (BRX) | |||
Bosnisch (lateinisch) (BS) | |||
Brajbha (BRA) | |||
Bretonisch (BR) | |||
Bulgarisch (BU) | |||
Bundeli (BNS) | |||
Burjatisch (kyrillisch) (BUA) | |||
Katalanisch (CA) | |||
Cebuano (CEB) | |||
Chamling (RAB) | |||
Chamorro (CH) | |||
Tschetschenisch (CE) | |||
Chhattisgarhi (Devanagari) (HNE) | |||
Chiga (CGG) | |||
Chinesisch – vereinfacht (ZH-Hans) | |||
Chinesisch – traditionell (Hant) | |||
Choctaw (CHO) | |||
Tschuktschisch (CKT) | |||
Tschuwaschisch (CV) | |||
Kornisch (KW) | |||
Korsisch (CO) | |||
Cree (CR) | |||
Creek (MUS) | |||
Krimtatarisch (lateinisch) (CRH) | |||
Kroatisch (HR) | |||
Crow (CRO) | |||
Tschechisch (CS) | |||
Dänisch (DA) | |||
Darginisch (DAR) | |||
Dari (PRS) | |||
Dhimal (Devanagari) (DHI) | |||
Dogri (Devanagari) (DOI) | |||
Duala (DUA) | |||
Dungan (DNG) | |||
Niederländisch (NL) | |||
Efik (EFI) | |||
Englisch (EN) | |||
Ersjanisch (kyrillisch) (MYV) | |||
Estnisch (ET) | |||
Färöisch (FO) | |||
Fidschi (FJ) | |||
Philippinisch (FIL) | |||
Finnisch (FI) | |||
Fon (FON) | |||
Französisch (FR) | |||
Friaulisch (FUR) | |||
Ga (GAA) | |||
Gälisch – Irisch (GA) | |||
Gälisch – Schottisch (GD) | |||
Gagausisch (lateinisch) (GAG) | |||
Galicisch (GL) | |||
Ganda (LG) | |||
Gayo (GAY) | |||
Deutsch (DE) | |||
Gilbertesisch – (GIL) | |||
Gondi (Devanagari) (GON) | |||
Griechisch (EL) | |||
Grönländisch (KL) | |||
Guaraní (GN) | |||
Gurung (Devanagari) | |||
Gusii (GUZ) | |||
Haitianisch-Kreolisch (HT) | |||
Halbi (Devanagari) (HLB) | |||
Hani (HNI) | |||
Haryanvi (BGC) | |||
Hawaiisch (HAW) | |||
Hebräisch (HE) | |||
Herero (HZ) | |||
Hiligaynon (HIL) | |||
Hindi (HI) | |||
Hmong Daw (lateinisch) (MWW) | |||
Ho (Devanagari) (HOC) | |||
Ungarisch (HU) | |||
Iban (IBA) | |||
Isländisch (IS) | |||
Igbo (IG) | |||
Iloko (ILO) | |||
Inarisamisch (SMN) | |||
Indonesisch (ID) | |||
Inguschisch (INH) | |||
Interlingua (IA) | |||
Inuktitut (lateinisch) (IU) | |||
Italienisch (IT) | |||
Japanisch (JA) | |||
Jaunsari (Devanagari) (JNS) | |||
Javanisch (JV) | |||
Jola-Fonyi (DYO) | |||
Kabardinisch (KBD) | |||
Kabuverdianu (KEA) | |||
Kachin (lateinisch) (KAC) | |||
Kalenjin (KLN) | |||
Kalmückisch (XAL) | |||
Kangri (Devanagari) (XNR) | |||
Kanuri (KR) | |||
Karatschai-balkarisch (KRC) | |||
Karakalpakisch (kyrillisch) (KAA-CYR) | |||
Karakalpakisch (lateinisch) (KAA) | |||
Kaschubisch (CSB) | |||
Kasachisch (kyrillisch) (KK-CYR) | |||
Kasachisch (lateinisch) (KK-LATN) | |||
Chakassisch (KJH) | |||
Khaling (KLR) | |||
Khasi (KHA) | |||
K'iche' (QUC) | |||
Kikuyu (KI) | |||
Kildinsamisch (SJD) | |||
Kinyarwanda (RW) | |||
Komi (KV) | |||
Kongo (KN) | |||
Koreanisch (KO) | |||
Korku (KFQ) | |||
Korjakisch (KPY) | |||
Kosraeanisch (KOS) | |||
Kpelle (KPE) | |||
Kuanyama (KJ) | |||
Kumykisch (kyrillisch) (KUM) | |||
Kurdisch (arabisch) (KU-ARAB) | |||
Kurdisch (lateinisch) (KU-LATN) | |||
Kurukh (Devanagari) (KRU) | |||
Kirgisisch (kyrillisch) (KY) | |||
Lakisch (LBE) | |||
Lakota (LKT) | |||
Latein (LA) | |||
Lettisch (LV) | |||
Lesgisch (LEX) | |||
Lingala (LN) | |||
Litauisch (LT) | |||
Niedersorbisch (DSB) | |||
Lozi (LOZ) | |||
Lulesamisch (SMJ) | |||
Luo (Kenia und Tansania) (LUO) | |||
Luxemburgisch (LB) | |||
Luhya (LUY) | |||
Mazedonisch (MK) | |||
Machame (JMC) | |||
Maduresisch (MAD) | |||
Mahasu Pahari (Devanagari) (BFZ) | |||
Makua-Meetto (MGH) | |||
Makonde (KDE) | |||
Madagassisch (MG) | |||
Malaiisch (lateinisch) (MS) | |||
Maltesisch (MT) | |||
Malto (Devanagari) (KMJ) | |||
Mandinka (MNK) | |||
Manx (GV) | |||
Maori (MI) | |||
Mapudungun (ARN) | |||
Marathi (MR) | |||
Mari (Russland) (CHM) | |||
Masai (MAS) | |||
Minde (Sierra Leone) (MEN) | |||
Meru (MER) | |||
Meta' (MGO) | |||
Minangkabau (MIN) | |||
Mohawk (MOH) | |||
Mongolisch (kyrillisch) (MN) | |||
Mongondow (MOG) | |||
Montenegrinisch (kyrillisch) (CNR-CYRL) | |||
Montenegrinisch (lateinisch) (CNR-LATN) | |||
Morisyen (MFE) | |||
Mundang (MUA) | |||
Nahuatl (NAH) | |||
Navajo (NV) | |||
Ndonga (NG) | |||
Neapolitanisch (NAP) | |||
Nepali (NE) | |||
Ngomba (JGO) | |||
Niueanisch (NIU) | |||
Nogaisch (NOG) | |||
Nord-Ndebele (ND) | |||
Nordsamisch (lateinisch) (SME) | |||
Norwegisch (NO) | |||
Nyanja (NY) | |||
Runyankole (NYN) | |||
Nzema (NZI) | |||
Okzitanisch (OC) | |||
Ojibway (OJ) | |||
Oromo (OM) | |||
Ossetisch (OS) | |||
Kapampangan (PAM) | |||
Pangasinensisch (PAG) | |||
Papiamento (PAP) | |||
Paschtu (PS) | |||
Pedi (NSO) | |||
Persisch (FA) | |||
Polnisch (PL) | |||
Portugiesisch (PT) | |||
Panjabi (arabisch) (PA) | |||
Quechua (QU) | |||
Ripuarisch (KSH) | |||
Rumänisch (RO) | |||
Rätoromanisch (RM) | |||
Kirundi (RN) | |||
Russisch (RU) | |||
Rwa (RWK) | |||
Sadri (Devanagari) (SCK) | |||
Jakutisch (SAH) | |||
Samburu (SAQ) | |||
Samoanisch (lateinisch) (SM) | |||
Sango (SG) | |||
Sangu (Gabun) | |||
Sanskrit (Devanagari) (SA) | |||
Santali (Devanagari) (SAT) | |||
Schottisch (SCO) | |||
Sena (SEH) | |||
Serbisch (kyrillisch) (SR-CYRL) | |||
Serbisch (lateinisch) (SR, SR-LATN) | |||
Shambala (KSB) | |||
Shona (SN) | |||
Siksika (BLA) | |||
Sirmauri (Devanagari) (SRX) | |||
Skoltsamisch (SMS) | |||
Slowakisch (SK) | |||
Slowenisch (SL) | |||
Soga (XOG) | |||
Somali (arabisch) (SO) | |||
Somali (lateinisch) (SO-LATN) | |||
Songhai (SON) | |||
Süd-Ndebele (NR) | |||
Südaltaisch (ALT) | |||
Südsamisch (SMA) | |||
Sesotho (ST) | |||
Spanisch (ES) | |||
Sudanesisch (SU) | |||
Swahili (lateinisch) (SW) | |||
Siswati (SS) | |||
Schwedisch (SV) | |||
Tabassaranisch (TAB) | |||
Taschelhit (SHI) | |||
Tahitianisch (TY) | |||
Taita (DAV) | |||
Tadschikisch (kyrillisch) (TG) | |||
Tamil (TA) | |||
Tatarisch (kyrillisch) (TT-CYRL) | |||
Tatarisch (lateinisch) (TT) | |||
Ateso (TEO) | |||
Tetum (TET) | |||
Thai (TH) | |||
Thangmi (THF) | |||
Tok Pisin (TPI) | |||
Tongaisch (TO) | |||
Tsonga (TS) | |||
Tswana (TN) | |||
Türkisch (TR) | |||
Turkmenisch (lateinisch) (TK) | |||
Tuwinisch (tyv) | |||
Udmurtisch (UDM) | |||
Uigurisch (kyrillisch) (UG-CYRL) | |||
Ukrainisch (UK) | |||
Obersorbisch (HSB) | |||
Urdu (UR) | |||
Uigurisch (arabisch) (UG) | |||
Usbekisch (arabisch) (UZ-ARAB) | |||
Usbekisch (kyrillisch) (UZ-CYRL) | |||
Usbekisch (lateinisch) (UZ) | |||
Vietnamesisch (VI) | |||
Volapük (VO) | |||
Vunjo (VUN) | |||
Walliserdeutsch (WAE) | |||
Walisisch (CY) | |||
Westfriesisch (FY) | |||
Wolof (WO) | |||
Xhosa (XH) | |||
Yukatekisches Maya (YUA) | |||
Sapotekisch (ZAP) | |||
Zarma (DJE) | |||
Zhuang (ZA) | |||
Zulu (ZU) |
Arabische Zeichen | 'ا','ب','ة','ت','ث','ج','ح','خ','د','ذ','ر','ز','س','ش','ص','ض','ط','ظ','ع','غ','ـ','ف','ق','ك','ل','م','ن','ه','و','ى','ي','ٓ','ٔ','ٕ','٠','١','٢','٣','٤','٥','٦','٧','٨','٩','٪','٫','٬','٭','ٱ','۔','ً','ٌ','ٍ','َ','ُ','ِ','ّ','ْ','ٰ','ۥ','ۦ','آ','،','؛','؟','ء','أ','ؤ','إ','ئ' |
Unterstützte OCR-Zeichen | ! " # $ % & \ ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ \ ] ^ _ a b c d e f g h i j k l m n o p q r s t u v w x y z { | } ~ £ ¥ § © ® ° ¿ À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï Ñ Ò Ó Ô Õ Ö Ø Ù Ú Û Ü Ý ß à á â ã ä å æ ç è é ê ë ì í î ï ñ ò ó ô õ ö ø ù ú û ü ý Ā ā Ă ă Ą ą Ć ć Ċ ċ Č č Ď ď Đ đ Ē ē Ė ė Ę ę Ě ě Ğ ğ Ġ ġ Ħ ħ Ī ī Ĭ ĭ Į į İ ı Ĺ ĺ Ľ ľ Ł ł Ń ń Ň ň Ŋ ŋ Ō ō Ő ő Œ œ Ŕ ŕ Ř ř Ś ś Š š Ť ť Ŧ ŧ Ū ū Ŭ ŭ Ů ů Ų ų Ź ź Ż ż Ž ž Ə Ǵ ǵ Ș ș Ț ț ə μ א ב ג ד ה ו ז ח ט י ך כ ל ם מ ן נ ס ע ף פ ץ צ ק ר ש ת ₪ € ≤ ≥ |