document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white

Document Understanding User Guide

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated Dec 18, 2024

OCR

Each OCR engine is tailored to deliver efficient and effective optical character recognition, regardless of your specific needs or deployment. This page provides information on the supported languages for UiPath® OCR engines:
  • UiPath Document OCR: default UiPath OCR, which receives regular updates and improvements. You can use it on either GPU or CPU, delivering the same level of accuracy in both cases.
  • UiPath Document OCR_CPU: specially optimized to run on CPU.
  • UiPath Extended Languages OCR: capable of processing documents in over 200 languages, especially in Chinese, Korean, Vietnamese, Thai, major Indian languages, and languages that use the Cyrilic or Greek alphabets.
Tip: Choosing the right OCR engine for your documents is simple. By default, use the UiPath Document OCR, which benefits from regular updates and improvements. If this doesn't support your document language or it's not performing as expected, switch to one of our other OCR engines, like the UiPath Extended Languages OCR.

Printed text

Language (Language Code)UiPath Document OCR and UiPath Document OCR_CPUUiPath Extended Languages OCRChinese, Japanese, Korean OCR
Adyghe (ADY) available 
Afar (AA) available 
Afrikaans (AFR)availableavailable 
Akan (AK) available 
Albanian (SQI)availableavailable 
Algonquin (ALQ) available 
Angika (Devanagari) (ANP) available 
Arabic (ARA)available (Preview)available 
Asturian (AST)availableavailable 
Asu (ASA) available 
Avaric (AV) available 
Awadhi-Hindi (Devanagari) (AWA) available 
Aymara (AYM) available 
Azerbaijani (Latin) (AZ) available 
Bafia (KSF) available 
Bagheli (BFY) available 
Bambara (BM) available 
Bashkir (BA) available 
Basque (EU)availableavailable 
Belarusian (Cyrilic) (BE, BE-CYRL) available 
Belarusian (Latin) (BE, BE-LATN) available 
Bemba (BEM) available 
Bena (BEZ) available 
Bhojpuri-Hindi (Devanagari) (BHO) available 
Bikol (BIK) available 
Bislama (BI)availableavailable 
Bodo (Devanagari) (BRX) available 
Bosnian (Latin) (BS) available 
Brajbha (BRA) available 
Breton (BR) available 
Bulgarian (BG) available 
Bundeli (BNS) available 
Buryat (Cyrilic) (BUA) available 
Catalan (CA)availableavailable 
Cebuano (CEB)availableavailable 
Chamling (RAB) available 
Chamorro (CH) available 
Chechen (CE) available 
Chhattisgarhi (Devanagari) (HNE) available 
Chiga (CGG) available 
Chinese - Simplified (ZH-Hans) availableavailable
Chinese - Traditional (Hant) availableavailable
Choctaw (CHO) available 
Chukot (CKT) available 
Chuvash (CV) available 
Cornish (KW)availableavailable 
Corsican (CO) available 
Cree (CR) available 
Creek (MUS) available 
Crimean Tatar (Latin) (CRH) available 
Croatian (HR)availableavailable 
Crow (CRO) available 
Czech (CS)availableavailable 
Danish (DA)availableavailable 
Dargwa (DAR) available 
Dari (PRS) available 
Dhimal (Devanagari) (DHI) available 
Dogri (Devanagari) (DOI) available 
Duala (DUA) available 
Dungan (DNG) available 
Dutch (NL)availableavailable 
Efik (EFI) available 
English (EN)availableavailable 
Erzya (Cyrilic) (MYV) available 
Estonian (ET)availableavailable 
Faroese (FO) available 
Fijian (FJ)availableavailable 
Filipino (FIL)availableavailable 
Finnish (FI)availableavailable 
Fon (FON) available 
French (FR)availableavailableavailable
Friulian (FUR)availableavailable 
Ga (GAA) available 
Gaelic - Irish (GA)availableavailable 
Gaelic - Scottish (GD)availableavailable 
Gagauz (Latin) (GAG)availableavailable 
Galician (GL)availableavailable 
Ganda (LG) available 
Gayo (GAY) available 
German (DE)availableavailable 
Gilbertese (GIL)availableavailable 
Gondi (Devanagari) (GON) available 
Greek (EL) available 
Greenlandic (KL) available 
Guarani (GN) available 
Gurung (Devanagari) available 
Gusii (GUZ) available 
Haitian Creole (HT)availableavailable 
Halbi (Devanagari) (HLB) available 
Hani (HNI)availableavailable 
Haryanvi (BGC) available 
Hawaiian (HAW) available 
Hebrew (HE)availableavailable 
Herero (HZ) available 
Hiligaynon (HIL) available 
Hindi (HI) available 
Hmong Daw (Latin) (MWW)availableavailable 
Ho (Devanagari) (HOC) available 
Hungarian (HU)availableavailable 
Iban (IBA) available 
Icelandic (IS) available 
Igbo (IG) available 
Iloko (ILO) available 
Inari Sami (SMN) available 
Indonesian (ID)availableavailable 
Ingush (INH) available 
Interlingua (IA)availableavailable 
Inuktitut (Latin) (IU) available 
Italian (IT)availableavailable 
Japanese (JA) availableavailable
Jaunsari (Devanagari) (JNS) available 
Javanese (JV)availableavailable 
Jola-Fonyi (DYO) available 
Kabardian (KBD) available 
Kabuverdianu (KEA) available 
Kachin (Latin) (KAC)availableavailable 
Kalenjin (KLN) available 
Kalmyk (XAL) available 
Kangri (Devanagari) (XNR) available 
Kanuri (KR) available 
Karachay-Balkar (KRC) available 
Kara-Kalpak (Cyrilic) (KAA-CYR) available 
Kara-Kalpak (Latin) (KAA) available 
Kashubian (CSB) available 
Kazakh (Cyrilic) (KK-CYR) available 
Kazakh (Latin) (KK-LATN) available 
Khakas (KJH) available 
Khaling (KLR) available 
Khasi (KHA)availableavailable 
K'iche' (QUC) available 
Kikuyu (KI) available 
Kildin Sami (SJD) available 
Kinyarwanda (RW) available 
Komi (KV) available 
Kongo (KN) available 
Korean (KO) availableavailable
Korku (KFQ) available 
Koryak (KPY) available 
Kosraean (KOS) available 
Kpelle (KPE) available 
Kuanyama (KJ) available 
Kumyk (Cyrilic) (KUM) available 
Kurdish (Arabic) (KU-ARAB) available 
Kurdish (Latin) (KU-LATN) available 
Kurukh (Devanagari) (KRU) available 
Kyrgyz (Cyrilic) (KY) available 
Lak (LBE) available 
Lakota (LKT) available 
Latin (LA)availableavailable 
Latvian (LV)availableavailable 
Lezghian (LEX) available 
Lingala (LN) available 
Lithuanian (LT)availableavailable 
Lower Sorbian (DSB) available 
Lozi (LOZ) available 
Lule Sami (SMJ) available 
Luo (Kenya and Tanzania) (LUO) available 
Luxembourgish (LB)availableavailable 
Luyia (LUY) available 
Macedonian (MK) available 
Machame (JMC) available 
Madurese (MAD) available 
Mahasu Pahari (Devanagari) (BFZ) available 
Makhuwa-Meetto (MGH) available 
Makonde (KDE) available 
Malagasy (MG) available 
Malay (Latin) (MS)availableavailable 
Maltese (MT) available 
Malto (Devanagari) (KMJ) available 
Mandinka (MNK) available 
Manx (GV) available 
Maori (MI) available 
Mapundungun (ARN) available 
Marathi (MR) available 
Mari (Russia) (CHM) available 
Masai (MAS) available 
Mende (Sierra Leone) (MEN) available 
Meru (MER) available 
Meta' (MGO) available 
Minangkabau (MIN) available 
Mohawk (MOH) available 
Mongolian (Cyrilic) (MN) available 
Mongondow (MOG) available 
Montenegrin (Cyrilic) (CNR-CYRL) available 
Montenegrin (Latin) (CNR-LATN) available 
Morisyen (MFE) available 
Mundang (MUA) available 
Nahuatl (NAH) available 
Navajo (NV) available 
Ndonga (NG) available 
Neapolitan (NAP)availableavailable 
Nepali (NE) available 
Ngomba (JGO) available 
Niuean (NIU) available 
Nogay (NOG) available 
North Ndebele (ND) available 
Northern Sami (Latin) (SME) available 
Norwegian (NO)availableavailable 
Nyanja (NY) available 
Nyankole (NYN) available 
Nzima (NZI) available 
Occitan (OC)availableavailable 
Ojibway (OJ) available 
Oromo (OM) available 
Ossetic (OS) available 
Pampanga (PAM) available 
Pangasinan (PAG) available 
Papiamento (PAP) available 
Pashto (PS) available 
Pedi (NSO) available 
Persian (FA) available 
Polish (PL)availableavailable 
Portuguese (PT)availableavailable 
Punjabi (Arabic) (PA) available 
Quechua (QU) available 
Ripurian (KSH)availableavailable 
Romanian (RO)availableavailable 
Romansh (RM)availableavailable 
Rundi (RN) available 
Russian (RU) available 
Rwa (RWK) available 
Sadri (Devanagari) (SCK) available 
Sakha (SAH) available 
Samburu (SAQ) available 
Samoan (Latin) (SM) available 
Sango (SG) available 
Sangu (Gabon) available 
Sanskrit (Devanagari) (SA) available 
Santali (Devanagari) (SAT) available 
Scots (SCO) available 
Sena (SEH) available 
Serbian (Cyrilic) (SR-CYRL) available 
Serbian (Latin) (SR, SR-LATN))availableavailable 
Shambala (KSB) available 
Shona (SN) available 
Siksika (BLA) available 
Sirmauri (Devanagari) (SRX) available 
Skolt Sami (SMS) available 
Slovak (SK)availableavailable 
Slovenian (SL)availableavailable 
Soga (XOG) available 
Somali (Arabic) (SO) available 
Somali (Latin) (SO-LATN) available 
Songhai (SON) available 
South Ndebele (NR) available 
Southern Altai (ALT) available 
Southern Sami (SMA) available 
Southern Sotho (ST) available 
Spanish (ES)availableavailable 
Sundanese (SU) available 
Swahili (Latin) (SW)availableavailable 
Swati (SS) available 
Swedish (SV)availableavailable 
Tabassaran (TAB) available 
Tachelhit (SHI) available 
Tahitian (TY) available 
Taita (DAV) available 
Tajik (Cyrilic) (TG) available 
Tamil (TA) available 
Tatar (Cyrilic) (TT-CYRL) available 
Tatar (Latin) (TT) available 
Teso (TEO) available 
Tetum (TET)availableavailable 
Thai (TH) availableavailable
Thangmi (THF) available 
Tok Pisin (TPI) available 
Tongan (TO)availableavailable 
Tsonga (TS) available 
Tswana (TN) available 
Turkish (TR)availableavailable 
Turkmen (Latin) (TK) available 
Tuvan (TYV) available 
Udmurt (UDM) available 
Uighur (Cyrilic) (UG-CYRL) available 
Ukranian (UK) available 
Upper Sorbian (HSB) available 
Urdu (UR) available 
Uyghur (Arabic) (UG) available 
Uzbek (Arabic) (UZ-ARAB) available 
Uzbek (Cyrilic) (UZ-CYRL) available 
Uzbek (Latin) (UZ)availableavailable 
Vietnamese (VI) availableavailable
Volapuk (VO)availableavailable 
Vunjo (VUN) available 
Walser (WAE) available 
Welsh (CY)availableavailable 
Western Frisian (FY) available 
Wolof (WO) available 
Xhosa (XH) available 
Yucatec Maya (YUA) available 
Zapotec (ZAP) available 
Zarma (DJE) available 
Zhuang (ZA) available 
Zulu (ZU)availableavailable 

Handwritten text

Language (Language Code)UiPathDocumentOCR_Handwriting
Chinese Simplified (ZH-HANS) 
English (EN)available
French (FR)available
German (DE)available
Italian (IT) 
Japanese (JA) 
Korean (KO) 
Portuguese (PT) 
Spanish (ES) 

Supported characters

Arabic characters'ا','ب','ة','ت','ث','ج','ح','خ','د','ذ','ر','ز','س','ش','ص','ض','ط','ظ','ع','غ','ـ','ف','ق','ك','ل','م','ن','ه','و','ى','ي','ٓ','ٔ','ٕ','٠','١','٢','٣','٤','٥','٦','٧','٨','٩','٪','٫','٬','٭','ٱ','۔','ً','ٌ','ٍ','َ','ُ','ِ','ّ','ْ','ٰ','ۥ','ۦ','آ','،','؛','؟','ء','أ','ؤ','إ','ئ'
Supported OCR characters! " # $ % & \ ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ \ ] ^ _ a b c d e f g h i j k l m n o p q r s t u v w x y z { | } ~ £ ¥ § © ® ° ¿ À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï Ñ Ò Ó Ô Õ Ö Ø Ù Ú Û Ü Ý ß à á â ã ä å æ ç è é ê ë ì í î ï ñ ò ó ô õ ö ø ù ú û ü ý Ā ā Ă ă Ą ą Ć ć Ċ ċ Č č Ď ď Đ đ Ē ē Ė ė Ę ę Ě ě Ğ ğ Ġ ġ Ħ ħ Ī ī Ĭ ĭ Į į İ ı Ĺ ĺ Ľ ľ Ł ł Ń ń Ň ň Ŋ ŋ Ō ō Ő ő Œ œ Ŕ ŕ Ř ř Ś ś Š š Ť ť Ŧ ŧ Ū ū Ŭ ŭ Ů ů Ų ų Ź ź Ż ż Ž ž Ə Ǵ ǵ Ș ș Ț ț ə μ א ב ג ד ה ו ז ח ט י ך כ ל ם מ ן נ ס ע ף פ ץ צ ק ר ש ת ₪ € ≤ ≥

UiPath® Partner OCR

To learn the supported languages for UiPath® OCR Partners, check out their dedicated pages:
  • Printed text
  • Handwritten text
  • Supported characters
  • UiPath® Partner OCR

Was this page helpful?

Get The Help You Need
Learning RPA - Automation Courses
UiPath Community Forum
Uipath Logo White
Trust and Security
© 2005-2024 UiPath. All rights reserved.