UiPath Documentation
document-understanding
2024.10
false
Important :
La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.
UiPath logo, featuring letters U and I in white

Document Understanding user guide

Dernière mise à jour 6 avr. 2026

OCR

Each OCR engine is tailored to deliver efficient and effective optical character recognition, regardless of your specific needs or deployment. This page provides information on the supported languages for UiPath® OCR engines:

  • UiPath Document OCR: default UiPath OCR, which receives regular updates and improvements. You can use it on either GPU or CPU, delivering the same level of accuracy in both cases.
  • UiPath Document OCR_CPU: specially optimized to run on CPU.
  • UiPath Extended Languages OCR: capable of processing documents in over 200 languages, especially in Chinese, Korean, Vietnamese, Thai, major Indian languages, and languages that use the Cyrilic or Greek alphabets.
Astuce :

Choosing the right OCR engine for your documents is simple. By default, use the UiPath Document OCR, which benefits from regular updates and improvements. If this doesn't support your document language or it's not performing as expected, switch to one of our other OCR engines, like the UiPath Extended Languages OCR.

Texte imprimé

Langue (code de langue)UiPath Document OCR et UiPath Document OCR_CPUUiPath Extended Languages OCROCR chinois, japonais et coréen
Adyguéen (ADY)
Afar (AA)
Afrikaans (AFR)
Akan (AK)
Albanais (SQI)
Algonquin (ALQ)
Angika (Devanagari) (ANP)
Arabe (ARA)✅ (Preview)
Asturien (AST)
Asu (ASA)
Avar (AV)
Awadhi-Hindi (Devanagari) (AWA)
Aymara (AYM)
Azerbaïdjanais (latin) (AZ)
Bafia (KSF)
Bagheli (BFY)
Bambara (BM)
Bachkir (BA)
Basque (EU)
Biélorusse (cyrillique) (BE, BE-CYRL)
Biélorusse (latin) (BE, BE-LATN)
Bemba (BEM)
Bena (BEZ)
Bhojpuri-Hindi (Devanagari) (BHO)
Bikol (BIK)
Bichelamar (BI)
Bodo (Devanagari) (BRX)
Bosnien (latin) (BS)
Brajbha (BRA)
Breton (BR)
Bulgare (BU)
Bundeli (BNS)
Bouriate (cyrillique) (BUA)
Catalan (CA)
Cebuno (CEB)
Chamling (RAB)
Chamorro (CH)
Tchétchène (CE)
Chhattisgarhi (Devanagari) (HNE)
Chiga (CGG)
Chinois - simplifié (ZH-Hans)
Chinois - traditionnel (Hant)
Choctaw (CHO)
Tchouktche (CKT)
Tchouvache (CV)
Cornique (KW)
Corse (CO)
Cri (CR)
Creek (MUS)
Tatar de Crimée (latin) (CRH)
Croate (HR)
Crow (CRO)
Tchèque (CS)
Danois (DA)
Dargwa (DAR)
Dari (PRS)
Dhimal (Devanagari) (DHI)
Dogri (Devanagari) (DOI)
Duala (DUA)
Doungane (DNG)
Néerlandais (NL)
Efik (EFI)
Anglais (EN)
Erzya (cyrillique) (MYV)
Estonien (ET)
Féroïen (FO)
Fidjien (FJ)
Filipino (FIL)
Finnois (FI)
Fon (FON)
Français (FR)
Frioulan (FUR)
Ga (GAA)
Gaélique - irlandais (GA)
Gaélique - écossais (GD)
Gagaouze (latin) (GAG)
Galicien (GL)
Ganda (LG)
Gayo (GAY)
Allemand (DE)
Gilbertin (GIL)
Gondi (Devanagari) (GON)
Grec (EL)
Groenlandais (KL)
Guarani (GN)
Gurung (Devanagari)
Gusii (GUZ)
Créole haïtien (HT)
Halbi (Devanagari) (HLB)
Hani (HNI)
Haryanvi (BGC)
Hawaïen (HAW)
Hébreu (HE)
Héréro (HZ)
Hiligaïnon (HIL)
Hindi (HI)
Hmong Daw (latin) (MWW)
Ho (Devanagari) (HOC)
Hongrois (HU)
Iban (IBA)
Islandais (IS)
Igbo (IG)
Ilocano (ILO)
Same d’Inari (SMN)
Indonésien (ID)
Ingouche (INH)
Interlingua (IA)
Inuktitut (latin) (IU)
Italien (IT)
Japonais (JA)
Jaunsari (Devanagari) (JNS)
Javanais (JV)
Diola-fogny (DYO)
Kabarde (KBD)
Kabuverdianu (KEA)
Kachin (latin) (KAC)
Kalendjin (KLN)
Kalmouk (XAL)
Kangri (Devanagari) (XNR)
Kanouri (KR)
Karachay-Balkar (KRC)
Karakalpak (cyrillique) (KAA-CYR)
Karakalpak (latin) (KAA)
Cachoube (CSB)
Kazakh (cyrillique) (KK-CYR)
Kazakh (latin) (KK-LATN)
Khakasse (KJH)
Khaling (KLR)
Khasi (KHA)
Quiché (QUC)
Kikouyou (KI)
Same de Kildin (SJD)
Kinyarwanda (RW)
Komi (KV)
Kongo (KN)
Coréen (KO)
Korku (KFQ)
Koriak (KPY)
Kosrae (KOS)
Kpellé (KPE)
Kuanyama (KJ)
Koumyk (cyrillique) (KUM)
Kurde (arabe) (KU-ARAB)
Kurde (latin) (KU-LATN)
Kurukh (Devanagari) (KRU)
Kirghize (cyrillique) (KY)
Lak (LBE)
Lakota (LKT)
Latin (LA)
Letton (LV)
Lezghien (LEX)
Lingala (LN)
Lituanien (LT)
Bas sorabe (DSB)
Lozi (LOZ)
Same de Lule (SMJ)
Luo (Kenya et Tanzanie) (LUO)
Luxembourgeois (LB)
Luyia (LUY)
Macédonien (MK)
Machame (JMC)
Madurais (MAD)
Mahasu Pahari (Devanagari) (BFZ)
Makhuwa-Meetto (MGH)
Makondé (KDE)
Malgache (MG)
Malais (latin) (MS)
Maltais (MT)
Malto (Devanagari) (KMJ)
Mandinka (MNK)
Mannois (GV)
Maori (MI)
Mapudungun (ARN)
Marathi (MR)
Mari (Russie) (CHM)
Maa (MAS)
Mendé (Sierra Leone) (MEN)
Meru (MER)
Meta’ (MGO)
Minangkabao (MIN)
Mohawk (MOH)
Mongolien (cyrillique) (MN)
Mongondow (MOG)
Monténégrin (cyrillique) (CNR-CYRL)
Monténégrin (latin) (CNR-LATN)
Mauricien (MFE)
Moundang (MUA)
Nahuatl (NAH)
Navajo (NV)
Ndonga (NG)
Napolitain (NAP)
Népalais (NE)
Ngomba (JGO)
Niuéen (NIU)
Nogay (NOG)
Ndébélé du Nord (ND)
Same du Nord (latin) (SME)
Norvégien (NO)
Chewa (NY)
Nyankolé (NYN)
Nzema (NZI)
Occitan (OC)
Ojibwé (OJ)
Oromo (OM)
Ossète (OS)
Pampangue (PAM)
Pangasinan (PAG)
Papiamento (PAP)
Pachto (PS)
Pedi (NSO)
Persan (FA)
Polonais (PL)
Portugais (PT)
Pendjabi (arabe) (PA)
Quechua (QU)
Francique ripuaire (KSH)
Roumain (RO)
Romanche (RM)
Rundi (RN)
Russe (RU)
Rwa (RWK)
Sadri (Devanagari) (SCK)
Iakoute (SAH)
Samburu (SAQ)
Samoan (latin) (SM)
Sango (SG)
Sangu (Gabon)
Sanskrit (Devanagari) (SA)
Santali (Devanagari) (SAT)
Scots (SCO)
Sena (SEH)
Serbe (cyrillique) (SR-CYRL)
Serbe (latin) (SR, SR-LATN)
Shambala (KSB)
Shona (SN)
Siksika (BLA)
Sirmauri (Devanagari) (SRX)
Same skolt (SMS)
Slovaque (SK)
Slovène (SL)
Soga (XOG)
Somali (arabe) (SO)
Somali (latin) (SO-LATN)
Songhaï (SON)
Ndébélé du Sud (NR)
Altaï méridional (ALT)
Same du Sud (SMA)
Sotho du Sud (ST)
Espagnol (ES)
Soudanais (SU)
Swahili (latin) (SW)
Swati (SS)
Suédois (SV)
Tabassaran (TAB)
Tachelhit (SHI)
Tahitien (TY)
Taita (DAV)
Tadjik (cyrillique) (TG)
Tamoul (TA)
Tatar (cyrillique) (TT-CYRL)
Tatar (latin) (TT)
Teso (TEO)
Tétoum (TET)
Thaï (TH)
Thangmi (THF)
Tok pisin (TPI)
Tongien (TO)
Tsonga (TS)
Tswana (TN)
Turc (TR)
Turkmène (latin) (TK)
Touvain (TYV)
Oudmourte (UDM)
Ouïghour (cyrillique) (UG-CYRL)
Ukrainien (UK)
Haut sorabe (HSB)
Ourdou (UR)
Ouïghour (arabe) (UG)
Ouzbek (arabe) (UZ-ARAB)
Ouzbek (cyrillique) (UZ-CYRL)
Ouzbek (latin) (UZ)
Vietnamien (VI)
Volapük (VO)
Vunjo (VUN)
Walser (WAE)
Gallois (CY)
Frison occidental (FY)
Wolof (WO)
Xhosa (XH)
Maya yucatèque (YUA)
Zapotèque (ZAP)
Zarma (DJE)
Zhuang (ZA)
Zoulou (ZU)

Texte manuscrit

Langue (code de langue)UiPath Document OCRUiPath Extended Languages OCR
Chinois simplifié (ZH-HANS)
Anglais (EN)
Français (FR)
Allemand (DE)
Italien (IT)
Japonais (JA)
Coréen (KO)
Portugais (PT)
Espagnol (ES)

Caractères pris en charge

Caractères Arabes'ا','ب','ة','ت','ث','ج','ح','خ','د','ذ','ر','ز','س','ش','ص','ض','ط','ظ','ع','غ','ـ','ف','ق','ك','ل','م','ن','ه','و','ى','ي','ٓ','ٔ','ٕ','٠','١','٢','٣','٤','٥','٦','٧','٨','٩','٪','٫','٬','٭','ٱ','۔','ً','ٌ','ٍ','َ','ُ','ِ','ّ','ْ','ٰ','ۥ','ۦ','آ','،','؛','؟','ء','أ','ؤ','إ','ئ'
Caractères OCR pris en charge! " # $ % & \ ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ \ ] ^ _ a b c d e f g h i j k l m n o p q r s t u v w x y z {

Partenaire UiPath® OCR

Pour connaître les langues prises en charge pour les partenaires UiPath® OCR, consultez leurs pages dédiées :

Cette page vous a-t-elle été utile ?

Connecter

Besoin d'aide ? Assistance

Vous souhaitez apprendre ? UiPath Academy

Vous avez des questions ? UiPath Forum

Rester à jour