document-understanding
2024.10
false
- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos - paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Idiomas admitidos
- Aprendizaje profundo
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Licencia
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Importante :
La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Document Understanding user guide
Última actualización 6 de abr. de 2026
OCR
Each OCR engine is tailored to deliver efficient and effective optical character recognition, regardless of your specific needs or deployment. This page provides information on the supported languages for UiPath® OCR engines:
- UiPath Document OCR: default UiPath OCR, which receives regular updates and improvements. You can use it on either GPU or CPU, delivering the same level of accuracy in both cases.
- UiPath Document OCR_CPU: specially optimized to run on CPU.
- UiPath Extended Languages OCR: capable of processing documents in over 200 languages, especially in Chinese, Korean, Vietnamese, Thai, major Indian languages, and languages that use the Cyrilic or Greek alphabets.
Consejo:
Choosing the right OCR engine for your documents is simple. By default, use the UiPath Document OCR, which benefits from regular updates and improvements. If this doesn't support your document language or it's not performing as expected, switch to one of our other OCR engines, like the UiPath Extended Languages OCR.
Texto impreso
| Idioma (código de idioma) | UiPath Document OCR y UiPath Document OCR_CPU | UiPath Extended Languages OCR | OCR chino, japonés, coreano |
|---|---|---|---|
| Adigués (ADY) | ✅ | ||
| Afar (AA) | ✅ | ||
| Afrikaans (AFR) | ✅ | ✅ | |
| Akan (AK) | ✅ | ||
| Albanés (SQI) | ✅ | ✅ | |
| Algonquin (ALQ) | ✅ | ||
| Angika (Devanagari) (ANP) | ✅ | ||
| Árabe (ARA) | ✅ (Preview) | ✅ | |
| Asturiano (AST) | ✅ | ✅ | |
| Asamés (ASA) | ✅ | ||
| Avar (AV) | ✅ | ||
| Awadhi-Hindi (Devanagari) (AWA) | ✅ | ||
| Aymara (AYM) | ✅ | ||
| Azerí (Latin) (AZ) | ✅ | ||
| Bafia (KSF) | ✅ | ||
| Bagheli (BFY) | ✅ | ||
| Bambara (BM) | ✅ | ||
| Baskir (BA) | ✅ | ||
| Euskera (EU) | ✅ | ✅ | |
| Bielorruso (cirílico) (BE, BE-CYRL) | ✅ | ||
| Bielorruso (Latin) (BE, BE-LATN) | ✅ | ||
| Bemba (BEM) | ✅ | ||
| Bena (BEZ) | ✅ | ||
| Bhojpuri-Hindi (Devanagari) (BHO) | ✅ | ||
| Bikol (BIK) | ✅ | ||
| Bislama (BI) | ✅ | ✅ | |
| Bodo (Devanagari) (BRX) | ✅ | ||
| Bosnio (Latin) (BS) | ✅ | ||
| Brajbha (BRA) | ✅ | ||
| Bretón (BR) | ✅ | ||
| Búlgaro (BG) | ✅ | ||
| Bundeli (BNS) | ✅ | ||
| Buriat (cirílico) (BUA) | ✅ | ||
| Catalán (CA) | ✅ | ✅ | |
| Cebuano (CEB) | ✅ | ✅ | |
| Chamling (RAB) | ✅ | ||
| Chamorro (CH) | ✅ | ||
| Checheno (CE) | ✅ | ||
| Chhattisgarhi (Devanagari) (HNE) | ✅ | ||
| Chiga (CGG) | ✅ | ||
| Chino - Simplificado (ZH-Hans) | ✅ | ✅ | |
| Chino: tradicional (Hant) | ✅ | ✅ | |
| Choctaw (CHO) | ✅ | ||
| Chukot (CKT) | ✅ | ||
| Chuvash (CV) | ✅ | ||
| Cornuallés (KW) | ✅ | ✅ | |
| Corso (CO) | ✅ | ||
| Cree (CR) | ✅ | ||
| Creek (MUS) | ✅ | ||
| Tártaro de Crimea (Latin) (CRH) | ✅ | ||
| Croata (HR) | ✅ | ✅ | |
| Crow (CRO) | ✅ | ||
| Checo (CS) | ✅ | ✅ | |
| Danés (DA) | ✅ | ✅ | |
| Dargwa (DAR) | ✅ | ||
| Dari (PRS) | ✅ | ||
| Dhimal (Devanagari) (DHI) | ✅ | ||
| Dogri (Devanagari) (DOI) | ✅ | ||
| Duala (DUA) | ✅ | ||
| Dungan (DNG) | ✅ | ||
| Holandés (NL) | ✅ | ✅ | |
| Efik (EFI) | ✅ | ||
| Inglés (EN) | ✅ | ✅ | |
| Erzya (Cyrilic) (MYV) | ✅ | ||
| Estonio (ET) | ✅ | ✅ | |
| Feroés (FO) | ✅ | ||
| Fijiano (FJ) | ✅ | ✅ | |
| Filipino (FIL) | ✅ | ✅ | |
| Finlandés (FI) | ✅ | ✅ | |
| Fon (FON) | ✅ | ||
| Francés (FR) | ✅ | ✅ | ✅ |
| Friuliano (FUR) | ✅ | ✅ | |
| Ga (GAA) | ✅ | ||
| Gaélico: irlandés (GA) | ✅ | ✅ | |
| Gaélico: escocés (GD) | ✅ | ✅ | |
| Gagauz (Latin) (GAG) | ✅ | ✅ | |
| Gallego (GL) | ✅ | ✅ | |
| Ganda (LG) | ✅ | ||
| Gayo (GAY) | ✅ | ||
| Alemán (DE) | ✅ | ✅ | |
| Gilbertés (GIL) | ✅ | ✅ | |
| Gondi (Devanagari) (GON) | ✅ | ||
| Griego (EL) | ✅ | ||
| Groenlandés (KL) | ✅ | ||
| Guaraní (GN) | ✅ | ||
| Gurung (Devanagari) | ✅ | ||
| Gusii (GUZ) | ✅ | ||
| Criollo haitiano (HT) | ✅ | ✅ | |
| Halbi (Devanagari) (HLB) | ✅ | ||
| Hani (HNI) | ✅ | ✅ | |
| Haryanvi (BGC) | ✅ | ||
| Hawaiano (HAW) | ✅ | ||
| Hebreo (HE) | ✅ | ✅ | |
| Herero (HZ) | ✅ | ||
| Hiligaynon (HIL) | ✅ | ||
| Hindi (HI) | ✅ | ||
| Hmong Daw (Latin) (MWW) | ✅ | ✅ | |
| Ho (Devanagari) (HOC) | ✅ | ||
| Húngaro (HU) | ✅ | ✅ | |
| Iban (IBA) | ✅ | ||
| Islandés (IS) | ✅ | ||
| Igbo (IG) | ✅ | ||
| Iloko (ILO) | ✅ | ||
| Inari Sami (SMN) | ✅ | ||
| Indonesio (ID) | ✅ | ✅ | |
| Ingush (INH) | ✅ | ||
| Interlingua (IA) | ✅ | ✅ | |
| Inuktitut (Latin) (IU) | ✅ | ||
| Italiano (IT) | ✅ | ✅ | |
| Japonés (JA) | ✅ | ✅ | |
| Jaunsari (Devanagari) (JNS) | ✅ | ||
| Javanés (JV) | ✅ | ✅ | |
| Jola-Fonyi (DYO) | ✅ | ||
| Kabardiano (KBD) | ✅ | ||
| Caboverdiano (KEA) | ✅ | ||
| Kachin (Latin) (KAC) | ✅ | ✅ | |
| Kalenjin (KLN) | ✅ | ||
| Kalmyk (XAL) | ✅ | ||
| Kangri (Devanagari) (XNR) | ✅ | ||
| Kanuri (KR) | ✅ | ||
| Karachay-Balkar (KRC) | ✅ | ||
| Kara-Kalpak (cirílico) (KAA-CYR) | ✅ | ||
| Kara-Kalpak (Latin) (KAA) | ✅ | ||
| Kashubian (CSB) | ✅ | ||
| Kazajo (cirílico) (KK-CYR) | ✅ | ||
| Kazajo (Latin) (KK-LATN) | ✅ | ||
| Khakas (KJH) | ✅ | ||
| Khaling (KLR) | ✅ | ||
| Khasi (KHA) | ✅ | ✅ | |
| K'iche' (QUC) | ✅ | ||
| Kikuyu (KI) | ✅ | ||
| Kildin Sami (SJD) | ✅ | ||
| Kinyarwanda (RW) | ✅ | ||
| Komi (KV) | ✅ | ||
| Kongo (KN) | ✅ | ||
| Coreano (KO) | ✅ | ✅ | |
| Korku (KFQ) | ✅ | ||
| Koryak (KPY) | ✅ | ||
| Kosraean (KOS) | ✅ | ||
| Kpelle (KPE) | ✅ | ||
| Kuanyama (KJ) | ✅ | ||
| Kumyk (cirílico) (KUM) | ✅ | ||
| Kurdo (árabe) (KU-ARAB) | ✅ | ||
| Kurdo (Latin) (KU-LATN) | ✅ | ||
| Kurukh (Devanagari) (KRU) | ✅ | ||
| Kirguís (cirílico) (KY) | ✅ | ||
| Lak (LBE) | ✅ | ||
| Lakota (LKT) | ✅ | ||
| Latín (LA) | ✅ | ✅ | |
| Letón (LV) | ✅ | ✅ | |
| Lezguio (LEX) | ✅ | ||
| Lingala (LN) | ✅ | ||
| Lituano (LT) | ✅ | ✅ | |
| Bajo sorabo (DSB) | ✅ | ||
| Lozi (LOZ) | ✅ | ||
| Lule Sami (SMJ) | ✅ | ||
| Luo (Kenia y Tanzania) (LUO) | ✅ | ||
| Luxemburgués (LB) | ✅ | ✅ | |
| Luyia (LUY) | ✅ | ||
| Macedonio (MK) | ✅ | ||
| Machame (JMC) | ✅ | ||
| Madurés (MAD) | ✅ | ||
| Mahasu Pahari (Devanagari) (BFZ) | ✅ | ||
| Makhuwa-Meetto (MGH) | ✅ | ||
| Makonde (KDE) | ✅ | ||
| Malgache (MG) | ✅ | ||
| Malayo (Latin) (MS) | ✅ | ✅ | |
| Maltés (MT) | ✅ | ||
| Malto (Devanagari) (KMJ) | ✅ | ||
| Mandinka (MNK) | ✅ | ||
| Manés (GV) | ✅ | ||
| Maorí (MI) | ✅ | ||
| Mapundungun (ARN) | ✅ | ||
| Marathi (MR) | ✅ | ||
| Mari (Rusia) (CHM) | ✅ | ||
| Masai (MAS) | ✅ | ||
| Mende (Sierra Leona) (MEN) | ✅ | ||
| Meru (MER) | ✅ | ||
| Meta' (MGO) | ✅ | ||
| Minangkabau (MIN) | ✅ | ||
| Mohawk (MOH) | ✅ | ||
| Mongoliano (cirílico) (MN) | ✅ | ||
| Mongondow (MOG) | ✅ | ||
| Montenegrino (cirílico) (CNR-CYRL) | ✅ | ||
| Montenegrino (Latin) (CNR-LATN) | ✅ | ||
| Morisyen (MFE) | ✅ | ||
| Mundang (MUA) | ✅ | ||
| Nahuatl (NAH) | ✅ | ||
| Navajo (NV) | ✅ | ||
| Ndonga (NG) | ✅ | ||
| Neapolitano (NAP) | ✅ | ✅ | |
| Nepalí (NE) | ✅ | ||
| Ngomba (JGO) | ✅ | ||
| Niueano (NIU) | ✅ | ||
| Nogay (NOG) | ✅ | ||
| Ndebele del norte (ND) | ✅ | ||
| Sami del norte (Latin) (SME) | ✅ | ||
| Noruego (NO) | ✅ | ✅ | |
| Nyanja (NY) | ✅ | ||
| Nyankole (NYN) | ✅ | ||
| Nzima (NZI) | ✅ | ||
| Occitano (OC) | ✅ | ✅ | |
| Ojibway (OJ) | ✅ | ||
| Oromo (OM) | ✅ | ||
| Osetio (OS) | ✅ | ||
| Pampanga (PAM) | ✅ | ||
| Pangasinan (PAG) | ✅ | ||
| Papiamento (PAP) | ✅ | ||
| Pashto (PS) | ✅ | ||
| Pedi (NSO) | ✅ | ||
| Persa (FA) | ✅ | ||
| Polaco (PL) | ✅ | ✅ | |
| Portugués (PT) | ✅ | ✅ | |
| Punjabi (árabe) (PA) | ✅ | ||
| Quechua (QU) | ✅ | ||
| Ripuriano (KSH) | ✅ | ✅ | |
| Rumano (RO) | ✅ | ✅ | |
| Romanche (RM) | ✅ | ✅ | |
| Rundi (RN) | ✅ | ||
| Ruso (RU) | ✅ | ||
| Rwa (RWK) | ✅ | ||
| Sadri (Devanagari) (SCK) | ✅ | ||
| Sakha (SAH) | ✅ | ||
| Samburu (SAQ) | ✅ | ||
| Samoano (Latin) (SM) | ✅ | ||
| Sango (SG) | ✅ | ||
| Sangu (Gabón) | ✅ | ||
| Sánscrito (Devanagari) (SA) | ✅ | ||
| Santali (Devanagari) (SAT) | ✅ | ||
| Escocés (SCO) | ✅ | ||
| Sena (SEH) | ✅ | ||
| Serbio (cirílico) (SR-CYRL) | ✅ | ||
| Serbio (Latin) (SR, SR-LATN)) | ✅ | ✅ | |
| Shambala (KSB) | ✅ | ||
| Shona (SN) | ✅ | ||
| Siksika (BLA) | ✅ | ||
| Sirmauri (Devanagari) (SRX) | ✅ | ||
| Skolt Sami (SMS) | ✅ | ||
| Eslovaco (SK) | ✅ | ✅ | |
| Esloveno (SL) | ✅ | ✅ | |
| Soga (XOG) | ✅ | ||
| Somalí (árabe) (SO) | ✅ | ||
| Somalí (Latin) (SO-LATN) | ✅ | ||
| Songhai (SON) | ✅ | ||
| Ndebele del sur (NR) | ✅ | ||
| Altai del sur (ALT) | ✅ | ||
| Sami del sur (SMA) | ✅ | ||
| Sotho del sur (ST) | ✅ | ||
| Español (ES) | ✅ | ✅ | |
| Sundanés (SU) | ✅ | ||
| Swahili (Latin) (SW) | ✅ | ✅ | |
| Swati (SS) | ✅ | ||
| Sueco (SV) | ✅ | ✅ | |
| Tabasarano (TAB) | ✅ | ||
| Tachelhit (SHI) | ✅ | ||
| Tahitiano (TY) | ✅ | ||
| Taita (DAV) | ✅ | ||
| Tayiko (cirílico) (TG) | ✅ | ||
| Tamil (TA) | ✅ | ||
| Tártaro (cirílico) (TT-CYRL) | ✅ | ||
| Tártaro (Latin) | ✅ | ||
| Teso (TEO) | ✅ | ||
| Tetum (TET) | ✅ | ✅ | |
| Tailandés (TH) | ✅ | ✅ | |
| Thangmi (THF) | ✅ | ||
| Tok Pisin (TPI) | ✅ | ||
| Tongano (TO) | ✅ | ✅ | |
| Tsonga (TS) | ✅ | ||
| Tswana (TN) | ✅ | ||
| Turco (TR) | ✅ | ✅ | |
| Turcomano (Latin) TK | ✅ | ||
| Tuvano (TYV) | ✅ | ||
| Udmurt (UDM) | ✅ | ||
| Uigur (cirílico) (UG-CYRL) | ✅ | ||
| Ucraniano (UK) | ✅ | ||
| Alto sorabo (HSB) | ✅ | ||
| Urdu (UR) | ✅ | ||
| Uigur (árabe) (UG) | ✅ | ||
| Uzbeko (árabe) (UZ-ARAB) | ✅ | ||
| Uzbeko (cirílico) (UZ-CYRL) | ✅ | ||
| Uzbeko (Latin) (UZ) | ✅ | ✅ | |
| Vietnamita (VI) | ✅ | ✅ | |
| Volapuk (VO) | ✅ | ✅ | |
| Vunjo (VUN) | ✅ | ||
| Walser (WAE) | ✅ | ||
| Galés (CY) | ✅ | ✅ | |
| Frisio occidental (FY) | ✅ | ||
| Wolof (WO) | ✅ | ||
| Xhosa (XH) | ✅ | ||
| Maya yucateca (YUA) | ✅ | ||
| Zapotec (ZAP) | ✅ | ||
| Zarma (DJE) | ✅ | ||
| Zhuang (ZA) | ✅ | ||
| Zulu (ZU) | ✅ | ✅ |
Texto escrito a mano
| Idioma (código de idioma) | UiPath Document OCR | UiPath Extended Languages OCR |
|---|---|---|
| Chino simplificado (ZH-HANS) | ✅ | |
| Inglés (EN) | ✅ | ✅ |
| Francés (FR) | ✅ | ✅ |
| Alemán (DE) | ✅ | ✅ |
| Italiano (IT) | ✅ | |
| Japonés (JA) | ✅ | |
| Coreano (KO) | ✅ | |
| Portugués (PT) | ✅ | |
| Español (ES) | ✅ |
Caracteres compatibles
| Caracteres árabes | 'ا','ب','ة','ت','ث','ج','ح','خ','د','ذ','ر','ز','س','ش','ص','ض','ط','ظ','ع','غ','ـ','ف','ق','ك','ل','م','ن','ه','و','ى','ي','ٓ','ٔ','ٕ','٠','١','٢','٣','٤','٥','٦','٧','٨','٩','٪','٫','٬','٭','ٱ','۔','ً','ٌ','ٍ','َ','ُ','ِ','ّ','ْ','ٰ','ۥ','ۦ','آ','،','؛','؟','ء','أ','ؤ','إ','ئ' |
| Caracteres de OCR compatibles | ! " # $ % & \ ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ \ ] ^ _ a b c d e f g h i j k l m n o p q r s t u v w x y z { |
UiPath® Partner OCR
Para aprender los idiomas compatibles para los socios OCR, consulta sus páginas dedicadas: