document-understanding
2024.10
false
- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos - paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Idiomas admitidos
- Aprendizaje profundo
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Licencia
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Última actualización 6 de abr. de 2026
Cada motor OCR está diseñado para ofrecer un reconocimiento óptico de caracteres eficiente y eficaz, independientemente de tus necesidades específicas o implementación. Esta página proporciona información sobre los idiomas compatibles para los motores UiPath® OCR:
- UiPath Document OCR: UiPath OCR predeterminado, que recibe actualizaciones y mejoras periódicas. Puedes utilizarlo en GPU o CPU, ofreciendo el mismo nivel de precisión en ambos casos.
- UiPath Document OCR_CPU: especialmente optimizado para ejecutarse en CPU.
- UiPath Extended Languages OCR: capaz de procesar documentos en más de 200 idiomas, especialmente en chino, coreano, vietnamita, tailandés, los principales idiomas indios y los idiomas que utilizan el alfabeto cirílico o griego.
Consejo:
Elegir el motor OCR adecuado para tus documentos es sencillo. De forma predeterminada, utiliza UiPath Document OCR, que se beneficia de actualizaciones y mejoras periódicas. Si esto no es compatible con el idioma de tu documento o no funciona como se espera, cambia a uno de nuestros otros motores OCR, como UiPath Extended Languages OCR.
Texto impreso
| Idioma (código de idioma) | UiPath Document OCR y UiPath Document OCR_CPU | UiPath Extended Languages OCR | OCR chino, japonés, coreano |
|---|---|---|---|
| Adigués (ADY) | ✅ | ||
| Afar (AA) | ✅ | ||
| Afrikaans (AFR) | ✅ | ✅ | |
| Akan (AK) | ✅ | ||
| Albanés (SQI) | ✅ | ✅ | |
| Algonquin (ALQ) | ✅ | ||
| Angika (Devanagari) (ANP) | ✅ | ||
| Árabe (ARA) | ✅ (Vista previa) | ✅ | |
| Asturiano (AST) | ✅ | ✅ | |
| Asamés (ASA) | ✅ | ||
| Avar (AV) | ✅ | ||
| Awadhi-Hindi (Devanagari) (AWA) | ✅ | ||
| Aymara (AYM) | ✅ | ||
| Azerí (Latin) (AZ) | ✅ | ||
| Bafia (KSF) | ✅ | ||
| Bagheli (BFY) | ✅ | ||
| Bambara (BM) | ✅ | ||
| Baskir (BA) | ✅ | ||
| Euskera (EU) | ✅ | ✅ | |
| Bielorruso (cirílico) (BE, BE-CYRL) | ✅ | ||
| Bielorruso (Latin) (BE, BE-LATN) | ✅ | ||
| Bemba (BEM) | ✅ | ||
| Bena (BEZ) | ✅ | ||
| Bhojpuri-Hindi (Devanagari) (BHO) | ✅ | ||
| Bikol (BIK) | ✅ | ||
| Bislama (BI) | ✅ | ✅ | |
| Bodo (Devanagari) (BRX) | ✅ | ||
| Bosnio (Latin) (BS) | ✅ | ||
| Brajbha (BRA) | ✅ | ||
| Bretón (BR) | ✅ | ||
| Búlgaro (BG) | ✅ | ||
| Bundeli (BNS) | ✅ | ||
| Buriat (cirílico) (BUA) | ✅ | ||
| Catalán (CA) | ✅ | ✅ | |
| Cebuano (CEB) | ✅ | ✅ | |
| Chamling (RAB) | ✅ | ||
| Chamorro (CH) | ✅ | ||
| Checheno (CE) | ✅ | ||
| Chhattisgarhi (Devanagari) (HNE) | ✅ | ||
| Chiga (CGG) | ✅ | ||
| Chino - Simplificado (ZH-Hans) | ✅ | ✅ | |
| Chino: tradicional (Hant) | ✅ | ✅ | |
| Choctaw (CHO) | ✅ | ||
| Chukot (CKT) | ✅ | ||
| Chuvash (CV) | ✅ | ||
| Cornuallés (KW) | ✅ | ✅ | |
| Corso (CO) | ✅ | ||
| Cree (CR) | ✅ | ||
| Creek (MUS) | ✅ | ||
| Tártaro de Crimea (Latin) (CRH) | ✅ | ||
| Croata (HR) | ✅ | ✅ | |
| Crow (CRO) | ✅ | ||
| Checo (CS) | ✅ | ✅ | |
| Danés (DA) | ✅ | ✅ | |
| Dargwa (DAR) | ✅ | ||
| Dari (PRS) | ✅ | ||
| Dhimal (Devanagari) (DHI) | ✅ | ||
| Dogri (Devanagari) (DOI) | ✅ | ||
| Duala (DUA) | ✅ | ||
| Dungan (DNG) | ✅ | ||
| Holandés (NL) | ✅ | ✅ | |
| Efik (EFI) | ✅ | ||
| Inglés (EN) | ✅ | ✅ | |
| Erzya (Cyrilic) (MYV) | ✅ | ||
| Estonio (ET) | ✅ | ✅ | |
| Feroés (FO) | ✅ | ||
| Fijiano (FJ) | ✅ | ✅ | |
| Filipino (FIL) | ✅ | ✅ | |
| Finlandés (FI) | ✅ | ✅ | |
| Fon (FON) | ✅ | ||
| Francés (FR) | ✅ | ✅ | ✅ |
| Friuliano (FUR) | ✅ | ✅ | |
| Ga (GAA) | ✅ | ||
| Gaélico: irlandés (GA) | ✅ | ✅ | |
| Gaélico: escocés (GD) | ✅ | ✅ | |
| Gagauz (Latin) (GAG) | ✅ | ✅ | |
| Gallego (GL) | ✅ | ✅ | |
| Ganda (LG) | ✅ | ||
| Gayo (GAY) | ✅ | ||
| Alemán (DE) | ✅ | ✅ | |
| Gilbertés (GIL) | ✅ | ✅ | |
| Gondi (Devanagari) (GON) | ✅ | ||
| Griego (EL) | ✅ | ||
| Groenlandés (KL) | ✅ | ||
| Guaraní (GN) | ✅ | ||
| Gurung (Devanagari) | ✅ | ||
| Gusii (GUZ) | ✅ | ||
| Criollo haitiano (HT) | ✅ | ✅ | |
| Halbi (Devanagari) (HLB) | ✅ | ||
| Hani (HNI) | ✅ | ✅ | |
| Haryanvi (BGC) | ✅ | ||
| Hawaiano (HAW) | ✅ | ||
| Hebreo (HE) | ✅ | ✅ | |
| Herero (HZ) | ✅ | ||
| Hiligaynon (HIL) | ✅ | ||
| Hindi (HI) | ✅ | ||
| Hmong Daw (Latin) (MWW) | ✅ | ✅ | |
| Ho (Devanagari) (HOC) | ✅ | ||
| Húngaro (HU) | ✅ | ✅ | |
| Iban (IBA) | ✅ | ||
| Islandés (IS) | ✅ | ||
| Igbo (IG) | ✅ | ||
| Iloko (ILO) | ✅ | ||
| Inari Sami (SMN) | ✅ | ||
| Indonesio (ID) | ✅ | ✅ | |
| Ingush (INH) | ✅ | ||
| Interlingua (IA) | ✅ | ✅ | |
| Inuktitut (Latin) (IU) | ✅ | ||
| Italiano (IT) | ✅ | ✅ | |
| Japonés (JA) | ✅ | ✅ | |
| Jaunsari (Devanagari) (JNS) | ✅ | ||
| Javanés (JV) | ✅ | ✅ | |
| Jola-Fonyi (DYO) | ✅ | ||
| Kabardiano (KBD) | ✅ | ||
| Caboverdiano (KEA) | ✅ | ||
| Kachin (Latin) (KAC) | ✅ | ✅ | |
| Kalenjin (KLN) | ✅ | ||
| Kalmyk (XAL) | ✅ | ||
| Kangri (Devanagari) (XNR) | ✅ | ||
| Kanuri (KR) | ✅ | ||
| Karachay-Balkar (KRC) | ✅ | ||
| Kara-Kalpak (cirílico) (KAA-CYR) | ✅ | ||
| Kara-Kalpak (Latin) (KAA) | ✅ | ||
| Kashubian (CSB) | ✅ | ||
| Kazajo (cirílico) (KK-CYR) | ✅ | ||
| Kazajo (Latin) (KK-LATN) | ✅ | ||
| Khakas (KJH) | ✅ | ||
| Khaling (KLR) | ✅ | ||
| Khasi (KHA) | ✅ | ✅ | |
| K'iche' (QUC) | ✅ | ||
| Kikuyu (KI) | ✅ | ||
| Kildin Sami (SJD) | ✅ | ||
| Kinyarwanda (RW) | ✅ | ||
| Komi (KV) | ✅ | ||
| Kongo (KN) | ✅ | ||
| Coreano (KO) | ✅ | ✅ | |
| Korku (KFQ) | ✅ | ||
| Koryak (KPY) | ✅ | ||
| Kosraean (KOS) | ✅ | ||
| Kpelle (KPE) | ✅ | ||
| Kuanyama (KJ) | ✅ | ||
| Kumyk (cirílico) (KUM) | ✅ | ||
| Kurdo (árabe) (KU-ARAB) | ✅ | ||
| Kurdo (Latin) (KU-LATN) | ✅ | ||
| Kurukh (Devanagari) (KRU) | ✅ | ||
| Kirguís (cirílico) (KY) | ✅ | ||
| Lak (LBE) | ✅ | ||
| Lakota (LKT) | ✅ | ||
| Latín (LA) | ✅ | ✅ | |
| Letón (LV) | ✅ | ✅ | |
| Lezguio (LEX) | ✅ | ||
| Lingala (LN) | ✅ | ||
| Lituano (LT) | ✅ | ✅ | |
| Bajo sorabo (DSB) | ✅ | ||
| Lozi (LOZ) | ✅ | ||
| Lule Sami (SMJ) | ✅ | ||
| Luo (Kenia y Tanzania) (LUO) | ✅ | ||
| Luxemburgués (LB) | ✅ | ✅ | |
| Luyia (LUY) | ✅ | ||
| Macedonio (MK) | ✅ | ||
| Machame (JMC) | ✅ | ||
| Madurés (MAD) | ✅ | ||
| Mahasu Pahari (Devanagari) (BFZ) | ✅ | ||
| Makhuwa-Meetto (MGH) | ✅ | ||
| Makonde (KDE) | ✅ | ||
| Malgache (MG) | ✅ | ||
| Malayo (Latin) (MS) | ✅ | ✅ | |
| Maltés (MT) | ✅ | ||
| Malto (Devanagari) (KMJ) | ✅ | ||
| Mandinka (MNK) | ✅ | ||
| Manés (GV) | ✅ | ||
| Maorí (MI) | ✅ | ||
| Mapundungun (ARN) | ✅ | ||
| Marathi (MR) | ✅ | ||
| Mari (Rusia) (CHM) | ✅ | ||
| Masai (MAS) | ✅ | ||
| Mende (Sierra Leona) (MEN) | ✅ | ||
| Meru (MER) | ✅ | ||
| Meta' (MGO) | ✅ | ||
| Minangkabau (MIN) | ✅ | ||
| Mohawk (MOH) | ✅ | ||
| Mongoliano (cirílico) (MN) | ✅ | ||
| Mongondow (MOG) | ✅ | ||
| Montenegrino (cirílico) (CNR-CYRL) | ✅ | ||
| Montenegrino (Latin) (CNR-LATN) | ✅ | ||
| Morisyen (MFE) | ✅ | ||
| Mundang (MUA) | ✅ | ||
| Nahuatl (NAH) | ✅ | ||
| Navajo (NV) | ✅ | ||
| Ndonga (NG) | ✅ | ||
| Neapolitano (NAP) | ✅ | ✅ | |
| Nepalí (NE) | ✅ | ||
| Ngomba (JGO) | ✅ | ||
| Niueano (NIU) | ✅ | ||
| Nogay (NOG) | ✅ | ||
| Ndebele del norte (ND) | ✅ | ||
| Sami del norte (Latin) (SME) | ✅ | ||
| Noruego (NO) | ✅ | ✅ | |
| Nyanja (NY) | ✅ | ||
| Nyankole (NYN) | ✅ | ||
| Nzima (NZI) | ✅ | ||
| Occitano (OC) | ✅ | ✅ | |
| Ojibway (OJ) | ✅ | ||
| Oromo (OM) | ✅ | ||
| Osetio (OS) | ✅ | ||
| Pampanga (PAM) | ✅ | ||
| Pangasinan (PAG) | ✅ | ||
| Papiamento (PAP) | ✅ | ||
| Pashto (PS) | ✅ | ||
| Pedi (NSO) | ✅ | ||
| Persa (FA) | ✅ | ||
| Polaco (PL) | ✅ | ✅ | |
| Portugués (PT) | ✅ | ✅ | |
| Punjabi (árabe) (PA) | ✅ | ||
| Quechua (QU) | ✅ | ||
| Ripuriano (KSH) | ✅ | ✅ | |
| Rumano (RO) | ✅ | ✅ | |
| Romanche (RM) | ✅ | ✅ | |
| Rundi (RN) | ✅ | ||
| Ruso (RU) | ✅ | ||
| Rwa (RWK) | ✅ | ||
| Sadri (Devanagari) (SCK) | ✅ | ||
| Sakha (SAH) | ✅ | ||
| Samburu (SAQ) | ✅ | ||
| Samoano (Latin) (SM) | ✅ | ||
| Sango (SG) | ✅ | ||
| Sangu (Gabón) | ✅ | ||
| Sánscrito (Devanagari) (SA) | ✅ | ||
| Santali (Devanagari) (SAT) | ✅ | ||
| Escocés (SCO) | ✅ | ||
| Sena (SEH) | ✅ | ||
| Serbio (cirílico) (SR-CYRL) | ✅ | ||
| Serbio (Latin) (SR, SR-LATN)) | ✅ | ✅ | |
| Shambala (KSB) | ✅ | ||
| Shona (SN) | ✅ | ||
| Siksika (BLA) | ✅ | ||
| Sirmauri (Devanagari) (SRX) | ✅ | ||
| Skolt Sami (SMS) | ✅ | ||
| Eslovaco (SK) | ✅ | ✅ | |
| Esloveno (SL) | ✅ | ✅ | |
| Soga (XOG) | ✅ | ||
| Somalí (árabe) (SO) | ✅ | ||
| Somalí (Latin) (SO-LATN) | ✅ | ||
| Songhai (SON) | ✅ | ||
| Ndebele del sur (NR) | ✅ | ||
| Altai del sur (ALT) | ✅ | ||
| Sami del sur (SMA) | ✅ | ||
| Sotho del sur (ST) | ✅ | ||
| Español (ES) | ✅ | ✅ | |
| Sundanés (SU) | ✅ | ||
| Swahili (Latin) (SW) | ✅ | ✅ | |
| Swati (SS) | ✅ | ||
| Sueco (SV) | ✅ | ✅ | |
| Tabasarano (TAB) | ✅ | ||
| Tachelhit (SHI) | ✅ | ||
| Tahitiano (TY) | ✅ | ||
| Taita (DAV) | ✅ | ||
| Tayiko (cirílico) (TG) | ✅ | ||
| Tamil (TA) | ✅ | ||
| Tártaro (cirílico) (TT-CYRL) | ✅ | ||
| Tártaro (Latin) | ✅ | ||
| Teso (TEO) | ✅ | ||
| Tetum (TET) | ✅ | ✅ | |
| Tailandés (TH) | ✅ | ✅ | |
| Thangmi (THF) | ✅ | ||
| Tok Pisin (TPI) | ✅ | ||
| Tongano (TO) | ✅ | ✅ | |
| Tsonga (TS) | ✅ | ||
| Tswana (TN) | ✅ | ||
| Turco (TR) | ✅ | ✅ | |
| Turcomano (Latin) TK | ✅ | ||
| Tuvano (TYV) | ✅ | ||
| Udmurt (UDM) | ✅ | ||
| Uigur (cirílico) (UG-CYRL) | ✅ | ||
| Ucraniano (UK) | ✅ | ||
| Alto sorabo (HSB) | ✅ | ||
| Urdu (UR) | ✅ | ||
| Uigur (árabe) (UG) | ✅ | ||
| Uzbeko (árabe) (UZ-ARAB) | ✅ | ||
| Uzbeko (cirílico) (UZ-CYRL) | ✅ | ||
| Uzbeko (Latin) (UZ) | ✅ | ✅ | |
| Vietnamita (VI) | ✅ | ✅ | |
| Volapuk (VO) | ✅ | ✅ | |
| Vunjo (VUN) | ✅ | ||
| Walser (WAE) | ✅ | ||
| Galés (CY) | ✅ | ✅ | |
| Frisio occidental (FY) | ✅ | ||
| Wolof (WO) | ✅ | ||
| Xhosa (XH) | ✅ | ||
| Maya yucateca (YUA) | ✅ | ||
| Zapotec (ZAP) | ✅ | ||
| Zarma (DJE) | ✅ | ||
| Zhuang (ZA) | ✅ | ||
| Zulu (ZU) | ✅ | ✅ |
Texto escrito a mano
| Idioma (código de idioma) | UiPath Document OCR | UiPath Extended Languages OCR |
|---|---|---|
| Chino simplificado (ZH-HANS) | ✅ | |
| Inglés (EN) | ✅ | ✅ |
| Francés (FR) | ✅ | ✅ |
| Alemán (DE) | ✅ | ✅ |
| Italiano (IT) | ✅ | |
| Japonés (JA) | ✅ | |
| Coreano (KO) | ✅ | |
| Portugués (PT) | ✅ | |
| Español (ES) | ✅ |
Caracteres compatibles
| Caracteres árabes | 'ا','ب','ة','ت','ث','ج','ح','خ','د','ذ','ر','ز','س','ش','ص','ض','ط','ظ','ع','غ','ـ','ف','ق','ك','ل','م','ن','ه','و','ى','ي','ٓ','ٔ','ٕ','٠','١','٢','٣','٤','٥','٦','٧','٨','٩','٪','٫','٬','٭','ٱ','۔','ً','ٌ','ٍ','َ','ُ','ِ','ّ','ْ','ٰ','ۥ','ۦ','آ','،','؛','؟','ء','أ','ؤ','إ','ئ' |
| Caracteres de OCR compatibles | ! " # $ % & \ ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ ABCDEFGHIJKLMNOPQRSTU VWXYZ [ \ \ ] ^ _ abcdefghijklmnopqrstu vwxyz { |
UiPath® Partner OCR
Para aprender los idiomas compatibles para los socios OCR, consulta sus páginas dedicadas: