document-understanding
2024.10
true
- Información general
- Primeros pasos
- Crear modelos
- Consumir modelos
- Detalles del modelo
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Puntos finales públicos
- Idiomas admitidos
- Paneles de insights
- Datos y seguridad
- Lógica de licencias y tarificación
- Tutorial
Guía del usuario de proyectos modernos de Document Understanding
Última actualización 20 de nov. de 2024
OCR
Cada motor OCR está diseñado para ofrecer un reconocimiento óptico de caracteres eficiente y efectivo, independientemente de tus necesidades o implementación específicas. Esta página proporciona información sobre los idiomas compatibles con los motores OCR de UiPath® :
- UiPath Document OCR: UiPath OCR, por defecto, que recibe actualizaciones y mejoras periódicas. Puedes utilizarlo en GPU o CPU, ofreciendo el mismo nivel de precisión en ambos casos.
- UiPath Document OCR_CPU: especialmente optimizado para ejecutarse en CPU.
- UiPath Extended Languages OCR: capaz de procesar documentos en más de 200 idiomas, especialmente en chino, coreano, vietnamita, tailandés, los principales idiomas indios y los idiomas que utilizan el alfabeto cirílico o griego.
Consejo: elegir el motor de OCR adecuado para sus documentos es sencillo. De forma predeterminada, utiliza UiPath Document OCR, que se beneficia de actualizaciones y mejoras regulares. Si esto no es compatible con el lenguaje de tu documento o no funciona como se espera, cambia a uno de nuestros otros motores OCR, como UiPath Extended Languages OCR.
Idioma (código de idioma) | UiPath Document OCR y UiPath Document OCR_CPU | UiPath Extended Languages OCR | OCR chino, japonés, coreano |
---|---|---|---|
Adigués (ADY) | |||
Afar (AA) | |||
Afrikaans (AFR) | |||
Akan (AK) | |||
Albanés (SQI) | |||
Algonquin (ALQ) | |||
Angika (Devanagari) (ANP) | |||
Árabe (ARA) | |||
Asturiano (AST) | |||
Asamés (ASA) | |||
Avar (AV) | |||
Awadhi-Hindi (Devanagari) (AWA) | |||
Aymara (AYM) | |||
Azerí (Latin) (AZ) | |||
Bafia (KSF) | |||
Bagheli (BFY) | |||
Bambara (BM) | |||
Baskir (BA) | |||
Euskera (EU) | |||
Bielorruso (cirílico) (BE, BE-CYRL) | |||
Bielorruso (Latin) (BE, BE-LATN) | |||
Bemba (BEM) | |||
Bena (BEZ) | |||
Bhojpuri-Hindi (Devanagari) (BHO) | |||
Bikol (BIK) | |||
Bislama (BI) | |||
Bodo (Devanagari) (BRX) | |||
Bosnio (Latin) (BS) | |||
Brajbha (BRA) | |||
Bretón (BR) | |||
Búlgaro (BG) | |||
Bundeli (BNS) | |||
Buriat (cirílico) (BUA) | |||
Catalán (CA) | |||
Cebuano (CEB) | |||
Chamling (RAB) | |||
Chamorro (CH) | |||
Checheno (CE) | |||
Chhattisgarhi (Devanagari) (HNE) | |||
Chiga (CGG) | |||
Chino - Simplificado (ZH-Hans) | |||
Chino: tradicional (Hant) | |||
Choctaw (CHO) | |||
Chukot (CKT) | |||
Chuvash (CV) | |||
Cornuallés (KW) | |||
Corso (CO) | |||
Cree (CR) | |||
Creek (MUS) | |||
Tártaro de Crimea (Latin) (CRH) | |||
Croata (HR) | |||
Crow (CRO) | |||
Checo (CS) | |||
Danés (DA) | |||
Dargwa (DAR) | |||
Dari (PRS) | |||
Dhimal (Devanagari) (DHI) | |||
Dogri (Devanagari) (DOI) | |||
Duala (DUA) | |||
Dungan (DNG) | |||
Holandés (NL) | |||
Efik (EFI) | |||
Inglés (EN) | |||
Erzya (Cyrilic) (MYV) | |||
Estonio (ET) | |||
Feroés (FO) | |||
Fijiano (FJ) | |||
Filipino (FIL) | |||
Finlandés (FI) | |||
Fon (FON) | |||
Francés (FR) | |||
Friuliano (FUR) | |||
Ga (GAA) | |||
Gaélico: irlandés (GA) | |||
Gaélico: escocés (GD) | |||
Gagauz (Latin) (GAG) | |||
Gallego (GL) | |||
Ganda (LG) | |||
Gayo (GAY) | |||
Alemán (DE) | |||
Gilbertés (GIL) | |||
Gondi (Devanagari) (GON) | |||
Griego (EL) | |||
Groenlandés (KL) | |||
Guaraní (GN) | |||
Gurung (Devanagari) | |||
Gusii (GUZ) | |||
Criollo haitiano (HT) | |||
Halbi (Devanagari) (HLB) | |||
Hani (HNI) | |||
Haryanvi (BGC) | |||
Hawaiano (HAW) | |||
Hebreo (HE) | |||
Herero (HZ) | |||
Hiligaynon (HIL) | |||
Hindi (HI) | |||
Hmong Daw (Latin) (MWW) | |||
Ho (Devanagari) (HOC) | |||
Húngaro (HU) | |||
Iban (IBA) | |||
Islandés (IS) | |||
Igbo (IG) | |||
Iloko (ILO) | |||
Inari Sami (SMN) | |||
Indonesio (ID) | |||
Ingush (INH) | |||
Interlingua (IA) | |||
Inuktitut (Latin) (IU) | |||
Italiano (IT) | |||
Japonés (JA) | |||
Jaunsari (Devanagari) (JNS) | |||
Javanés (JV) | |||
Jola-Fonyi (DYO) | |||
Kabardiano (KBD) | |||
Caboverdiano (KEA) | |||
Kachin (Latin) (KAC) | |||
Kalenjin (KLN) | |||
Kalmyk (XAL) | |||
Kangri (Devanagari) (XNR) | |||
Kanuri (KR) | |||
Karachay-Balkar (KRC) | |||
Kara-Kalpak (cirílico) (KAA-CYR) | |||
Kara-Kalpak (Latin) (KAA) | |||
Kashubian (CSB) | |||
Kazajo (cirílico) (KK-CYR) | |||
Kazajo (Latin) (KK-LATN) | |||
Khakas (KJH) | |||
Khaling (KLR) | |||
Khasi (KHA) | |||
K'iche' (QUC) | |||
Kikuyu (KI) | |||
Kildin Sami (SJD) | |||
Kinyarwanda (RW) | |||
Komi (KV) | |||
Kongo (KN) | |||
Coreano (KO) | |||
Korku (KFQ) | |||
Koryak (KPY) | |||
Kosraean (KOS) | |||
Kpelle (KPE) | |||
Kuanyama (KJ) | |||
Kumyk (cirílico) (KUM) | |||
Kurdo (árabe) (KU-ARAB) | |||
Kurdo (Latin) (KU-LATN) | |||
Kurukh (Devanagari) (KRU) | |||
Kirguís (cirílico) (KY) | |||
Lak (LBE) | |||
Lakota (LKT) | |||
Latín (LA) | |||
Letón (LV) | |||
Lezguio (LEX) | |||
Lingala (LN) | |||
Lituano (LT) | |||
Bajo sorabo (DSB) | |||
Lozi (LOZ) | |||
Lule Sami (SMJ) | |||
Luo (Kenia y Tanzania) (LUO) | |||
Luxemburgués (LB) | |||
Luyia (LUY) | |||
Macedonio (MK) | |||
Machame (JMC) | |||
Madurés (MAD) | |||
Mahasu Pahari (Devanagari) (BFZ) | |||
Makhuwa-Meetto (MGH) | |||
Makonde (KDE) | |||
Malgache (MG) | |||
Malayo (Latin) (MS) | |||
Maltés (MT) | |||
Malto (Devanagari) (KMJ) | |||
Mandinka (MNK) | |||
Manés (GV) | |||
Maorí (MI) | |||
Mapundungun (ARN) | |||
Marathi (MR) | |||
Mari (Rusia) (CHM) | |||
Masai (MAS) | |||
Mende (Sierra Leona) (MEN) | |||
Meru (MER) | |||
Meta' (MGO) | |||
Minangkabau (MIN) | |||
Mohawk (MOH) | |||
Mongoliano (cirílico) (MN) | |||
Mongondow (MOG) | |||
Montenegrino (cirílico) (CNR-CYRL) | |||
Montenegrino (Latin) (CNR-LATN) | |||
Morisyen (MFE) | |||
Mundang (MUA) | |||
Nahuatl (NAH) | |||
Navajo (NV) | |||
Ndonga (NG) | |||
Neapolitano (NAP) | |||
Nepalí (NE) | |||
Ngomba (JGO) | |||
Niueano (NIU) | |||
Nogay (NOG) | |||
Ndebele del norte (ND) | |||
Sami del norte (Latin) (SME) | |||
Noruego (NO) | |||
Nyanja (NY) | |||
Nyankole (NYN) | |||
Nzima (NZI) | |||
Occitano (OC) | |||
Ojibway (OJ) | |||
Oromo (OM) | |||
Osetio (OS) | |||
Pampanga (PAM) | |||
Pangasinan (PAG) | |||
Papiamento (PAP) | |||
Pashto (PS) | |||
Pedi (NSO) | |||
Persa (FA) | |||
Polaco (PL) | |||
Portugués (PT) | |||
Punjabi (árabe) (PA) | |||
Quechua (QU) | |||
Ripuriano (KSH) | |||
Rumano (RO) | |||
Romanche (RM) | |||
Rundi (RN) | |||
Ruso (RU) | |||
Rwa (RWK) | |||
Sadri (Devanagari) (SCK) | |||
Sakha (SAH) | |||
Samburu (SAQ) | |||
Samoano (Latin) (SM) | |||
Sango (SG) | |||
Sangu (Gabón) | |||
Sánscrito (Devanagari) (SA) | |||
Santali (Devanagari) (SAT) | |||
Escocés (SCO) | |||
Sena (SEH) | |||
Serbio (cirílico) (SR-CYRL) | |||
Serbio (Latin) (SR, SR-LATN)) | |||
Shambala (KSB) | |||
Shona (SN) | |||
Siksika (BLA) | |||
Sirmauri (Devanagari) (SRX) | |||
Skolt Sami (SMS) | |||
Eslovaco (SK) | |||
Esloveno (SL) | |||
Soga (XOG) | |||
Somalí (árabe) (SO) | |||
Somalí (Latin) (SO-LATN) | |||
Songhai (SON) | |||
Ndebele del sur (NR) | |||
Altai del sur (ALT) | |||
Sami del sur (SMA) | |||
Sotho del sur (ST) | |||
Español (ES) | |||
Sundanés (SU) | |||
Swahili (Latin) (SW) | |||
Swati (SS) | |||
Sueco (SV) | |||
Tabasarano (TAB) | |||
Tachelhit (SHI) | |||
Tahitiano (TY) | |||
Taita (DAV) | |||
Tayiko (cirílico) (TG) | |||
Tamil (TA) | |||
Tártaro (cirílico) (TT-CYRL) | |||
Tártaro (Latin) | |||
Teso (TEO) | |||
Tetum (TET) | |||
Tailandés (TH) | |||
Thangmi (THF) | |||
Tok Pisin (TPI) | |||
Tongano (TO) | |||
Tsonga (TS) | |||
Tswana (TN) | |||
Turco (TR) | |||
Turcomano (Latin) TK | |||
Tuvano (TYV) | |||
Udmurt (UDM) | |||
Uigur (cirílico) (UG-CYRL) | |||
Ucraniano (UK) | |||
Alto sorabo (HSB) | |||
Urdu (UR) | |||
Uigur (árabe) (UG) | |||
Uzbeko (árabe) (UZ-ARAB) | |||
Uzbeko (cirílico) (UZ-CYRL) | |||
Uzbeko (Latin) (UZ) | |||
Vietnamita (VI) | |||
Volapuk (VO) | |||
Vunjo (VUN) | |||
Walser (WAE) | |||
Galés (CY) | |||
Frisio occidental (FY) | |||
Wolof (WO) | |||
Xhosa (XH) | |||
Maya yucateca (YUA) | |||
Zapotec (ZAP) | |||
Zarma (DJE) | |||
Zhuang (ZA) | |||
Zulu (ZU) |
Alfabeto | UiPath Document OCR | |
---|---|---|
Hebreo | א ב ג ד ה ו ז ח ט י ך כ ל ם מ ן נ ס ע ף פ ץ צ ק ר ש ת ₪ | |
Latín | A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï Ñ Ò Ó Ô Õ Ö Ø Ù Ú Û Ü Ý ß à á â ã ä å æ ç è é ê ë ì í î ï ñ ò ó ô õ ö ø ù ú û ü ý Ā ā Ă ă Ą ą Ć ć Ċ ċ Č č Ď ď Đ đ Ē ē Ė ė Ę ę Ě ě Ğ ğ Ġ ġ Ħ ħ Ī ī Ĭ ĭ Į į İ ı Ĺ ĺ Ľ ľ Ł ł Ń ń Ň ň Ŋ ŋ Ō ō Ő ő Œ œ Ŕ ŕ Ř ř Ś ś Š š Ť ť Ŧ ŧ Ū ū Ŭ ŭ Ů ů Ų ų Ź ź Ż ż Ž ž Ə Ǵ ǵ Ș ș Ț ț ə μ | |
Otros caracteres | ! " # $ % & \ ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ [ \ \ ] ^ _ { | } ~ £ ¥ § © ® ° ¿ € ≤ ≥ |