document-understanding
2024.10
true
- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Aprendizaje profundo
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Last updated 15 de nov. de 2024
OCR
Cada motor OCR está diseñado para ofrecer un reconocimiento óptico de caracteres eficiente y efectivo, independientemente de tus necesidades o implementación específicas. Esta página proporciona información sobre los idiomas compatibles con los motores OCR de UiPath® :
- UiPath Document OCR: UiPath OCR, por defecto, que recibe actualizaciones y mejoras periódicas. Puedes utilizarlo en GPU o CPU, ofreciendo el mismo nivel de precisión en ambos casos.
- UiPath Document OCR_CPU: especialmente optimizado para ejecutarse en CPU.
- UiPath Extended Languages OCR: capaz de procesar documentos en más de 200 idiomas, especialmente en chino, coreano, vietnamita, tailandés, los principales idiomas indios y los idiomas que utilizan el alfabeto cirílico o griego.
Consejo: elegir el motor de OCR adecuado para sus documentos es sencillo. De forma predeterminada, utiliza UiPath Document OCR, que se beneficia de actualizaciones y mejoras regulares. Si esto no es compatible con el lenguaje de tu documento o no funciona como se espera, cambia a uno de nuestros otros motores OCR, como UiPath Extended Languages OCR.
Idioma (código de idioma) | UiPath Document OCR y UiPath Document OCR_CPU | UiPath Extended Languages OCR | OCR chino, japonés, coreano |
---|---|---|---|
Adigués (ADY) | |||
Afar (AA) | |||
Afrikaans (AFR) | |||
Akan (AK) | |||
Albanés (SQI) | |||
Algonquin (ALQ) | |||
Angika (Devanagari) (ANP) | |||
Árabe (ARA) | (Vista previa) | ||
Asturiano (AST) | |||
Asamés (ASA) | |||
Avar (AV) | |||
Awadhi-Hindi (Devanagari) (AWA) | |||
Aymara (AYM) | |||
Azerí (Latin) (AZ) | |||
Bafia (KSF) | |||
Bagheli (BFY) | |||
Bambara (BM) | |||
Baskir (BA) | |||
Euskera (EU) | |||
Bielorruso (cirílico) (BE, BE-CYRL) | |||
Bielorruso (Latin) (BE, BE-LATN) | |||
Bemba (BEM) | |||
Bena (BEZ) | |||
Bhojpuri-Hindi (Devanagari) (BHO) | |||
Bikol (BIK) | |||
Bislama (BI) | |||
Bodo (Devanagari) (BRX) | |||
Bosnio (Latin) (BS) | |||
Brajbha (BRA) | |||
Bretón (BR) | |||
Búlgaro (BG) | |||
Bundeli (BNS) | |||
Buriat (cirílico) (BUA) | |||
Catalán (CA) | |||
Cebuano (CEB) | |||
Chamling (RAB) | |||
Chamorro (CH) | |||
Checheno (CE) | |||
Chhattisgarhi (Devanagari) (HNE) | |||
Chiga (CGG) | |||
Chino - Simplificado (ZH-Hans) | |||
Chino: tradicional (Hant) | |||
Choctaw (CHO) | |||
Chukot (CKT) | |||
Chuvash (CV) | |||
Cornuallés (KW) | |||
Corso (CO) | |||
Cree (CR) | |||
Creek (MUS) | |||
Tártaro de Crimea (Latin) (CRH) | |||
Croata (HR) | |||
Crow (CRO) | |||
Checo (CS) | |||
Danés (DA) | |||
Dargwa (DAR) | |||
Dari (PRS) | |||
Dhimal (Devanagari) (DHI) | |||
Dogri (Devanagari) (DOI) | |||
Duala (DUA) | |||
Dungan (DNG) | |||
Holandés (NL) | |||
Efik (EFI) | |||
Inglés (EN) | |||
Erzya (Cyrilic) (MYV) | |||
Estonio (ET) | |||
Feroés (FO) | |||
Fijiano (FJ) | |||
Filipino (FIL) | |||
Finlandés (FI) | |||
Fon (FON) | |||
Francés (FR) | |||
Friuliano (FUR) | |||
Ga (GAA) | |||
Gaélico: irlandés (GA) | |||
Gaélico: escocés (GD) | |||
Gagauz (Latin) (GAG) | |||
Gallego (GL) | |||
Ganda (LG) | |||
Gayo (GAY) | |||
Alemán (DE) | |||
Gilbertés (GIL) | |||
Gondi (Devanagari) (GON) | |||
Griego (EL) | |||
Groenlandés (KL) | |||
Guaraní (GN) | |||
Gurung (Devanagari) | |||
Gusii (GUZ) | |||
Criollo haitiano (HT) | |||
Halbi (Devanagari) (HLB) | |||
Hani (HNI) | |||
Haryanvi (BGC) | |||
Hawaiano (HAW) | |||
Hebreo (HE) | |||
Herero (HZ) | |||
Hiligaynon (HIL) | |||
Hindi (HI) | |||
Hmong Daw (Latin) (MWW) | |||
Ho (Devanagari) (HOC) | |||
Húngaro (HU) | |||
Iban (IBA) | |||
Islandés (IS) | |||
Igbo (IG) | |||
Iloko (ILO) | |||
Inari Sami (SMN) | |||
Indonesio (ID) | |||
Ingush (INH) | |||
Interlingua (IA) | |||
Inuktitut (Latin) (IU) | |||
Italiano (IT) | |||
Japonés (JA) | |||
Jaunsari (Devanagari) (JNS) | |||
Javanés (JV) | |||
Jola-Fonyi (DYO) | |||
Kabardiano (KBD) | |||
Caboverdiano (KEA) | |||
Kachin (Latin) (KAC) | |||
Kalenjin (KLN) | |||
Kalmyk (XAL) | |||
Kangri (Devanagari) (XNR) | |||
Kanuri (KR) | |||
Karachay-Balkar (KRC) | |||
Kara-Kalpak (cirílico) (KAA-CYR) | |||
Kara-Kalpak (Latin) (KAA) | |||
Kashubian (CSB) | |||
Kazajo (cirílico) (KK-CYR) | |||
Kazajo (Latin) (KK-LATN) | |||
Khakas (KJH) | |||
Khaling (KLR) | |||
Khasi (KHA) | |||
K'iche' (QUC) | |||
Kikuyu (KI) | |||
Kildin Sami (SJD) | |||
Kinyarwanda (RW) | |||
Komi (KV) | |||
Kongo (KN) | |||
Coreano (KO) | |||
Korku (KFQ) | |||
Koryak (KPY) | |||
Kosraean (KOS) | |||
Kpelle (KPE) | |||
Kuanyama (KJ) | |||
Kumyk (cirílico) (KUM) | |||
Kurdo (árabe) (KU-ARAB) | |||
Kurdo (Latin) (KU-LATN) | |||
Kurukh (Devanagari) (KRU) | |||
Kirguís (cirílico) (KY) | |||
Lak (LBE) | |||
Lakota (LKT) | |||
Latín (LA) | |||
Letón (LV) | |||
Lezguio (LEX) | |||
Lingala (LN) | |||
Lituano (LT) | |||
Bajo sorabo (DSB) | |||
Lozi (LOZ) | |||
Lule Sami (SMJ) | |||
Luo (Kenia y Tanzania) (LUO) | |||
Luxemburgués (LB) | |||
Luyia (LUY) | |||
Macedonio (MK) | |||
Machame (JMC) | |||
Madurés (MAD) | |||
Mahasu Pahari (Devanagari) (BFZ) | |||
Makhuwa-Meetto (MGH) | |||
Makonde (KDE) | |||
Malgache (MG) | |||
Malayo (Latin) (MS) | |||
Maltés (MT) | |||
Malto (Devanagari) (KMJ) | |||
Mandinka (MNK) | |||
Manés (GV) | |||
Maorí (MI) | |||
Mapundungun (ARN) | |||
Marathi (MR) | |||
Mari (Rusia) (CHM) | |||
Masai (MAS) | |||
Mende (Sierra Leona) (MEN) | |||
Meru (MER) | |||
Meta' (MGO) | |||
Minangkabau (MIN) | |||
Mohawk (MOH) | |||
Mongoliano (cirílico) (MN) | |||
Mongondow (MOG) | |||
Montenegrino (cirílico) (CNR-CYRL) | |||
Montenegrino (Latin) (CNR-LATN) | |||
Morisyen (MFE) | |||
Mundang (MUA) | |||
Nahuatl (NAH) | |||
Navajo (NV) | |||
Ndonga (NG) | |||
Neapolitano (NAP) | |||
Nepalí (NE) | |||
Ngomba (JGO) | |||
Niueano (NIU) | |||
Nogay (NOG) | |||
Ndebele del norte (ND) | |||
Sami del norte (Latin) (SME) | |||
Noruego (NO) | |||
Nyanja (NY) | |||
Nyankole (NYN) | |||
Nzima (NZI) | |||
Occitano (OC) | |||
Ojibway (OJ) | |||
Oromo (OM) | |||
Osetio (OS) | |||
Pampanga (PAM) | |||
Pangasinan (PAG) | |||
Papiamento (PAP) | |||
Pashto (PS) | |||
Pedi (NSO) | |||
Persa (FA) | |||
Polaco (PL) | |||
Portugués (PT) | |||
Punjabi (árabe) (PA) | |||
Quechua (QU) | |||
Ripuriano (KSH) | |||
Rumano (RO) | |||
Romanche (RM) | |||
Rundi (RN) | |||
Ruso (RU) | |||
Rwa (RWK) | |||
Sadri (Devanagari) (SCK) | |||
Sakha (SAH) | |||
Samburu (SAQ) | |||
Samoano (Latin) (SM) | |||
Sango (SG) | |||
Sangu (Gabón) | |||
Sánscrito (Devanagari) (SA) | |||
Santali (Devanagari) (SAT) | |||
Escocés (SCO) | |||
Sena (SEH) | |||
Serbio (cirílico) (SR-CYRL) | |||
Serbio (Latin) (SR, SR-LATN)) | |||
Shambala (KSB) | |||
Shona (SN) | |||
Siksika (BLA) | |||
Sirmauri (Devanagari) (SRX) | |||
Skolt Sami (SMS) | |||
Eslovaco (SK) | |||
Esloveno (SL) | |||
Soga (XOG) | |||
Somalí (árabe) (SO) | |||
Somalí (Latin) (SO-LATN) | |||
Songhai (SON) | |||
Ndebele del sur (NR) | |||
Altai del sur (ALT) | |||
Sami del sur (SMA) | |||
Sotho del sur (ST) | |||
Español (ES) | |||
Sundanés (SU) | |||
Swahili (Latin) (SW) | |||
Swati (SS) | |||
Sueco (SV) | |||
Tabasarano (TAB) | |||
Tachelhit (SHI) | |||
Tahitiano (TY) | |||
Taita (DAV) | |||
Tayiko (cirílico) (TG) | |||
Tamil (TA) | |||
Tártaro (cirílico) (TT-CYRL) | |||
Tártaro (Latin) | |||
Teso (TEO) | |||
Tetum (TET) | |||
Tailandés (TH) | |||
Thangmi (THF) | |||
Tok Pisin (TPI) | |||
Tongano (TO) | |||
Tsonga (TS) | |||
Tswana (TN) | |||
Turco (TR) | |||
Turcomano (Latin) TK | |||
Tuvano (TYV) | |||
Udmurt (UDM) | |||
Uigur (cirílico) (UG-CYRL) | |||
Ucraniano (UK) | |||
Alto sorabo (HSB) | |||
Urdu (UR) | |||
Uigur (árabe) (UG) | |||
Uzbeko (árabe) (UZ-ARAB) | |||
Uzbeko (cirílico) (UZ-CYRL) | |||
Uzbeko (Latin) (UZ) | |||
Vietnamita (VI) | |||
Volapuk (VO) | |||
Vunjo (VUN) | |||
Walser (WAE) | |||
Galés (CY) | |||
Frisio occidental (FY) | |||
Wolof (WO) | |||
Xhosa (XH) | |||
Maya yucateca (YUA) | |||
Zapotec (ZAP) | |||
Zarma (DJE) | |||
Zhuang (ZA) | |||
Zulu (ZU) |
Caracteres árabes | 'ا','ب','ة','ت','ث','ج','ح','خ','د','ذ','ر','ز','س','ش','ص','ض','ط','ظ','ع','غ','ـ','ف','ق','ك','ل','م','ن','ه','و','ى','ي','ٓ','ٔ','ٕ','٠','١','٢','٣','٤','٥','٦','٧','٨','٩','٪','٫','٬','٭','ٱ','۔','ً','ٌ','ٍ','َ','ُ','ِ','ّ','ْ','ٰ','ۥ','ۦ','آ','،','؛','؟','ء','أ','ؤ','إ','ئ' |
Caracteres de OCR compatibles | ! " # $ % & \ ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ \ ] ^ _ a b c d e f g h i j k l m n o p q r s t u v w x y z { | } ~ £ ¥ § © ® ° ¿ À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï Ñ Ò Ó Ô Õ Ö Ø Ù Ú Û Ü Ý ß à á â ã ä å æ ç è é ê ë ì í î ï ñ ò ó ô õ ö ø ù ú û ü ý Ā ā Ă ă Ą ą Ć ć Ċ ċ Č č Ď ď Đ đ Ē ē Ė ė Ę ę Ě ě Ğ ğ Ġ ġ Ħ ħ Ī ī Ĭ ĭ Į į İ ı Ĺ ĺ Ľ ľ Ł ł Ń ń Ň ň Ŋ ŋ Ō ō Ő ő Œ œ Ŕ ŕ Ř ř Ś ś Š š Ť ť Ŧ ŧ Ū ū Ŭ ŭ Ů ů Ų ų Ź ź Ż ż Ž ž Ə Ǵ ǵ Ș ș Ț ț ə μ א ב ג ד ה ו ז ח ט י ך כ ל ם מ ן נ ס ע ף פ ץ צ ק ר ש ת ₪ € ≤ ≥ |