document-understanding
latest
false
- Visão geral
- Introdução
- Atividades
- Painéis de insights
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Limitações de tráfego
- Configuração de OCR
- Pipelines
- Serviços de OCR
- Idiomas suportados
- Aprendizagem profunda
- Licenciamento
Guia do usuário do Document Understanding.
Last updated 14 de nov de 2024
OCR
Each OCR engine is tailored to deliver efficient and effective optical character recognition, regardless of your specific needs or deployment. This page provides information on the supported languages for UiPath® OCR engines:
- UiPath Document OCR: OCR padrão do UiPath, que recebe atualizações e melhorias regulares. Você pode usá-lo na GPU ou CPU, proporcionando o mesmo nível de precisão em ambos os casos.
- UiPath Document OCR_CPU: especialmente otimizado para ser executado na CPU.
- UiPath Extended Languages OCR: capaz de processar documentos em mais de 200 idiomas, especialmente em chinês, coreano, vietnamita, tailandês, principais idiomas indianos e idiomas que usam os alfabetos cirílico ou grego.
- OCR chinês, japonês e coreano: disponível como ponto de extremidade e apenas para implantações na CPU.
Dica: a escolha do mecanismo de OCR certo para seus documentos é simples. Por padrão, use o UiPath Document OCR, que se beneficia de atualizações e melhorias regulares. Se ele não for compatível com o idioma de seus documentos ou não estiver funcionando conforme o esperado, mude para um dos nossos outros mecanismos de OCR, como o UiPath Extended Languages OCR.
Idioma (Código do idioma) | UiPath Document OCR e UiPath Document OCR_CPU | UiPath Extended Languages OCR | OCR para chinês, japonês e coreano |
---|---|---|---|
Adigue (ADY) | |||
Afar (AA) | |||
Afrikaans (AFR) | |||
Acã (AK) | |||
Albanês (SQI) | |||
Algonquino (ALQ) | |||
Angika (devanagari) (ANP) | |||
Árabe (ARA) | (Pré-visualização) | ||
Asturiano (AST) | |||
Asu (ASA) | |||
Ávaro (AV) | |||
Awadhi-Hindi (devanagari) (AWA) | |||
Aymara (AYM) | |||
Azerbaijano (latino) (AZ) | |||
Bafia (KSF) | |||
Bagheli (BFY) | |||
Bambara (BM) | |||
Basquir (BA) | |||
Basco (EU) | |||
Bielorrusso (cirílico) (BE, BE-CYRL) | |||
Bielorrusso (latino) (BE, BE-LATN) | |||
Bemba (BEM) | |||
Bena (BEZ) | |||
Bhojpuri-Hindi (devanagari) (BHO) | |||
Bicolano (BIK) | |||
Bislamá (BI) | |||
Bodo (devanagari) (BRX) | |||
Bósnio (latino) (BS) | |||
Brajbha (BRA) | |||
Bretão (BR) | |||
Búlgaro (BG) | |||
Bundeli (BNS) | |||
Buriate (cirílico) (BUA) | |||
Catalão (CA) | |||
Cebuano (CEB) | |||
Chamling (RAB) | |||
Chamorro (CH) | |||
Checheno (CE) | |||
Chhattisgarhi (devanagari) (HNE) | |||
Chiga (CGG) | |||
Chinês - Simplificado (ZH-Hans) | |||
Chinês - Tradicional (Hant) | |||
Choctaw (CHO) | |||
Chukoto (CKT) | |||
Chuvache (CV) | |||
Córnico (KW) | |||
Corso (CO) | |||
Cri (CR) | |||
Creek (MUS) | |||
Tártaro da Crimeia (latino) (CRH) | |||
Croata (HR) | |||
Crow (CRO) | |||
Tcheco (CS) | |||
Dinamarquês (DA) | |||
Dargínico (DAR) | |||
Dari (PRS) | |||
Dhimal (devanagari) (DHI) | |||
Dogri (devanagari) (DOI) | |||
Duala (DUA) | |||
Dungan (DNG) | |||
Holandês (NL) | |||
Efique (EFI) | |||
Inglês (EN) | |||
Erzia (cirílico) (MYV) | |||
Estoniano (ET) | |||
Faroês (FO) | |||
Fijiano (FJ) | |||
Filipino (FIL) | |||
Finlandês (FI) | |||
Fon (FON) | |||
Francês (FR) | |||
Friuliano (FUR) | |||
Ga (GAA) | |||
Gaélico - Irlandês (GA) | |||
Gaélico - Escocês (GD) | |||
Gagauz (latino) (GAG) | |||
Galego (GL) | |||
Ganda (LG) | |||
Gayo (GAY) | |||
Alemão (DE) | |||
Gilbertês (GIL) | |||
Gondi (devanagari) (GON) | |||
Grego (EL) | |||
Groenlandês (KL) | |||
Guarani (GN) | |||
Gurung (devanagari) | |||
Gusii (GUZ) | |||
Crioulo haitiano (HT) | |||
Halbi (devanagari) (HLB) | |||
Hani (HNI) | |||
Hariani (BGC) | |||
Havaiano (HAW) | |||
Hebraico (HE) | |||
Herero (HZ) | |||
Hiligaynon (HIL) | |||
Hindi (HI) | |||
Hmong Daw (latino) (MWW) | |||
Ho (devanagari) (HOC) | |||
Húngaro (HU) | |||
Iban (IBA) | |||
Islandês (IS) | |||
Igbo (IG) | |||
Iloko (ILO) | |||
Inari Sami (SMN) | |||
Indonésio (ID) | |||
Inguche (INH) | |||
Interlíngua (IA) | |||
Inuctitute (latino) (IU) | |||
Italiano (IT) | |||
Japonês (JA) | |||
Jaunsari (devanagari) (JNS) | |||
Javanês (JV) | |||
Jola-Fonyi (DYO) | |||
Cabardiano (KBD) | |||
Cabo-verdiano (KEA) | |||
Cachin (latino) (KAC) | |||
Calenjin (KLN) | |||
Calmuco (XAL) | |||
Kangri (devanagari) (XNR) | |||
Canuri (KR) | |||
Carachaio-bálcara (KRC) | |||
Caracalpaque (cirílico) (KAA-CYR) | |||
Caracalpaque (latino) (KAA) | |||
Cassúbio (CSB) | |||
Cazaque (cirílico) (KK-CYR) | |||
Cazaque (latino) (KK-LATN) | |||
Cacas (KJH) | |||
Khaling (KLR) | |||
Khasi (KHA) | |||
Quiché (QUC) | |||
Quicuio (KI) | |||
Língua lapônica de Quildim (SJD) | |||
Quiniaruanda (RW) | |||
Quomi (KV) | |||
Congo (KN) | |||
Coreano (KO) | |||
Korku (KFQ) | |||
Koriaque (KPY) | |||
Kosreano (KOS) | |||
Kpelle (KPE) | |||
Cuanhama (KJ) | |||
Cumique (cirílico) (KUM) | |||
Curdo (árabe) (KU-ARAB) | |||
Curdo (latino) (KU-LATN) | |||
Kurux (devanagari) (KRU) | |||
Quirguiz (cirílico) (KY) | |||
Lak (LBE) | |||
Lakota (LKT) | |||
Latim (LA) | |||
Letão (LV) | |||
Lezgui (LEX) | |||
Lingala (LN) | |||
Lituano (LT) | |||
Baixo sorábio (DSB) | |||
Lozi (LOZ) | |||
Língua lapônica de Lule (SMJ) | |||
Luo (Quênia e Tanzânia) (LUO) | |||
Luxemburguês (LB) | |||
Luia (LUY) | |||
Macedônio (MK) | |||
Machame (JMC) | |||
Madurês (MAD) | |||
Mahasu Pahari (devanagari) (BFZ) | |||
Makhuwa-Meetto (MGH) | |||
Maconde (KDE) | |||
Malgaxe (MG) | |||
Malaio (latino) (MS) | |||
Maltês (MT) | |||
Malto (devanagari) (KMJ) | |||
Mandinga (MNK) | |||
Manx (GV) | |||
Maori (MI) | |||
Mapundungu (ARN) | |||
Marata (MR) | |||
Mari (Rússia) (CHM) | |||
Masai (MAS) | |||
Mende (Serra Leoa) (MEN) | |||
Meru (MER) | |||
Meta' (MGO) | |||
Minangkabau (MIN) | |||
Mohawk (MOH) | |||
Mongol (cirílico) (MN) | |||
Mongondow (MOG) | |||
Montenegrino (cirílico) (CNR-CYRL) | |||
Montenegrino (latino) (CNR-LATN) | |||
Mauriciano (MFE) | |||
Mundang (MUA) | |||
Nahuatl (NAH) | |||
Navajo (NV) | |||
Xindonga (NG) | |||
Napolitano (NAP) | |||
Nepalês (NE) | |||
Nguemba (JGO) | |||
Niueano (NIU) | |||
Nogai (NOG) | |||
Ndebele do norte (ND) | |||
Língua lapônica setentrional (latino) (SME) | |||
Norueguês (NO) | |||
Nianja (NY) | |||
Nyankole (NYN) | |||
Nzima (NZI) | |||
Occitano (OC) | |||
Ojíbua (OJ) | |||
Oromo (OM) | |||
Ossético (OS) | |||
Pampanga (PAM) | |||
Pangasinano (PAG) | |||
Papiamento (PAP) | |||
Pashto (PS) | |||
Pedi (NSO) | |||
Persa (FA) | |||
Polonês (PL) | |||
Português (PT) | |||
Panjabi (árabe) (PA) | |||
Quechua (QU) | |||
Ripuriano (KSH) | |||
Romeno (RO) | |||
Romanche (RM) | |||
Rundi (RN) | |||
Russo (RU) | |||
Rwa (RWK) | |||
Sadri (devanagari) (SCK) | |||
Sakha (SAH) | |||
Samburu (SAQ) | |||
Samoano (latino) (SM) | |||
Sango (SG) | |||
Sangu (Gabão) | |||
Sânscrito (devanagari) (SA) | |||
Santali (devanagari) (SAT) | |||
Língua ânglica escocesa (SCO) | |||
Sena (SEH) | |||
Sérvio (cirílico) (SR-CYRL) | |||
Sérvio (latino) (SR, SR-LATN)) | |||
Shambala (KSB) | |||
Xona (SN) | |||
Siksika (BLA) | |||
Sirmauri (devanagari) (SRX) | |||
Língua lapônica escolta (SMS) | |||
Eslovaco (SK) | |||
Esloveno (SL) | |||
Soga (XOG) | |||
Somali (árabe) (SO) | |||
Somali (latino) (SO-LATN) | |||
Songai (SON) | |||
Andebele meridional (NR) | |||
Altai meridional (ALT) | |||
Sami meridional (SMA) | |||
Soto meridional (ST) | |||
Espanhol (ES) | |||
Sundanês (SU) | |||
Suaíli (latino) (SW) | |||
Suázi (SS) | |||
Sueco (SV) | |||
Tabassarão (TAB) | |||
Tachelhit (SHI) | |||
Taitiano (TY) | |||
Taita (DAV) | |||
Tajique (cirílico) (TG) | |||
Tâmil (TA) | |||
Tártaro (cirílico) (TT-CYRL) | |||
Tártaro (latino) (TT) | |||
Teso (TEO) | |||
Tétum (TET) | |||
Tailandês (TH) | |||
Thangmi (THF) | |||
Tok Pisin (TPI) | |||
Tonganês (TO) | |||
Tsonga (TS) | |||
Tsuana (TN) | |||
Turco (TR) | |||
Turcomeno (latino) (TK) | |||
Tuvano (TYV) | |||
Udmurte (UDM) | |||
Uigur (cirílico) (UG-CYRL) | |||
Ucraniano (UK) | |||
Alto sorábio (HSB) | |||
Urdu (UR) | |||
Uigur (árabe) (UG) | |||
Usbeque (árabe) (UZ-ARAB) | |||
Usbeque (cirílico) (UZ-CYRL) | |||
Usbeque (latino) (UZ) | |||
Vietnamita (VI) | |||
Volapuque (VO) | |||
Vunjo (VUN) | |||
Walser (WAE) | |||
Galês (CY) | |||
Frísio ocidental (FY) | |||
Uolofe (WO) | |||
Xossa (XH) | |||
Maya iucateque (YUA) | |||
Zapotec (ZAP) | |||
Zarma (DJE) | |||
Zhuang (ZA) | |||
Zulu (ZU) |
Alfabeto | UiPath Document OCR e UiPath Document OCR_CPU | |
---|---|---|
Árabe | 'ا','ب','ة','ت','ث','ج','ح','خ','د','ذ','ر','ز','س','ش','ص','ض','ط','ظ','ع','غ','ـ','ف','ق','ك','ل','م','ن','ه','و','ى','ي','ٓ','ٔ','ٕ','٠','١','٢','٣','٤','٥','٦','٧','٨','٩','٪','٫','٬','٭','ٱ','۔','ً','ٌ','ٍ','َ','ُ','ِ','ّ','ْ','ٰ','ۥ','ۦ','آ','،','؛','؟','ء','أ','ؤ','إ','ئ' | |
Hebraico | א ב ג ד ה ו ז ח ט י ך כ ל ם מ ן נ ס ע ף פ ץ צ ק ר ש ת ₪ | |
Latim | A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï Ñ Ò Ó Ô Õ Ö Ø Ù Ú Û Ü Ý ß à á â ã ä å æ ç è é ê ë ì í î ï ñ ò ó ô õ ö ø ù ú û ü ý Ā ā Ă ă Ą ą Ć ć Ċ ċ Č č Ď ď Đ đ Ē ē Ė ė Ę ę Ě ě Ğ ğ Ġ ġ Ħ ħ Ī ī Ĭ ĭ Į į İ ı Ĺ ĺ Ľ ľ Ł ł Ń ń Ň ň Ŋ ŋ Ō ō Ő ő Œ œ Ŕ ŕ Ř ř Ś ś Š š Ť ť Ŧ ŧ Ū ū Ŭ ŭ Ů ů Ų ų Ź ź Ż ż Ž ž Ə Ǵ ǵ Ș ș Ț ț ə μ | |
Outros caracteres | ! " # $ % & \ ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ [ \ \ ] ^ _ { | } ~ £ ¥ § © ® ° ¿ € ≤ ≥ |