document-understanding
latest
false
- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Pacotes de ML
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Endpoints públicos
- Idiomas suportados
- Painéis de insights
- Dados e segurança
- Licenciamento
- Como fazer
Guia do usuário de projetos modernos do Document Understanding
Last updated 14 de nov de 2024
OCR
Cada mecanismo de OCR é personalizado para proporcionar um reconhecimento óptico de caracteres eficiente e eficaz, independentemente de suas necessidades ou implantação específica. Esta página fornece informações sobre os idiomas compatíveis com os mecanismos UiPath® OCR:
- UiPath Document OCR: OCR padrão do UiPath, que recebe atualizações e melhorias regulares. Você pode usá-lo na GPU ou CPU, proporcionando o mesmo nível de precisão em ambos os casos.
- UiPath Document OCR_CPU: especialmente otimizado para ser executado na CPU.
- UiPath Extended Languages OCR: capaz de processar documentos em mais de 200 idiomas, especialmente em chinês, coreano, vietnamita, tailandês, principais idiomas indianos e idiomas que usam os alfabetos cirílico ou grego.
- OCR chinês, japonês e coreano: disponível como ponto de extremidade e apenas para implantações na CPU.
Dica: a escolha do mecanismo de OCR certo para seus documentos é simples. Por padrão, use o UiPath Document OCR, que se beneficia de atualizações e melhorias regulares. Se ele não for compatível com o idioma de seus documentos ou não estiver funcionando conforme o esperado, mude para um dos nossos outros mecanismos de OCR, como o UiPath Extended Languages OCR.
Idioma (Código do idioma) | UiPath Document OCR e UiPath Document OCR_CPU | UiPath Extended Languages OCR | OCR para chinês, japonês e coreano |
---|---|---|---|
Adigue (ADY) | |||
Afar (AA) | |||
Afrikaans (AFR) | |||
Acã (AK) | |||
Albanês (SQI) | |||
Algonquino (ALQ) | |||
Angika (devanagari) (ANP) | |||
Árabe (ARA) | (Pré-visualização) | ||
Asturiano (AST) | |||
Asu (ASA) | |||
Ávaro (AV) | |||
Awadhi-Hindi (devanagari) (AWA) | |||
Aymara (AYM) | |||
Azerbaijano (latino) (AZ) | |||
Bafia (KSF) | |||
Bagheli (BFY) | |||
Bambara (BM) | |||
Basquir (BA) | |||
Basco (EU) | |||
Bielorrusso (cirílico) (BE, BE-CYRL) | |||
Bielorrusso (latino) (BE, BE-LATN) | |||
Bemba (BEM) | |||
Bena (BEZ) | |||
Bhojpuri-Hindi (devanagari) (BHO) | |||
Bicolano (BIK) | |||
Bislamá (BI) | |||
Bodo (devanagari) (BRX) | |||
Bósnio (latino) (BS) | |||
Brajbha (BRA) | |||
Bretão (BR) | |||
Búlgaro (BG) | |||
Bundeli (BNS) | |||
Buriate (cirílico) (BUA) | |||
Catalão (CA) | |||
Cebuano (CEB) | |||
Chamling (RAB) | |||
Chamorro (CH) | |||
Checheno (CE) | |||
Chhattisgarhi (devanagari) (HNE) | |||
Chiga (CGG) | |||
Chinês - Simplificado (ZH-Hans) | |||
Chinês - Tradicional (Hant) | |||
Choctaw (CHO) | |||
Chukoto (CKT) | |||
Chuvache (CV) | |||
Córnico (KW) | |||
Corso (CO) | |||
Cri (CR) | |||
Creek (MUS) | |||
Tártaro da Crimeia (latino) (CRH) | |||
Croata (HR) | |||
Crow (CRO) | |||
Tcheco (CS) | |||
Dinamarquês (DA) | |||
Dargínico (DAR) | |||
Dari (PRS) | |||
Dhimal (devanagari) (DHI) | |||
Dogri (devanagari) (DOI) | |||
Duala (DUA) | |||
Dungan (DNG) | |||
Holandês (NL) | |||
Efique (EFI) | |||
Inglês (EN) | |||
Erzia (cirílico) (MYV) | |||
Estoniano (ET) | |||
Faroês (FO) | |||
Fijiano (FJ) | |||
Filipino (FIL) | |||
Finlandês (FI) | |||
Fon (FON) | |||
Francês (FR) | |||
Friuliano (FUR) | |||
Ga (GAA) | |||
Gaélico - Irlandês (GA) | |||
Gaélico - Escocês (GD) | |||
Gagauz (latino) (GAG) | |||
Galego (GL) | |||
Ganda (LG) | |||
Gayo (GAY) | |||
Alemão (DE) | |||
Gilbertês (GIL) | |||
Gondi (devanagari) (GON) | |||
Grego (EL) | |||
Groenlandês (KL) | |||
Guarani (GN) | |||
Gurung (devanagari) | |||
Gusii (GUZ) | |||
Crioulo haitiano (HT) | |||
Halbi (devanagari) (HLB) | |||
Hani (HNI) | |||
Hariani (BGC) | |||
Havaiano (HAW) | |||
Hebraico (HE) | |||
Herero (HZ) | |||
Hiligaynon (HIL) | |||
Hindi (HI) | |||
Hmong Daw (latino) (MWW) | |||
Ho (devanagari) (HOC) | |||
Húngaro (HU) | |||
Iban (IBA) | |||
Islandês (IS) | |||
Igbo (IG) | |||
Iloko (ILO) | |||
Inari Sami (SMN) | |||
Indonésio (ID) | |||
Inguche (INH) | |||
Interlíngua (IA) | |||
Inuctitute (latino) (IU) | |||
Italiano (IT) | |||
Japonês (JA) | |||
Jaunsari (devanagari) (JNS) | |||
Javanês (JV) | |||
Jola-Fonyi (DYO) | |||
Cabardiano (KBD) | |||
Cabo-verdiano (KEA) | |||
Cachin (latino) (KAC) | |||
Calenjin (KLN) | |||
Calmuco (XAL) | |||
Kangri (devanagari) (XNR) | |||
Canuri (KR) | |||
Carachaio-bálcara (KRC) | |||
Caracalpaque (cirílico) (KAA-CYR) | |||
Caracalpaque (latino) (KAA) | |||
Cassúbio (CSB) | |||
Cazaque (cirílico) (KK-CYR) | |||
Cazaque (latino) (KK-LATN) | |||
Cacas (KJH) | |||
Khaling (KLR) | |||
Khasi (KHA) | |||
Quiché (QUC) | |||
Quicuio (KI) | |||
Língua lapônica de Quildim (SJD) | |||
Quiniaruanda (RW) | |||
Quomi (KV) | |||
Congo (KN) | |||
Coreano (KO) | |||
Korku (KFQ) | |||
Koriaque (KPY) | |||
Kosreano (KOS) | |||
Kpelle (KPE) | |||
Cuanhama (KJ) | |||
Cumique (cirílico) (KUM) | |||
Curdo (árabe) (KU-ARAB) | |||
Curdo (latino) (KU-LATN) | |||
Kurux (devanagari) (KRU) | |||
Quirguiz (cirílico) (KY) | |||
Lak (LBE) | |||
Lakota (LKT) | |||
Latim (LA) | |||
Letão (LV) | |||
Lezgui (LEX) | |||
Lingala (LN) | |||
Lituano (LT) | |||
Baixo sorábio (DSB) | |||
Lozi (LOZ) | |||
Língua lapônica de Lule (SMJ) | |||
Luo (Quênia e Tanzânia) (LUO) | |||
Luxemburguês (LB) | |||
Luia (LUY) | |||
Macedônio (MK) | |||
Machame (JMC) | |||
Madurês (MAD) | |||
Mahasu Pahari (devanagari) (BFZ) | |||
Makhuwa-Meetto (MGH) | |||
Maconde (KDE) | |||
Malgaxe (MG) | |||
Malaio (latino) (MS) | |||
Maltês (MT) | |||
Malto (devanagari) (KMJ) | |||
Mandinga (MNK) | |||
Manx (GV) | |||
Maori (MI) | |||
Mapundungu (ARN) | |||
Marata (MR) | |||
Mari (Rússia) (CHM) | |||
Masai (MAS) | |||
Mende (Serra Leoa) (MEN) | |||
Meru (MER) | |||
Meta' (MGO) | |||
Minangkabau (MIN) | |||
Mohawk (MOH) | |||
Mongol (cirílico) (MN) | |||
Mongondow (MOG) | |||
Montenegrino (cirílico) (CNR-CYRL) | |||
Montenegrino (latino) (CNR-LATN) | |||
Mauriciano (MFE) | |||
Mundang (MUA) | |||
Nahuatl (NAH) | |||
Navajo (NV) | |||
Xindonga (NG) | |||
Napolitano (NAP) | |||
Nepalês (NE) | |||
Nguemba (JGO) | |||
Niueano (NIU) | |||
Nogai (NOG) | |||
Ndebele do norte (ND) | |||
Língua lapônica setentrional (latino) (SME) | |||
Norueguês (NO) | |||
Nianja (NY) | |||
Nyankole (NYN) | |||
Nzima (NZI) | |||
Occitano (OC) | |||
Ojíbua (OJ) | |||
Oromo (OM) | |||
Ossético (OS) | |||
Pampanga (PAM) | |||
Pangasinano (PAG) | |||
Papiamento (PAP) | |||
Pashto (PS) | |||
Pedi (NSO) | |||
Persa (FA) | |||
Polonês (PL) | |||
Português (PT) | |||
Panjabi (árabe) (PA) | |||
Quechua (QU) | |||
Ripuriano (KSH) | |||
Romeno (RO) | |||
Romanche (RM) | |||
Rundi (RN) | |||
Russo (RU) | |||
Rwa (RWK) | |||
Sadri (devanagari) (SCK) | |||
Sakha (SAH) | |||
Samburu (SAQ) | |||
Samoano (latino) (SM) | |||
Sango (SG) | |||
Sangu (Gabão) | |||
Sânscrito (devanagari) (SA) | |||
Santali (devanagari) (SAT) | |||
Língua ânglica escocesa (SCO) | |||
Sena (SEH) | |||
Sérvio (cirílico) (SR-CYRL) | |||
Sérvio (latino) (SR, SR-LATN)) | |||
Shambala (KSB) | |||
Xona (SN) | |||
Siksika (BLA) | |||
Sirmauri (devanagari) (SRX) | |||
Língua lapônica escolta (SMS) | |||
Eslovaco (SK) | |||
Esloveno (SL) | |||
Soga (XOG) | |||
Somali (árabe) (SO) | |||
Somali (latino) (SO-LATN) | |||
Songai (SON) | |||
Andebele meridional (NR) | |||
Altai meridional (ALT) | |||
Sami meridional (SMA) | |||
Soto meridional (ST) | |||
Espanhol (ES) | |||
Sundanês (SU) | |||
Suaíli (latino) (SW) | |||
Suázi (SS) | |||
Sueco (SV) | |||
Tabassarão (TAB) | |||
Tachelhit (SHI) | |||
Taitiano (TY) | |||
Taita (DAV) | |||
Tajique (cirílico) (TG) | |||
Tâmil (TA) | |||
Tártaro (cirílico) (TT-CYRL) | |||
Tártaro (latino) (TT) | |||
Teso (TEO) | |||
Tétum (TET) | |||
Tailandês (TH) | |||
Thangmi (THF) | |||
Tok Pisin (TPI) | |||
Tonganês (TO) | |||
Tsonga (TS) | |||
Tsuana (TN) | |||
Turco (TR) | |||
Turcomeno (latino) (TK) | |||
Tuvano (TYV) | |||
Udmurte (UDM) | |||
Uigur (cirílico) (UG-CYRL) | |||
Ucraniano (UK) | |||
Alto sorábio (HSB) | |||
Urdu (UR) | |||
Uigur (árabe) (UG) | |||
Usbeque (árabe) (UZ-ARAB) | |||
Usbeque (cirílico) (UZ-CYRL) | |||
Usbeque (latino) (UZ) | |||
Vietnamita (VI) | |||
Volapuque (VO) | |||
Vunjo (VUN) | |||
Walser (WAE) | |||
Galês (CY) | |||
Frísio ocidental (FY) | |||
Uolofe (WO) | |||
Xossa (XH) | |||
Maya iucateque (YUA) | |||
Zapotec (ZAP) | |||
Zarma (DJE) | |||
Zhuang (ZA) | |||
Zulu (ZU) |
Alfabeto | UiPath Document OCR e UiPath Document OCR_CPU | |
---|---|---|
Árabe | 'ا','ب','ة','ت','ث','ج','ح','خ','د','ذ','ر','ز','س','ش','ص','ض','ط','ظ','ع','غ','ـ','ف','ق','ك','ل','م','ن','ه','و','ى','ي','ٓ','ٔ','ٕ','٠','١','٢','٣','٤','٥','٦','٧','٨','٩','٪','٫','٬','٭','ٱ','۔','ً','ٌ','ٍ','َ','ُ','ِ','ّ','ْ','ٰ','ۥ','ۦ','آ','،','؛','؟','ء','أ','ؤ','إ','ئ' | |
Hebraico | א ב ג ד ה ו ז ח ט י ך כ ל ם מ ן נ ס ע ף פ ץ צ ק ר ש ת ₪ | |
Latim | A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï Ñ Ò Ó Ô Õ Ö Ø Ù Ú Û Ü Ý ß à á â ã ä å æ ç è é ê ë ì í î ï ñ ò ó ô õ ö ø ù ú û ü ý Ā ā Ă ă Ą ą Ć ć Ċ ċ Č č Ď ď Đ đ Ē ē Ė ė Ę ę Ě ě Ğ ğ Ġ ġ Ħ ħ Ī ī Ĭ ĭ Į į İ ı Ĺ ĺ Ľ ľ Ł ł Ń ń Ň ň Ŋ ŋ Ō ō Ő ő Œ œ Ŕ ŕ Ř ř Ś ś Š š Ť ť Ŧ ŧ Ū ū Ŭ ŭ Ů ů Ų ų Ź ź Ż ż Ž ž Ə Ǵ ǵ Ș ș Ț ț ə μ | |
Outros caracteres | ! " # $ % & \ ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ [ \ \ ] ^ _ { | } ~ £ ¥ § © ® ° ¿ € ≤ ≥ |