document-understanding
2024.10
true
- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- 990 - Pacote de ML - Prévia
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Passaportes - Pacote de ML
- Contracheques — Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos – Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Requisitos de Hardware
- Pipelines
- Document Manager
- Serviços de OCR
- Idiomas suportados
- Aprendizagem profunda
- Painéis de insights
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Licenciamento
- Atividades
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Importante :
A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Guia do usuário do Document Understanding.
Última atualização 22 de out de 2025
Cada mecanismo de OCR é personalizado para proporcionar um reconhecimento óptico de caracteres eficiente e eficaz, independentemente de suas necessidades ou implantação específica. Esta página fornece informações sobre os idiomas compatíveis com mecanismos UiPath® OCR:
- UiPath Document OCR: OCR padrão do UiPath, que recebe atualizações e melhorias regulares. Você pode usá-lo na GPU ou CPU, proporcionando o mesmo nível de precisão em ambos os casos.
- UiPath Document OCR_CPU: especialmente otimizado para ser executado na CPU.
- UiPath Extended Languages OCR: capaz de processar documentos em mais de 200 idiomas, especialmente em chinês, coreano, vietnamita, tailandês, principais idiomas indianos e idiomas que usam os alfabetos cirílico ou grego.
Dica: a escolha do mecanismo de OCR certo para seus documentos é simples. Por padrão, use o UiPath Document OCR, que se beneficia de atualizações e melhorias regulares. Se ele não for compatível com o idioma de seus documentos ou não estiver funcionando conforme o esperado, mude para um dos nossos outros mecanismos de OCR, como o UiPath Extended Languages OCR.
| Idioma (Código do idioma) | UiPath Document OCR e UiPath Document OCR_CPU | UiPath Extended Languages OCR | OCR para chinês, japonês e coreano |
|---|---|---|---|
| Adigue (ADY) | |||
| Afar (AA) | |||
| Afrikaans (AFR) | |||
| Acã (AK) | |||
| Albanês (SQI) | |||
| Algonquino (ALQ) | |||
| Angika (devanagari) (ANP) | |||
| Árabe (ARA) | |||
| Asturiano (AST) | |||
| Asu (ASA) | |||
| Ávaro (AV) | |||
| Awadhi-Hindi (devanagari) (AWA) | |||
| Aymara (AYM) | |||
| Azerbaijano (latino) (AZ) | |||
| Bafia (KSF) | |||
| Bagheli (BFY) | |||
| Bambara (BM) | |||
| Basquir (BA) | |||
| Basco (EU) | |||
| Bielorrusso (cirílico) (BE, BE-CYRL) | |||
| Bielorrusso (latino) (BE, BE-LATN) | |||
| Bemba (BEM) | |||
| Bena (BEZ) | |||
| Bhojpuri-Hindi (devanagari) (BHO) | |||
| Bicolano (BIK) | |||
| Bislamá (BI) | |||
| Bodo (devanagari) (BRX) | |||
| Bósnio (latino) (BS) | |||
| Brajbha (BRA) | |||
| Bretão (BR) | |||
| Búlgaro (BG) | |||
| Bundeli (BNS) | |||
| Buriate (cirílico) (BUA) | |||
| Catalão (CA) | |||
| Cebuano (CEB) | |||
| Chamling (RAB) | |||
| Chamorro (CH) | |||
| Checheno (CE) | |||
| Chhattisgarhi (devanagari) (HNE) | |||
| Chiga (CGG) | |||
| Chinês - Simplificado (ZH-Hans) | |||
| Chinês - Tradicional (Hant) | |||
| Choctaw (CHO) | |||
| Chukoto (CKT) | |||
| Chuvache (CV) | |||
| Córnico (KW) | |||
| Corso (CO) | |||
| Cri (CR) | |||
| Creek (MUS) | |||
| Tártaro da Crimeia (latino) (CRH) | |||
| Croata (HR) | |||
| Crow (CRO) | |||
| Tcheco (CS) | |||
| Dinamarquês (DA) | |||
| Dargínico (DAR) | |||
| Dari (PRS) | |||
| Dhimal (devanagari) (DHI) | |||
| Dogri (devanagari) (DOI) | |||
| Duala (DUA) | |||
| Dungan (DNG) | |||
| Holandês (NL) | |||
| Efique (EFI) | |||
| Inglês (EN) | |||
| Erzia (cirílico) (MYV) | |||
| Estoniano (ET) | |||
| Faroês (FO) | |||
| Fijiano (FJ) | |||
| Filipino (FIL) | |||
| Finlandês (FI) | |||
| Fon (FON) | |||
| Francês (FR) | |||
| Friuliano (FUR) | |||
| Ga (GAA) | |||
| Gaélico - Irlandês (GA) | |||
| Gaélico - Escocês (GD) | |||
| Gagauz (latino) (GAG) | |||
| Galego (GL) | |||
| Ganda (LG) | |||
| Gayo (GAY) | |||
| Alemão (DE) | |||
| Gilbertês (GIL) | |||
| Gondi (devanagari) (GON) | |||
| Grego (EL) | |||
| Groenlandês (KL) | |||
| Guarani (GN) | |||
| Gurung (devanagari) | |||
| Gusii (GUZ) | |||
| Crioulo haitiano (HT) | |||
| Halbi (devanagari) (HLB) | |||
| Hani (HNI) | |||
| Hariani (BGC) | |||
| Havaiano (HAW) | |||
| Hebraico (HE) | |||
| Herero (HZ) | |||
| Hiligaynon (HIL) | |||
| Hindi (HI) | |||
| Hmong Daw (latino) (MWW) | |||
| Ho (devanagari) (HOC) | |||
| Húngaro (HU) | |||
| Iban (IBA) | |||
| Islandês (IS) | |||
| Igbo (IG) | |||
| Iloko (ILO) | |||
| Inari Sami (SMN) | |||
| Indonésio (ID) | |||
| Inguche (INH) | |||
| Interlíngua (IA) | |||
| Inuctitute (latino) (IU) | |||
| Italiano (IT) | |||
| Japonês (JA) | |||
| Jaunsari (devanagari) (JNS) | |||
| Javanês (JV) | |||
| Jola-Fonyi (DYO) | |||
| Cabardiano (KBD) | |||
| Cabo-verdiano (KEA) | |||
| Cachin (latino) (KAC) | |||
| Calenjin (KLN) | |||
| Calmuco (XAL) | |||
| Kangri (devanagari) (XNR) | |||
| Canuri (KR) | |||
| Carachaio-bálcara (KRC) | |||
| Caracalpaque (cirílico) (KAA-CYR) | |||
| Caracalpaque (latino) (KAA) | |||
| Cassúbio (CSB) | |||
| Cazaque (cirílico) (KK-CYR) | |||
| Cazaque (latino) (KK-LATN) | |||
| Cacas (KJH) | |||
| Khaling (KLR) | |||
| Khasi (KHA) | |||
| Quiché (QUC) | |||
| Quicuio (KI) | |||
| Língua lapônica de Quildim (SJD) | |||
| Quiniaruanda (RW) | |||
| Quomi (KV) | |||
| Congo (KN) | |||
| Coreano (KO) | |||
| Korku (KFQ) | |||
| Koriaque (KPY) | |||
| Kosreano (KOS) | |||
| Kpelle (KPE) | |||
| Cuanhama (KJ) | |||
| Cumique (cirílico) (KUM) | |||
| Curdo (árabe) (KU-ARAB) | |||
| Curdo (latino) (KU-LATN) | |||
| Kurux (devanagari) (KRU) | |||
| Quirguiz (cirílico) (KY) | |||
| Lak (LBE) | |||
| Lakota (LKT) | |||
| Latim (LA) | |||
| Letão (LV) | |||
| Lezgui (LEX) | |||
| Lingala (LN) | |||
| Lituano (LT) | |||
| Baixo sorábio (DSB) | |||
| Lozi (LOZ) | |||
| Língua lapônica de Lule (SMJ) | |||
| Luo (Quênia e Tanzânia) (LUO) | |||
| Luxemburguês (LB) | |||
| Luia (LUY) | |||
| Macedônio (MK) | |||
| Machame (JMC) | |||
| Madurês (MAD) | |||
| Mahasu Pahari (devanagari) (BFZ) | |||
| Makhuwa-Meetto (MGH) | |||
| Maconde (KDE) | |||
| Malgaxe (MG) | |||
| Malaio (latino) (MS) | |||
| Maltês (MT) | |||
| Malto (devanagari) (KMJ) | |||
| Mandinga (MNK) | |||
| Manx (GV) | |||
| Maori (MI) | |||
| Mapundungu (ARN) | |||
| Marata (MR) | |||
| Mari (Rússia) (CHM) | |||
| Masai (MAS) | |||
| Mende (Serra Leoa) (MEN) | |||
| Meru (MER) | |||
| Meta' (MGO) | |||
| Minangkabau (MIN) | |||
| Mohawk (MOH) | |||
| Mongol (cirílico) (MN) | |||
| Mongondow (MOG) | |||
| Montenegrino (cirílico) (CNR-CYRL) | |||
| Montenegrino (latino) (CNR-LATN) | |||
| Mauriciano (MFE) | |||
| Mundang (MUA) | |||
| Nahuatl (NAH) | |||
| Navajo (NV) | |||
| Xindonga (NG) | |||
| Napolitano (NAP) | |||
| Nepalês (NE) | |||
| Nguemba (JGO) | |||
| Niueano (NIU) | |||
| Nogai (NOG) | |||
| Ndebele do norte (ND) | |||
| Língua lapônica setentrional (latino) (SME) | |||
| Norueguês (NO) | |||
| Nianja (NY) | |||
| Nyankole (NYN) | |||
| Nzima (NZI) | |||
| Occitano (OC) | |||
| Ojíbua (OJ) | |||
| Oromo (OM) | |||
| Ossético (OS) | |||
| Pampanga (PAM) | |||
| Pangasinano (PAG) | |||
| Papiamento (PAP) | |||
| Pashto (PS) | |||
| Pedi (NSO) | |||
| Persa (FA) | |||
| Polonês (PL) | |||
| Português (PT) | |||
| Panjabi (árabe) (PA) | |||
| Quechua (QU) | |||
| Ripuriano (KSH) | |||
| Romeno (RO) | |||
| Romanche (RM) | |||
| Rundi (RN) | |||
| Russo (RU) | |||
| Rwa (RWK) | |||
| Sadri (devanagari) (SCK) | |||
| Sakha (SAH) | |||
| Samburu (SAQ) | |||
| Samoano (latino) (SM) | |||
| Sango (SG) | |||
| Sangu (Gabão) | |||
| Sânscrito (devanagari) (SA) | |||
| Santali (devanagari) (SAT) | |||
| Língua ânglica escocesa (SCO) | |||
| Sena (SEH) | |||
| Sérvio (cirílico) (SR-CYRL) | |||
| Sérvio (latino) (SR, SR-LATN)) | |||
| Shambala (KSB) | |||
| Xona (SN) | |||
| Siksika (BLA) | |||
| Sirmauri (devanagari) (SRX) | |||
| Língua lapônica escolta (SMS) | |||
| Eslovaco (SK) | |||
| Esloveno (SL) | |||
| Soga (XOG) | |||
| Somali (árabe) (SO) | |||
| Somali (latino) (SO-LATN) | |||
| Songai (SON) | |||
| Andebele meridional (NR) | |||
| Altai meridional (ALT) | |||
| Sami meridional (SMA) | |||
| Soto meridional (ST) | |||
| Espanhol (ES) | |||
| Sundanês (SU) | |||
| Suaíli (latino) (SW) | |||
| Suázi (SS) | |||
| Sueco (SV) | |||
| Tabassarão (TAB) | |||
| Tachelhit (SHI) | |||
| Taitiano (TY) | |||
| Taita (DAV) | |||
| Tajique (cirílico) (TG) | |||
| Tâmil (TA) | |||
| Tártaro (cirílico) (TT-CYRL) | |||
| Tártaro (latino) (TT) | |||
| Teso (TEO) | |||
| Tétum (TET) | |||
| Tailandês (TH) | |||
| Thangmi (THF) | |||
| Tok Pisin (TPI) | |||
| Tonganês (TO) | |||
| Tsonga (TS) | |||
| Tsuana (TN) | |||
| Turco (TR) | |||
| Turcomeno (latino) (TK) | |||
| Tuvano (TYV) | |||
| Udmurte (UDM) | |||
| Uigur (cirílico) (UG-CYRL) | |||
| Ucraniano (UK) | |||
| Alto sorábio (HSB) | |||
| Urdu (UR) | |||
| Uigur (árabe) (UG) | |||
| Usbeque (árabe) (UZ-ARAB) | |||
| Usbeque (cirílico) (UZ-CYRL) | |||
| Usbeque (latino) (UZ) | |||
| Vietnamita (VI) | |||
| Volapuque (VO) | |||
| Vunjo (VUN) | |||
| Walser (WAE) | |||
| Galês (CY) | |||
| Frísio ocidental (FY) | |||
| Uolofe (WO) | |||
| Xossa (XH) | |||
| Maya iucateque (YUA) | |||
| Zapotec (ZAP) | |||
| Zarma (DJE) | |||
| Zhuang (ZA) | |||
| Zulu (ZU) |
| Caracteres arábicos | 'ا','ب','ة','ت','ث','ج','ح','خ','د','ذ','ر','ز','س','ش','ص','ض','ط','ظ','ع','غ','ـ','ف','ق','ك','ل','م','ن','ه','و','ى','ي','ٓ','ٔ','ٕ','٠','١','٢','٣','٤','٥','٦','٧','٨','٩','٪','٫','٬','٭','ٱ','۔','ً','ٌ','ٍ','َ','ُ','ِ','ّ','ْ','ٰ','ۥ','ۦ','آ','،','؛','؟','ء','أ','ؤ','إ','ئ' |
|---|---|
| Caracteres de OCR compatíveis | ! " # $ % & \ ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ \ ] ^ _ a b c d e f g h i j k l m n o p q r s t u v w x y z { | } ~ £ ¥ § © ® ° ¿ À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï Ñ Ò Ó Ô Õ Ö Ø Ù Ú Û Ü Ý ß à á â ã ä å æ ç è é ê ë ì í î ï ñ ò ó ô õ ö ø ù ú û ü ý Ā ā Ă ă Ą ą Ć ć Ċ ċ Č č Ď ď Đ đ Ē ē Ė ė Ę ę Ě ě Ğ ğ Ġ ġ Ħ ħ Ī ī Ĭ ĭ Į į İ ı Ĺ ĺ Ľ ľ Ł ł Ń ń Ň ň Ŋ ŋ Ō ō Ő ő Œ œ Ŕ ŕ Ř ř Ś ś Š š Ť ť Ŧ ŧ Ū ū Ŭ ŭ Ů ů Ų ų Ź ź Ż ż Ž ž Ə Ǵ ǵ Ș ș Ț ț ə μ א ב ג ד ה ו ז ח ט י ך כ ל ם מ ן נ ס ע ף פ ץ צ ק ר ש ת ₪ € ≤ ≥ |