document-understanding
2024.10
false
- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Detalhes do modelo
- Endpoints públicos
- 1040 – tipo de documento
- 1040 Agendamento C – tipo de documento
- 1040 Agendamento D – tipo de documento
- 1040 Agendamento E – tipo de documento
- 1040x – tipo de documento
- 3949a – tipo de documento
- 4506T – tipo de documento
- 709 – tipo de documento
- 941x – tipo de documento
- 9465 – tipo de documento
- ACORD125 – tipo de documento
- ACORD126 – tipo de documento
- ACORD131 – tipo de documento
- ACORD140 – tipo de documento
- ACORD25 – tipo de documento
- Extratos bancários – tipo de documento
- Conhecimentos de embarque – tipo de documento
- Certificado de incorporação – tipo de documento
- Certificado de origem – tipo de documento
- Verificações – tipo de documento
- Certificado de produto infantil – tipo de documento
- CMS 1500 – tipo de documento
- Declaração de conformidade UE – tipo de documento
- Demonstrações financeiras – tipo de documento
- FM1003 – tipo de documento
- I9 – tipo de documento
- Cartões de identificação – tipo de documento
- Faturas – tipo de documento
- Faturas2 - tipo de documento
- Faturas Austrália – tipo de documento
- Faturas China – tipo de documento
- Faturas hebraicas – tipo de documento
- Faturas Índia – tipo de documento
- Faturas Japão – tipo de documento
- Faturas de Envio – tipo de documento
- Listas de embalagem – tipo de documento
- Holerites – tipo de documento
- Passaportes – tipo de documento
- Ordens de compra – tipo de documento
- Recibos – tipo de documento.
- Recibos2 - tipo de documento
- Recibos Japão – tipo de documento
- Avisos de Remessa – tipo de documento
- UB04 – tipo de documento
- Divulgações de fechamentos de hipotecas dos EUA - tipo de documento
- Contas de serviços públicos – tipo de documento
- Títulos de veículos – tipo de documento
- W2 – tipo de documento
- W9 – tipo de documento
- Idiomas suportados
- Painéis de insights
- Document Understanding implantado no Automation Suite
- Geração de logs
- Lógica de licenciamento e carregamento
- Como fazer
- Solução de problemas
Importante :
A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Document Understanding modern projects user guide
Última atualização 6 de abr de 2026
OCR
Each OCR engine is tailored to deliver efficient and effective optical character recognition, regardless of your specific needs or deployment. This page provides information on the supported languages for UiPath® OCR engines:
- UiPath Document OCR: default UiPath OCR, which receives regular updates and improvements. You can use it on either GPU or CPU, delivering the same level of accuracy in both cases.
- UiPath Document OCR_CPU: specially optimized to run on CPU.
- UiPath Extended Languages OCR: capable of processing documents in over 200 languages, especially in Chinese, Korean, Vietnamese, Thai, major Indian languages, and languages that use the Cyrilic or Greek alphabets.
Dica:
Choosing the right OCR engine for your documents is simple. By default, use the UiPath Document OCR, which benefits from regular updates and improvements. If this doesn't support your document language or it's not performing as expected, switch to one of our other OCR engines, like the UiPath Extended Languages OCR.
Texto impresso
| Idioma (Código do idioma) | UiPath Document OCR e UiPath Document OCR_CPU | UiPath Extended Languages OCR | OCR para chinês, japonês e coreano |
|---|---|---|---|
| Adigue (ADY) | ✅ | ||
| Afar (AA) | ✅ | ||
| Afrikaans (AFR) | ✅ | ✅ | |
| Acã (AK) | ✅ | ||
| Albanês (SQI) | ✅ | ✅ | |
| Algonquino (ALQ) | ✅ | ||
| Angika (devanagari) (ANP) | ✅ | ||
| Árabe (ARA) | ✅ | ✅ | |
| Asturiano (AST) | ✅ | ✅ | |
| Asu (ASA) | ✅ | ||
| Ávaro (AV) | ✅ | ||
| Awadhi-Hindi (devanagari) (AWA) | ✅ | ||
| Aymara (AYM) | ✅ | ||
| Azerbaijano (latino) (AZ) | ✅ | ||
| Bafia (KSF) | ✅ | ||
| Bagheli (BFY) | ✅ | ||
| Bambara (BM) | ✅ | ||
| Basquir (BA) | ✅ | ||
| Basco (EU) | ✅ | ✅ | |
| Bielorrusso (cirílico) (BE, BE-CYRL) | ✅ | ||
| Bielorrusso (latino) (BE, BE-LATN) | ✅ | ||
| Bemba (BEM) | ✅ | ||
| Bena (BEZ) | ✅ | ||
| Bhojpuri-Hindi (devanagari) (BHO) | ✅ | ||
| Bicolano (BIK) | ✅ | ||
| Bislamá (BI) | ✅ | ✅ | |
| Bodo (devanagari) (BRX) | ✅ | ||
| Bósnio (latino) (BS) | ✅ | ||
| Brajbha (BRA) | ✅ | ||
| Bretão (BR) | ✅ | ||
| Búlgaro (BG) | ✅ | ||
| Bundeli (BNS) | ✅ | ||
| Buriate (cirílico) (BUA) | ✅ | ||
| Catalão (CA) | ✅ | ✅ | |
| Cebuano (CEB) | ✅ | ✅ | |
| Chamling (RAB) | ✅ | ||
| Chamorro (CH) | ✅ | ||
| Checheno (CE) | ✅ | ||
| Chhattisgarhi (devanagari) (HNE) | ✅ | ||
| Chiga (CGG) | ✅ | ||
| Chinês - Simplificado (ZH-Hans) | ✅ | ✅ | |
| Chinês - Tradicional (Hant) | ✅ | ✅ | |
| Choctaw (CHO) | ✅ | ||
| Chukoto (CKT) | ✅ | ||
| Chuvache (CV) | ✅ | ||
| Córnico (KW) | ✅ | ✅ | |
| Corso (CO) | ✅ | ||
| Cri (CR) | ✅ | ||
| Creek (MUS) | ✅ | ||
| Tártaro da Crimeia (latino) (CRH) | ✅ | ||
| Croata (HR) | ✅ | ✅ | |
| Crow (CRO) | ✅ | ||
| Tcheco (CS) | ✅ | ✅ | |
| Dinamarquês (DA) | ✅ | ✅ | |
| Dargínico (DAR) | ✅ | ||
| Dari (PRS) | ✅ | ||
| Dhimal (devanagari) (DHI) | ✅ | ||
| Dogri (devanagari) (DOI) | ✅ | ||
| Duala (DUA) | ✅ | ||
| Dungan (DNG) | ✅ | ||
| Holandês (NL) | ✅ | ✅ | |
| Efique (EFI) | ✅ | ||
| Inglês (EN) | ✅ | ✅ | |
| Erzia (cirílico) (MYV) | ✅ | ||
| Estoniano (ET) | ✅ | ✅ | |
| Faroês (FO) | ✅ | ||
| Fijiano (FJ) | ✅ | ✅ | |
| Filipino (FIL) | ✅ | ✅ | |
| Finlandês (FI) | ✅ | ✅ | |
| Fon (FON) | ✅ | ||
| Francês (FR) | ✅ | ✅ | ✅ |
| Friuliano (FUR) | ✅ | ✅ | |
| Ga (GAA) | ✅ | ||
| Gaélico - Irlandês (GA) | ✅ | ✅ | |
| Gaélico - Escocês (GD) | ✅ | ✅ | |
| Gagauz (latino) (GAG) | ✅ | ✅ | |
| Galego (GL) | ✅ | ✅ | |
| Ganda (LG) | ✅ | ||
| Gayo (GAY) | ✅ | ||
| Alemão (DE) | ✅ | ✅ | |
| Gilbertês (GIL) | ✅ | ✅ | |
| Gondi (devanagari) (GON) | ✅ | ||
| Grego (EL) | ✅ | ||
| Groenlandês (KL) | ✅ | ||
| Guarani (GN) | ✅ | ||
| Gurung (devanagari) | ✅ | ||
| Gusii (GUZ) | ✅ | ||
| Crioulo haitiano (HT) | ✅ | ✅ | |
| Halbi (devanagari) (HLB) | ✅ | ||
| Hani (HNI) | ✅ | ✅ | |
| Hariani (BGC) | ✅ | ||
| Havaiano (HAW) | ✅ | ||
| Hebraico (HE) | ✅ | ✅ | |
| Herero (HZ) | ✅ | ||
| Hiligaynon (HIL) | ✅ | ||
| Hindi (HI) | ✅ | ||
| Hmong Daw (latino) (MWW) | ✅ | ✅ | |
| Ho (devanagari) (HOC) | ✅ | ||
| Húngaro (HU) | ✅ | ✅ | |
| Iban (IBA) | ✅ | ||
| Islandês (IS) | ✅ | ||
| Igbo (IG) | ✅ | ||
| Iloko (ILO) | ✅ | ||
| Inari Sami (SMN) | ✅ | ||
| Indonésio (ID) | ✅ | ✅ | |
| Inguche (INH) | ✅ | ||
| Interlíngua (IA) | ✅ | ✅ | |
| Inuctitute (latino) (IU) | ✅ | ||
| Italiano (IT) | ✅ | ✅ | |
| Japonês (JA) | ✅ | ✅ | |
| Jaunsari (devanagari) (JNS) | ✅ | ||
| Javanês (JV) | ✅ | ✅ | |
| Jola-Fonyi (DYO) | ✅ | ||
| Cabardiano (KBD) | ✅ | ||
| Cabo-verdiano (KEA) | ✅ | ||
| Cachin (latino) (KAC) | ✅ | ✅ | |
| Calenjin (KLN) | ✅ | ||
| Calmuco (XAL) | ✅ | ||
| Kangri (devanagari) (XNR) | ✅ | ||
| Canuri (KR) | ✅ | ||
| Carachaio-bálcara (KRC) | ✅ | ||
| Caracalpaque (cirílico) (KAA-CYR) | ✅ | ||
| Caracalpaque (latino) (KAA) | ✅ | ||
| Cassúbio (CSB) | ✅ | ||
| Cazaque (cirílico) (KK-CYR) | ✅ | ||
| Cazaque (latino) (KK-LATN) | ✅ | ||
| Cacas (KJH) | ✅ | ||
| Khaling (KLR) | ✅ | ||
| Khasi (KHA) | ✅ | ✅ | |
| Quiché (QUC) | ✅ | ||
| Quicuio (KI) | ✅ | ||
| Língua lapônica de Quildim (SJD) | ✅ | ||
| Quiniaruanda (RW) | ✅ | ||
| Quomi (KV) | ✅ | ||
| Congo (KN) | ✅ | ||
| Coreano (KO) | ✅ | ✅ | |
| Korku (KFQ) | ✅ | ||
| Koriaque (KPY) | ✅ | ||
| Kosreano (KOS) | ✅ | ||
| Kpelle (KPE) | ✅ | ||
| Cuanhama (KJ) | ✅ | ||
| Cumique (cirílico) (KUM) | ✅ | ||
| Curdo (árabe) (KU-ARAB) | ✅ | ||
| Curdo (latino) (KU-LATN) | ✅ | ||
| Kurux (devanagari) (KRU) | ✅ | ||
| Quirguiz (cirílico) (KY) | ✅ | ||
| Lak (LBE) | ✅ | ||
| Lakota (LKT) | ✅ | ||
| Latim (LA) | ✅ | ✅ | |
| Letão (LV) | ✅ | ✅ | |
| Lezgui (LEX) | ✅ | ||
| Lingala (LN) | ✅ | ||
| Lituano (LT) | ✅ | ✅ | |
| Baixo sorábio (DSB) | ✅ | ||
| Lozi (LOZ) | ✅ | ||
| Língua lapônica de Lule (SMJ) | ✅ | ||
| Luo (Quênia e Tanzânia) (LUO) | ✅ | ||
| Luxemburguês (LB) | ✅ | ✅ | |
| Luia (LUY) | ✅ | ||
| Macedônio (MK) | ✅ | ||
| Machame (JMC) | ✅ | ||
| Madurês (MAD) | ✅ | ||
| Mahasu Pahari (devanagari) (BFZ) | ✅ | ||
| Makhuwa-Meetto (MGH) | ✅ | ||
| Maconde (KDE) | ✅ | ||
| Malgaxe (MG) | ✅ | ||
| Malaio (latino) (MS) | ✅ | ✅ | |
| Maltês (MT) | ✅ | ||
| Malto (devanagari) (KMJ) | ✅ | ||
| Mandinga (MNK) | ✅ | ||
| Manx (GV) | ✅ | ||
| Maori (MI) | ✅ | ||
| Mapundungu (ARN) | ✅ | ||
| Marata (MR) | ✅ | ||
| Mari (Rússia) (CHM) | ✅ | ||
| Masai (MAS) | ✅ | ||
| Mende (Serra Leoa) (MEN) | ✅ | ||
| Meru (MER) | ✅ | ||
| Meta' (MGO) | ✅ | ||
| Minangkabau (MIN) | ✅ | ||
| Mohawk (MOH) | ✅ | ||
| Mongol (cirílico) (MN) | ✅ | ||
| Mongondow (MOG) | ✅ | ||
| Montenegrino (cirílico) (CNR-CYRL) | ✅ | ||
| Montenegrino (latino) (CNR-LATN) | ✅ | ||
| Mauriciano (MFE) | ✅ | ||
| Mundang (MUA) | ✅ | ||
| Nahuatl (NAH) | ✅ | ||
| Navajo (NV) | ✅ | ||
| Xindonga (NG) | ✅ | ||
| Napolitano (NAP) | ✅ | ✅ | |
| Nepalês (NE) | ✅ | ||
| Nguemba (JGO) | ✅ | ||
| Niueano (NIU) | ✅ | ||
| Nogai (NOG) | ✅ | ||
| Ndebele do norte (ND) | ✅ | ||
| Língua lapônica setentrional (latino) (SME) | ✅ | ||
| Norueguês (NO) | ✅ | ✅ | |
| Nianja (NY) | ✅ | ||
| Nyankole (NYN) | ✅ | ||
| Nzima (NZI) | ✅ | ||
| Occitano (OC) | ✅ | ✅ | |
| Ojíbua (OJ) | ✅ | ||
| Oromo (OM) | ✅ | ||
| Ossético (OS) | ✅ | ||
| Pampanga (PAM) | ✅ | ||
| Pangasinano (PAG) | ✅ | ||
| Papiamento (PAP) | ✅ | ||
| Pashto (PS) | ✅ | ||
| Pedi (NSO) | ✅ | ||
| Persa (FA) | ✅ | ||
| Polonês (PL) | ✅ | ✅ | |
| Português (PT) | ✅ | ✅ | |
| Panjabi (árabe) (PA) | ✅ | ||
| Quechua (QU) | ✅ | ||
| Ripuriano (KSH) | ✅ | ✅ | |
| Romeno (RO) | ✅ | ✅ | |
| Romanche (RM) | ✅ | ✅ | |
| Rundi (RN) | ✅ | ||
| Russo (RU) | ✅ | ||
| Rwa (RWK) | ✅ | ||
| Sadri (devanagari) (SCK) | ✅ | ||
| Sakha (SAH) | ✅ | ||
| Samburu (SAQ) | ✅ | ||
| Samoano (latino) (SM) | ✅ | ||
| Sango (SG) | ✅ | ||
| Sangu (Gabão) | ✅ | ||
| Sânscrito (devanagari) (SA) | ✅ | ||
| Santali (devanagari) (SAT) | ✅ | ||
| Língua ânglica escocesa (SCO) | ✅ | ||
| Sena (SEH) | ✅ | ||
| Sérvio (cirílico) (SR-CYRL) | ✅ | ||
| Sérvio (latino) (SR, SR-LATN)) | ✅ | ✅ | |
| Shambala (KSB) | ✅ | ||
| Xona (SN) | ✅ | ||
| Siksika (BLA) | ✅ | ||
| Sirmauri (devanagari) (SRX) | ✅ | ||
| Língua lapônica escolta (SMS) | ✅ | ||
| Eslovaco (SK) | ✅ | ✅ | |
| Esloveno (SL) | ✅ | ✅ | |
| Soga (XOG) | ✅ | ||
| Somali (árabe) (SO) | ✅ | ||
| Somali (latino) (SO-LATN) | ✅ | ||
| Songai (SON) | ✅ | ||
| Andebele meridional (NR) | ✅ | ||
| Altai meridional (ALT) | ✅ | ||
| Sami meridional (SMA) | ✅ | ||
| Soto meridional (ST) | ✅ | ||
| Espanhol (ES) | ✅ | ✅ | |
| Sundanês (SU) | ✅ | ||
| Suaíli (latino) (SW) | ✅ | ✅ | |
| Suázi (SS) | ✅ | ||
| Sueco (SV) | ✅ | ✅ | |
| Tabassarão (TAB) | ✅ | ||
| Tachelhit (SHI) | ✅ | ||
| Taitiano (TY) | ✅ | ||
| Taita (DAV) | ✅ | ||
| Tajique (cirílico) (TG) | ✅ | ||
| Tâmil (TA) | ✅ | ||
| Tártaro (cirílico) (TT-CYRL) | ✅ | ||
| Tártaro (latino) (TT) | ✅ | ||
| Teso (TEO) | ✅ | ||
| Tétum (TET) | ✅ | ✅ | |
| Tailandês (TH) | ✅ | ✅ | |
| Thangmi (THF) | ✅ | ||
| Tok Pisin (TPI) | ✅ | ||
| Tonganês (TO) | ✅ | ✅ | |
| Tsonga (TS) | ✅ | ||
| Tsuana (TN) | ✅ | ||
| Turco (TR) | ✅ | ✅ | |
| Turcomeno (latino) (TK) | ✅ | ||
| Tuvano (TYV) | ✅ | ||
| Udmurte (UDM) | ✅ | ||
| Uigur (cirílico) (UG-CYRL) | ✅ | ||
| Ucraniano (UK) | ✅ | ||
| Alto sorábio (HSB) | ✅ | ||
| Urdu (UR) | ✅ | ||
| Uigur (árabe) (UG) | ✅ | ||
| Usbeque (árabe) (UZ-ARAB) | ✅ | ||
| Usbeque (cirílico) (UZ-CYRL) | ✅ | ||
| Usbeque (latino) (UZ) | ✅ | ✅ | |
| Vietnamita (VI) | ✅ | ✅ | |
| Volapuque (VO) | ✅ | ✅ | |
| Vunjo (VUN) | ✅ | ||
| Walser (WAE) | ✅ | ||
| Galês (CY) | ✅ | ✅ | |
| Frísio ocidental (FY) | ✅ | ||
| Uolofe (WO) | ✅ | ||
| Xossa (XH) | ✅ | ||
| Maya iucateque (YUA) | ✅ | ||
| Zapotec (ZAP) | ✅ | ||
| Zarma (DJE) | ✅ | ||
| Zhuang (ZA) | ✅ | ||
| Zulu (ZU) | ✅ | ✅ |
Texto manuscrito
| Idioma (Código do idioma) | UiPath Document OCR | UiPath Extended Languages OCR |
|---|---|---|
| Chinês simplificado (ZH-HANS) | ✅ | |
| Inglês (EN) | ✅ | ✅ |
| Francês (FR) | ✅ | ✅ |
| Alemão (DE) | ✅ | ✅ |
| Italiano (IT) | ✅ | |
| Japonês (JA) | ✅ | |
| Coreano (KO) | ✅ | |
| Português (PT) | ✅ | |
| Espanhol (ES) | ✅ |
Caracteres compatíveis
| Alfabeto | UiPath Document OCR | |
|---|---|---|
| Hebraico | א ב ג ד ה ו ז ח ט י ך כ ל ם מ ן נ ס ע ף פ ץ צ ק ר ש ת ₪ | |
| Latim | A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï Ñ Ò Ó Ô Õ Ö Ø Ù Ú Û Ü Ý ß à á â ã ä å æ ç è é ê ë ì í î ï ñ ò ó ô õ ö ø ù ú û ü ý Ā ā Ă ă Ą ą Ć ć Ċ ċ Č č Ď ď Đ đ Ē ē Ė ė Ę ę Ě ě Ğ ğ Ġ ġ Ħ ħ Ī ī Ĭ ĭ Į į İ ı Ĺ ĺ Ľ ľ Ł ł Ń ń Ň ň Ŋ ŋ Ō ō Ő ő Œ œ Ŕ ŕ Ř ř Ś ś Š š Ť ť Ŧ ŧ Ū ū Ŭ ŭ Ů ů Ų ų Ź ź Ż ż Ž ž Ə Ǵ ǵ Ș ș Ț ț ə μ | |
| Outros caracteres | ! " # $ % & \ ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ [ \ \ ] ^ _ { | } ~ £ ¥ § © ® ° ¿ € ≤ ≥ | |
OCR de parceiro da UiPath®
Para saber os idiomas compatíveis com OCR de parceiros da UiPath®, consulte suas páginas dedicadas: