document-understanding
latest
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

上次更新日期 2025年8月21日

OCR

每个 OCR 引擎都经过定制,无论您的特定需求或部署如何,都可提供高效且有效的光学字符识别。本页提供有关 UiPath™ OCR 引擎支持的语言的信息:
  • UiPath Document OCR: default UiPath OCR, which receives regular updates and improvements. You can use it on either GPU or CPU, delivering the same level of accuracy in both cases.
  • UiPath Document OCR_CPU: specially optimized to run on CPU.
  • UiPath Extended Languages OCR: capable of processing documents in over 200 languages, especially in Chinese, Korean, Vietnamese, Thai, major Indian languages, and languages that use the Cyrilic or Greek alphabets.
  • Chinese, Japanese, Korean OCR: available as an endpoint and only for CPU deployments.
提示:为您的文档选择合适的 OCR 引擎非常简单。默认情况下,使用 UiPath 文档 OCR,该引擎会定期更新和改进。如果此 OCR 引擎不支持您的文档语言或其性能不及预期,请改用我们的其他 OCR 引擎,例如 UiPath 扩展语言 OCR

打印文本

语言(语言代码)UiPath 文档 OCR 和 UiPath 文档 OCR_CPUUiPath 扩展语言 OCR中文、日语、韩语 OCR
阿迪格语 (ADY) 是 
阿法尔语 (AA) 是 
南非荷兰语 (AFR)是是 
阿寒语 (AK) 是 
阿尔巴尼亚语 (SQA)是是 
阿冈昆语 (ALQ) 是 
昂加语(天城文)(ANP) 是 
阿拉伯语 (ARA)是 (Preview)是 
阿斯图里亚斯语 (AST)是是 
阿苏语 (ASA) 是 
阿瓦尔语 (AV) 是 
阿瓦迪-印地语(天城文)(AWA) 是 
艾马拉语 (AYM) 是 
阿塞拜疆语(拉丁文)(AZ) 是 
巴菲亚语 (KSF) 是 
巴哥里语 (BFY) 是 
班巴拉语 (BM) 是 
巴什基尔语 (BA) 是 
巴斯克语 (EU)是是 
白俄罗斯语(西里尔文)(BE、BE-CYRL) 是 
白俄罗斯语(拉丁文)(BE、BE-LATN) 是 
本巴语 (BEM) 是 
贝纳语 (BEZ) 是 
博杰普尔语-印地语(天城文)(BHO) 是 
比科尔语 (BIK) 是 
比斯拉马语 (BI)是是 
博多语(天城文)(BTX) 是 
波斯尼亚语(拉丁文)(BS) 是 
布拉巴语 (BRA) 是 
布列塔尼语 (BR) 是 
保加利亚语 (BG) 是 
邦德利语 (BNS) 是 
布里亚特语(西里尔文)(BUA) 是 
加泰罗尼亚语 (CA)是是 
宿务语 (CEB)是是 
查姆灵语 (RAB) 是 
查莫罗语 (CH) 是 
车臣语 (CE) 是 
切蒂斯格尔语(天城文)(HNE) 是 
奇加语 (CGG) 是 
中文 - 简体 (ZH-Hans) 是是
中文 - 繁体 (Hant) 是是
乔克托语 (CHO) 是 
楚科特语 (CKT) 是 
楚瓦什语 (CV) 是 
康沃尔语 (KW)available是 
科西嘉语 (CO) 是 
克里语 (CR) 是 
克里克语 (MUS) 是 
克里米亚鞑靼语(拉丁文)(CRH) 是 
克罗地亚语 (HR)是是 
克罗语 (CRO) 是 
捷克语 (CS)是是 
丹麦语 (DA)available是 
达尔格瓦语 (DAR) 是 
达里语 (PRS) 是 
狄摩语(天城文)(DHI) 是 
多格里语(梵文)(DOI) 是 
杜阿拉语 (DUA) 是 
东干语 (DNG) 是 
荷兰语 (NL)是是 
埃菲克语 (EFI) 是 
英语 (EN)是是 
埃尔齐亚语(西里尔文)(MYV) 是 
爱沙尼亚语 (ET)是是 
法罗语 (FO) 是 
斐济语 (FJ)是是 
菲律宾语 (FIL)是是 
芬兰语 (FI)是是 
丰语 (FON) 是 
法语 (FR)是是是
弗留利语 (FUR)是是 
Ga 语 (GAA) 是 
盖尔语 - 爱尔兰语 (GA)是是 
盖尔语 - 苏格兰语 (GD)是是 
加告兹语(拉丁文)(GAG)是是 
加利西亚 (GL)是是 
干达语 (LG) 是 
加约语 (GAY) 是 
德语 (DE)是是 
吉尔伯特语 (GIL)是是 
博多语(天成文)(GON) 是 
希腊语 (EL) 是 
格陵兰语 (KL) 是 
瓜拉尼 (GN) 是 
古隆语(天城文) 是 
古西语 (GUZ) 是 
海地克里奥尔语 (HT)是是 
哈尔比语(天城文)(HLB) 是 
哈尼语 (HNI)是是 
哈里亚纳语 (BGC) 是 
夏威夷语 (HAW) 是 
希伯来语 (HE)是是 
赫雷罗语 (HZ) 是 
希利盖农语 (HIL) 是 
印地语 (HI) 是 
白苗语(拉丁语)(MWW)是是 
Ho(梵文)(HOC) 是 
匈牙利语 (HU)是是 
伊班语 (IBA) 是 
冰岛语 (IS) 是 
伊博语 (IG) 是 
伊洛卡诺语 (ILO) 是 
伊纳里萨米语 (SMN) 是 
印度尼西亚语 (ID)是是 
印古什语 (INH) 是 
国际语 (IA)是是 
因纽特语(拉丁文)(IU) 是 
意大利语 (IT)是是 
日语 (JA) 是是
贾温萨里语(天城文)(JNS) 是 
爪哇语 (JV)是是 
朱拉-方伊语 (DYO) 是 
卡巴尔达语 (KBD) 是 
葡萄牙语克里奥尔语 (KEA) 是 
克钦语(拉丁文)(KAC)是是 
卡伦金语 (KLN) 是 
卡尔梅克语 (XAL) 是 
多格里语(梵文)(XNR) 是 
卡努里语 (KR) 是 
卡拉恰伊-巴尔卡尔语 (KRC) 是 
卡拉-卡尔帕克语(西里尔文)(KAA-CYR) 是 
卡拉-卡尔帕克语(拉丁文)(KAA) 是 
卡舒比语 (CSB) 是 
哈萨克语(西里尔文)(KK-CYR) 是 
哈萨克语(拉丁文)(KK-LATN) 是 
哈卡斯语 (KJH) 是 
卡林语 (KLR) 是 
卡西语 (KHA)是是 
基切语 (QUC) 是 
基库尤语 (KI) 是 
基尔丁萨米语 (SJD) 是 
卢旺达语 (RW) 是 
科米语 (KV) 是 
刚果语 (KN) 是 
韩语 (KO) 是是
科尔库语 (KFQ) 是 
科里亚克语 (KPY) 是 
科斯雷语 (KOS) 是 
克佩勒语 (KPE) 是 
宽亚玛语 (KJ) 是 
库梅克语(西里尔文)(KUM) 是 
库尔德语(阿拉伯文)(KU-ARAB) 是 
库尔德语(拉丁文)(KU-LATN) 是 
库鲁克语(天城文)(KRU) 是 
吉尔吉斯语(西里尔文)(KY) 是 
老挝语 (LBE) 是 
拉科塔语 (LKT) 是 
拉丁语 (LA)是是 
拉脱维亚语 (LV)是是 
列兹金语 (LEX) 是 
林加拉语 (LN) 是 
立陶宛语 (LT)是是 
下索布语 (DSB) 是 
洛兹语 (LOZ) 是 
吕勒萨米语 (SMJ) 是 
卢奥语(肯尼亚和坦桑尼亚)(LUO) 是 
卢森堡语 (LB)是是 
卢希亚语 (LUY) 是 
马其顿语 (MK) 是 
马切姆语 (JMC) 是 
马都拉语 (MAD) 是 
玛哈苏帕哈里语(天城文)(AFZ) 是 
马夸-梅托语 (MGH) 是 
马孔德语 (KDE) 是 
马达加斯加语 (MG) 是 
马来语(拉丁文)(MS)是是 
马耳他语 (MT) 是 
马尔托语(天城文)(KMJ) 是 
曼丁哥语 (MMK) 是 
马恩岛语 (GV) 是 
毛利语 (MI) 是 
马普切语 (ARN) 是 
马拉地语 (MR) 是 
马里(俄罗斯)(CHM) 是 
马赛语 (MAS) 是 
门德(塞拉利昂)(MEN) 是 
梅鲁语 (MER) 是 
梅塔语 (MGO) 是 
米南加保语 (MIN) 是 
莫霍克语 (MOH) 是 
蒙古语(西里尔文)(MN) 是 
蒙贡多语 (MOG) 是 
黑山语(西里尔文)(CNR-CYRL) 是 
黑山语(拉丁文)(CNR-LATN) 是 
毛里求斯克里奥尔语 (MFE) 是 
蒙当语 (MUA) 是 
纳瓦特尔语 (NAH) 是 
纳瓦霍语 (NV) 是 
恩敦加语 (NG) 是 
那不勒斯语 (NAP)是是 
尼泊尔语 (NE) 是 
恩贡巴语 (JGO) 是 
纽埃语 (NIU) 是 
诺盖语 (NOG) 是 
北恩德贝莱 (ND) 是 
北萨米语(拉丁文)(SME) 是 
挪威语 (NO)是是 
尼扬贾语 (NY) 是 
尼扬科勒语 (NYN) 是 
恩齐马语 (NZI) 是 
奥克西坦语 (OC)是是 
奥吉布瓦语 (OJ) 是 
奥罗莫语 (OM) 是 
奥塞蒂克语 (OS) 是 
邦板牙语 (PAM) 是 
邦阿西南语 (PAG) 是 
帕皮亚门托语 (PAP) 是 
普什图语 (PS) 是 
佩迪语 (NSO) 是 
波斯语 (FA) 是 
波兰语 (PL)是是 
葡萄牙语 (PT)是是 
旁遮普语(阿拉伯文)(PA) 是 
克丘亚语 (QU) 是 
里普里安语 (KSH)是是 
罗马尼亚语 (RO)是是 
罗曼什语 (RM)是是 
伦迪语 (RN) 是 
俄语 (RU) 是 
罗瓦语 (RWK) 是 
萨德里语(天城文)(SCK) 是 
萨哈语 (SAH) 是 
桑布鲁语 (SAQ) 是 
萨摩亚语(拉丁文)(SM) 是 
桑戈语 (SG) 是 
桑古语(加蓬) 是 
梵语(天城文)(SA) 是 
桑塔利语(天城文)(SAT) 是 
苏格兰语 (SCO) 是 
塞纳语 (SEH) 是 
塞尔维亚语(西里尔文)(SR-CYRL) 是 
塞尔维亚语(拉丁文)(SR、SR-LATN)是是 
香巴拉语 (KSB) 是 
修纳语 (SN) 是 
西克西卡语 (BLA) 是 
Sirimauri 语(天城文)(SRX) 是 
斯科尔特萨米语 (SMS) 是 
斯洛伐克语 (SK)是是 
斯洛文尼亚语 (SL)是是 
索加语 (XOG) 是 
索马里语(阿拉伯文)(SO) 是 
索马里语(拉丁文)(SO-LATN) 是 
桑海语 (SON) 是 
南恩德贝莱语 (NR) 是 
南阿尔泰语 (ALT) 是 
南萨米语 (SMA) 是 
南索托语 (ST) 是 
西班牙语 (ES)是是 
巽他语 (SU) 是 
斯瓦希里语(拉丁文)(SW)是是 
斯瓦蒂语 (SS) 是 
瑞典语 (SV)是是 
塔巴沙兰语 (TAB) 是 
塔切尔希特语 (SHI) 是 
塔希提语 (TY) 是 
泰塔语 (DAV) 是 
塔吉克语(西里尔文)(TG) 是 
泰米尔语 (TA) 是 
塔塔尔语(西里尔文)(TT-CYRL) 是 
鞑靼语(拉丁文)(TT) 是 
特索语 (TEO) 是 
德顿语 (TET)是是 
泰语 (TH) 是是
唐密语 (THF) 是 
托克皮辛语 (TPI) 是 
汤加语 (TO)是是 
特松加语 (TS) 是 
茨瓦纳语 (TN) 是 
土耳其语 (TR)是是 
土库曼语(拉丁文)(TK) 是 
图瓦语 (TYV) 是 
乌德穆尔特语 (UDM) 是 
维吾尔语(西里尔文)(UG-CYRL) 是 
乌克兰语 (UK) 是 
高索布语 (HSB) 是 
乌尔都语 (UR) 是 
维吾尔语(阿拉伯文)(UG) 是 
乌兹别克语(阿拉伯文)(UZ-ARAB) 是 
乌兹别克语(西里尔文)(UZ-CYRL) 是 
乌兹别克语(拉丁文)(UZ)是是 
越南语 (VI) 是是
沃拉普克语 (VO)是是 
文约语 (VUN) 是 
瓦尔瑟语 (WAE) 是 
威尔士语 (CY)是是 
西弗里西亚语 (FY) 是 
沃洛夫语 (WO) 是 
科萨语 (XH) 是 
尤卡坦玛雅语 (YUA) 是 
萨巴特克语 (ZAP) 是 
扎尔马语 (DJE) 是 
壮语 (ZA) 是 
祖鲁语 (ZU)是是 

手写文本

语言(语言代码)UiPath 文档 OCRUiPath 扩展语言 OCR
简体中文 (ZH-HANS) 是
英语 (EN)是是
法语 (FR)是是
德语 (DE)是是
意大利语 (IT) 是
日语 (JA) 是
韩语 (KO) 是
葡萄牙语 (PT) 是
西班牙语 (ES) 是

支持的字符

字母表UiPath 文档 OCR 和 UiPath 文档 OCR_CPU
阿拉伯语'ا','ب','ة','ت','ث','ج','ح','خ','د','ذ','ر','ز','س','ش','ص','ض','ط','ظ','ع','غ','ـ','ف','ق','ك','ل','م','ن','ه','و','ى','ي','ٓ','ٔ','ٕ','٠','١','٢','٣','٤','٥','٦','٧','٨','٩','٪','٫','٬','٭','ٱ','۔','ً','ٌ','ٍ','َ','ُ','ِ','ّ','ْ','ٰ','ۥ','ۦ','آ','،','؛','؟','ء','أ','ؤ','إ','ئ'
希伯来语א ב ג ד ה ו ז ח ט י ך כ ל ם מ ן נ ס ע ף פ ץ צ ק ר ש ת ₪
拉丁语A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï Ñ Ò Ó Ô Õ Ö Ø Ù Ú Û Ü Ý ß à á â ã ä å æ ç è é ê ë ì í î ï ñ ò ó ô õ ö ø ù ú û ü ý Ā ā Ă ă Ą ą Ć ć Ċ ċ Č č Ď ď Đ đ Ē ē Ė ė Ę ę Ě ě Ğ ğ Ġ ġ Ħ ħ Ī ī Ĭ ĭ Į į İ ı Ĺ ĺ Ľ ľ Ł ł Ń ń Ň ň Ŋ ŋ Ō ō Ő ő Œ œ Ŕ ŕ Ř ř Ś ś Š š Ť ť Ŧ ŧ Ū ū Ŭ ŭ Ů ů Ų ų Ź ź Ż ż Ž ž Ə Ǵ ǵ Ș ș Ț ț ə μ
其他字符! " # $ % & \ ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ [ \ \ ] ^ _ { | } ~ £ ¥ § © ® ° ¿ € ≤ ≥

UiPath™ 合作伙伴 OCR

要了解 UiPath™ OCR 合作伙伴支持的语言,请查看他们的专用页面:
  • 打印文本
  • 手写文本
  • 支持的字符
  • UiPath™ 合作伙伴 OCR

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo
信任与安全
© 2005-2025 UiPath。保留所有权利。