UiPath Documentation
activities
latest
false

Document Understanding 活动

上次更新日期 2026年5月5日

OmniPage OCR

UiPath.OmniPage.Activities

重要提示:

手写识别仅适用于手打印的文本,并且其中的字符没有连接。文档的理想大小为 25 到 45 像素。

描述

使用OmniPage OCR引擎从指定的用户界面元素或图像中提取字符串及其信息。在需要实施 OCR 引擎的所有活动中, OmniPage OCR可以替代其他 OCR 引擎。以下是一些可与OmniPage OCR一起使用的活动示例:单击 OCR 文本悬停 OCR 文本双击 OCR 文本获取 OCR 文本查找 OCR 文本位置数字化文档计算机视觉屏幕作用域计算机视觉获取文本

备注:

UiPath.OmniPage.Activities 包 v1.9.0 或更高版本已升级到 .NET5 Core。如果包在非 Windows 旧版工作流中运行,则此更改意味着在您的计算机上安装 .NET5 Framework。

备注:

OmniPage OCR 活动与 UiPath.IntelligentOCR.Activities 包 v2.0.0 或更高版本兼容,并且可以在任何 OCR 上下文中使用。

项目兼容性

Windows - Legacy | Windows

配置

属性面板

常见

  • “显示名称”- 活动的显示名称。

输入

  • “图像”- 要处理的图像。该字段仅支持“Image”变量。

其他

  • “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。

选项

  • “包引擎” - 指定必须用于图像处理的嵌入式引擎。提供如下两个选项: “基本” - 支持多种语言, “扩展” - 包含对亚洲语言、阿拉伯语、泰语、希伯来语和越南语的额外支持。请查看本页末尾的Basic包所有可用语言列表。

    备注:

    为了使用扩展引擎,您必须通过包管理器在当前项目中手动安装UiPath.OmniPage.Bundle.Extended包 。

  • ExtractWords - If selected, extracts the on-screen position of all detected words.

  • Language - The language used by the OCR engine. The default option is auto, meaning that the language is automatically detected. Multiple languages can be used separated by commas.

    备注:

    You can use settings for multiple languages at the same time. For example, you can set "eng,fra" to process images that contain both English as well as French content.

    请注意,日语、韩语和中文语言设置会调用专用的识别引擎。 一次只能选择其中的一种语言,并且不能与任何非亚洲语言结合使用。

    在不选择英语作为识别语言的情况下,可以识别英语的短嵌入文本。

  • 配置文件- 为指定图像或用户界面元素选择预处理配置文件,以实现更好的 OCR 读取。可选择以下选项:

    • “无” - 不应用预处理配置文件,这是默认选项;
    • 屏幕- 适用于远程桌面应用程序的预处理;
    • 扫描- 适用于扫描文件的预处理;
    • 旧版- 使用引擎的默认设置来预处理图像。
  • “缩放比例”- 所选用户界面元素或图像的比例因子。数字越大,图像的放大幅度也就越大。这样可以更好地读取 OCR,建议小图像使用较大比例因子。如果想要缩小,0 至 1 之间的值也可接受。默认情况下,此值为 1。

    备注:

    如果要在 Studio v19.10 中使用包UiPath.OmniPage.Activities v1.8.0 中的此 OCR 活动,请安装UiPath.CoreIPC包 2.0.1 或更高版本。

    重要提示:

    当缩放因子大于 1 时,大尺寸图像可能会导致错误。

输出

  • Result - The text extracted by the OCR engine along with their on-screen position, stored in a KeyValuePair<Rectangle,String>. This field supports only KeyValuePair<Rectangle,String>.
  • Text - The text extracted by the OCR engine, stored in a String variable. This field supports only String variables.

支持的语言

下表显示了 OmniPage OCR 支持的所有语言及其相应的语言代码。

表 1.OmniPage OCR 支持的语言和语言代码 - 基本包语言

语言代码
南非荷兰语AFR
阿尔巴尼亚语SQI
艾马拉语AYM
巴斯克语EUS
本巴BEM
黑脚BLA
巴西人QBP
布列塔尼BRE
布戈图BGT
保加利亚语BUL
白俄罗斯语BEL
加泰罗尼亚语CAT
查莫罗CHA
车臣CHE
科西嘉岛COS
克罗地亚语HRV
乌鸦CRO
捷克语CES
丹麦语DAN
荷兰语NLD
英文ENG
爱斯基摩人 (因纽特人)QES
世界语EPO
爱沙尼亚语东部标准时间
法罗语FAO
斐济语FIJ
芬兰语FIN
法语FRA
弗里斯兰语FRY
弗留利语FUR
盖尔语 (爱尔兰语)GLE
盖尔语 (苏格兰语)GLA
加利西亚语GLG
甘达LUG
德语DEU
希腊语ELL
瓜拉尼GRN
哈尼语 *HNI
夏威夷菜HAW
匈牙利语HUN
冰岛语ISL
伊多IDO
印尼语IND
国际语INA
意大利语ITA
卡苏CSB
卡瓦 *WBM
基库尤语KIK
金刚KON
克佩尔KPE
库尔德语 *KUR
拉丁语LAT
拉脱维亚语LAV
立陶宛语LIT
卢巴LUA
卢森堡语LTZ
马其顿语MKD
马达加斯加语MLG
马来语MSA
马林克MLQ
马耳他语MLT
毛利语MRI
玛雅人MYN
苗 *HMN
米南卡保
莫霍克MOH
摩尔达维亚MOL
纳瓦特尔语NAH
挪威语NOR
尼亚加NYA
西方国家OCC
奥吉布韦OJI
帕皮阿门托PAP
Pidgin 英语TPI
波兰语POL
葡萄牙语POR
普罗旺斯PRV
克丘亚语QUE
雷蒂克ROH
罗马尼亚语RON
罗姆语ROM
卢旺达KIN
润迪运行
俄语RUS
萨米语SMI
鲁勒语萨米语SMJ
北部萨米人SME
南部萨米语SMA
萨摩亚语SMO
撒丁岛SRD
塞尔维亚语SRP
塞尔维亚语、拉丁语QSL
绍纳语SNA
DAK
斯洛伐克语SLK
斯洛文尼亚语SLV
索马里语SOM
索布语 (Wend)WEN
索托语SOT
西班牙语SPA
巽他语周日
斯瓦希里语SWA
斯威士兰语SSW
瑞典语SWE
他加禄语TGL
大溪地TAH
皮雷斯QTI
汤加语TON
茨瓦纳语(川纳语)TSN
屯 *TUG
土耳其语TUR
乌克兰语UKR
米沙鄢QIS
威尔士语CYM
沃洛夫WOL
科萨语XHO
萨波特克ZAP
ZuluZUL
= 仅当使用拉丁字母书写时,才能处理此语言。

表 2. OmniPage OCR 支持的语言和语言代码 - 扩展包语言

语言代码
基本包中包含的所有语言
日语JPN
简体中文QCS
繁体中文QCT
韩语KOR
泰语THA
阿拉伯语ARA
希伯来语HEB
越南语(拉丁语)VIE
备注:

The Extended Pack can be used with the ISO/DIS 639-3 language codes mentioned above, with the ISO 639-1 and ISO 639-2 language codes, or with the actual name of the language.

  • 描述
  • 项目兼容性
  • 配置
  • 支持的语言

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新