activities
latest
false
UiPath logo, featuring letters U and I in white
Document Understanding 活动
Last updated 2024年11月26日

OmniPage OCR

UiPath.OmniPage.Activities

重要提示:手写识别仅适用于手写文本,并且其中的字符没有连接。 理想的文档大小为 25 到 45 像素之间。

描述

使用 OmniPage OCR 引擎从指定的用户界面元素或图像中提取字符串及其信息。 在所有需要实施 OCR 引擎的活动中, OmniPage OCR 是其他 OCR 引擎的替代方法。 以下是一些可与 OmniPage OCR一起使用的活动示例:单击 OCR 文本悬停 OCR 文本双击 OCR 文本获取 OCR 文本查找 OCR 文本位置数字化文档CV 屏幕作用域CV 获取文本

注意: UiPath.OmniPage.Activities 包 v1.9.0 或更高版本已升级到 .NET5 核心。 如果包在非 Windows 旧版工作流中运行,则此更改意味着在您的计算机上安装 .NET5 框架。
注意: OmniPage OCR 活动与 UiPath.IntelligentOCR.Activities 包 v2.0.0 或更高版本兼容,并且可以在任何 OCR 上下文中使用。

项目兼容性

Windows - Legacy | Windows

配置

属性面板

常见

  • “显示名称”- 活动的显示名称。

输入

  • 图像 - 要处理的图像。此字段仅支持 Image 变量。

其他

  • “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。

选项

  • “引擎包” - 指定必须使用哪个嵌入式引擎进行图像处理。 有如下两个选项: “基本” - 支持广泛的语言,“扩展” - 包含对亚洲语言、阿拉伯语、泰语、希伯来语和越南语的额外支持。 查看本页末尾的基本包所有可用语言列表。
    注意: 要使用 扩展 引擎,您必须通过 包管理器在当前项目中手动安装UiPath.OmniPage.Bundle.Extended包。
  • “提取 ” - 如果选中,则提取所有检测到的词在屏幕上的位置。
  • 语言 ” - OCR 引擎使用的语言。 默认选项为 auto,这意味着会自动检测语言。 可以使用多种语言,并用逗号分隔。
    备注:

    You can use settings for multiple languages at the same time. For example, you can set "eng,fra" to process images that contain both English as well as French content.

    请注意,日语、韩语和中文语言设置会调用专用的识别引擎。 一次只能选择其中的一种语言,并且不能与任何非亚洲语言结合使用。

    在不选择英语作为识别语言的情况下,可以识别英语的短嵌入文本。

  • 配置文件- 为指定图像或用户界面元素选择预处理配置文件,以实现更好的 OCR 读取。 可选择以下选项:
    • ”- 不应用预处理配置文件,这是默认选项;
    • 屏幕- 适用于远程桌面应用程序的预处理;
    • 扫描- 适用于扫描文件的预处理;
    • 旧版- 使用引擎的默认设置来预处理图像。
  • 比例 ” - 所选用户界面元素或图像的比例因子。 数字越大,图像放大得越多。 这可以提供更好的 OCR 读取,建议用于小图像。 如果要按比例缩小,则还接受 0 到 1 之间的值。 默认情况下,该值为 1。
    注意:如果要在 Studio v19.10 中使用包UiPath.OmniPage.Activities v1.8.0 中的此 OCR 活动,请安装 2.0.1 或更高版本的UiPath.CoreIPC包。
    重要提示: 当比例因子大于 1 时,大尺寸图像可能会导致错误。

输出

  • 结果 ” - OCR 引擎提取的文本及其在屏幕上的位置,存储在 KeyValuePair<Rectangle,String>中。 此字段仅支持 KeyValuePair<Rectangle,String>
  • 文本 ” - OCR 引擎提取的文本,存储在“字符串”变量中。 此字段仅支持 String 变量。

支持的语言

下表显示了 OmniPage OCR 支持的所有语言及其相应的语言代码。

表 1.支持的语言和 OmniPage OCR 的语言代码 - 基本包语言
 

语言代码

南非荷兰语

AFR

阿尔巴尼亚语

SQI

艾马拉语

AYM

巴斯克语

EUS

本巴

BEM

黑脚

BLA

巴西人

QBP

布列塔尼

BRE

布戈图

BGT

保加利亚语

BUL

白俄罗斯语

BEL

加泰罗尼亚语

CAT

查莫罗

CHA

车臣

CHE

科西嘉岛

COS

克罗地亚语

HRV

乌鸦

CRO

捷克语

CES

丹麦语

DAN

荷兰语

NLD

英文

ENG

爱斯基摩人 (因纽特人)

QES

世界语

EPO

爱沙尼亚语

东部标准时间

法罗语

FAO

斐济语

FIJ

芬兰语

FIN

法语

FRA

弗里斯兰语

FRY

弗留利语

FUR

盖尔语 (爱尔兰语)

GLE

盖尔语 (苏格兰语)

GLA

加利西亚语

GLG

甘达

LUG

德语

DEU

希腊语

ELL

瓜拉尼

GRN

哈尼语 *

HNI

夏威夷菜

HAW

匈牙利语

HUN

冰岛语

ISL

伊多

IDO

印尼语

IND

国际语

INA

意大利语

ITA

卡苏

CSB

卡瓦 *

WBM

基库尤语

KIK

金刚

KON

克佩尔

KPE

库尔德语 *

KUR

拉丁语

LAT

拉脱维亚语

LAV

立陶宛语

LIT

卢巴

LUA

卢森堡语

LTZ

马其顿语

MKD

马达加斯加语

MLG

马来语

MSA

马林克

MLQ

马耳他语

MLT

毛利语

MRI

玛雅人

MYN

苗 *

HMN

米南卡保

莫霍克

MOH

摩尔达维亚

MOL

纳瓦特尔语

NAH

挪威语

NOR

尼亚加

NYA

西方国家

OCC

奥吉布韦

OJI

帕皮阿门托

PAP

Pidgin 英语

TPI

波兰语

POL

葡萄牙语

POR

普罗旺斯

PRV

克丘亚语

QUE

雷蒂克

ROH

罗马尼亚语

RON

罗姆语

ROM

卢旺达

KIN

润迪

运行

俄语

RUS

萨米语

SMI

鲁勒语萨米语

SMJ

北部萨米人

SME

南部萨米语

SMA

萨摩亚语

SMO

撒丁岛

SRD

塞尔维亚语

SRP

塞尔维亚语、拉丁语

QSL

绍纳语

SNA

DAK

斯洛伐克语

SLK

斯洛文尼亚语

SLV

索马里语

SOM

索布语 (Wend)

WEN

索托语

SOT

西班牙语

SPA

巽他语

周日

斯瓦希里语

SWA

斯威士兰语

SSW

瑞典语

SWE

他加禄语

TGL

大溪地

TAH

皮雷斯

QTI

汤加语

TON

茨瓦纳语(川纳语)

TSN

屯 *

TUG

土耳其语

TUR

乌克兰语

UKR

米沙鄢

QIS

威尔士语

CYM

沃洛夫

WOL

科萨语

XHO

萨波特克

ZAP

Zulu

ZUL

= 仅当使用拉丁字母书写时,才能处理此语言。

 
表 2. OmniPage OCR 支持的语言和语言代码 - 扩展包语言
 

语言代码

基本包中包含的所有语言

 

日语

JPN

简体中文

QCS

繁体中文

QCT

韩语

KOR

泰语

THA

阿拉伯语

ARA

希伯来语

HEB

越南语(拉丁语)

VIE

注意: 扩展包 可与上述 ISO/DIS 639-3 语言代码、ISO 639-1 和 ISO 639-2 语言代码或语言的实际名称一起使用。
  • 描述
  • 项目兼容性
  • 配置
  • 支持的语言

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。