- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- Document Understanding 数字化器
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- ML 服务
- OCR
- OCR 合同
- OmniPage
- 发行说明
- 关于“OmniPage”活动包
- 项目兼容性
- OmniPage OCR
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
Document Understanding 活动
OmniPage OCR
UiPath.OmniPage.Activities
使用 OmniPage OCR 引擎从指定的用户界面元素或图像中提取字符串及其信息。 在所有需要实施 OCR 引擎的活动中, OmniPage OCR 是其他 OCR 引擎的替代方法。 以下是一些可与 OmniPage OCR一起使用的活动示例:单击 OCR 文本、 悬停 OCR 文本、 双击 OCR 文本、 获取 OCR 文本、 查找 OCR 文本位置、 数字化文档、 CV 屏幕作用域、 CV 获取文本。
属性面板
常见
- “显示名称”- 活动的显示名称。
输入
- 图像 - 要处理的图像。此字段仅支持
Image
变量。
其他
- “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
选项
- “引擎包” - 指定必须使用哪个嵌入式引擎进行图像处理。 有如下两个选项: “基本” - 支持广泛的语言,“扩展” - 包含对亚洲语言、阿拉伯语、泰语、希伯来语和越南语的额外支持。 查看本页末尾的基本包所有可用语言列表。
注意: 要使用 扩展 引擎,您必须通过 包管理器在当前项目中手动安装UiPath.OmniPage.Bundle.Extended包。
- “提取词 ” - 如果选中,则提取所有检测到的词在屏幕上的位置。
- “语言 ” - OCR 引擎使用的语言。 默认选项为 auto,这意味着会自动检测语言。 可以使用多种语言,并用逗号分隔。
备注:
You can use settings for multiple languages at the same time. For example, you can set "eng,fra" to process images that contain both English as well as French content.
请注意,日语、韩语和中文语言设置会调用专用的识别引擎。 一次只能选择其中的一种语言,并且不能与任何非亚洲语言结合使用。
在不选择英语作为识别语言的情况下,可以识别英语的短嵌入文本。
- 配置文件- 为指定图像或用户界面元素选择预处理配置文件,以实现更好的 OCR 读取。 可选择以下选项:
- “无”- 不应用预处理配置文件,这是默认选项;
- 屏幕- 适用于远程桌面应用程序的预处理;
- 扫描- 适用于扫描文件的预处理;
- 旧版- 使用引擎的默认设置来预处理图像。
- “比例 ” - 所选用户界面元素或图像的比例因子。 数字越大,图像放大得越多。 这可以提供更好的 OCR 读取,建议用于小图像。 如果要按比例缩小,则还接受 0 到 1 之间的值。 默认情况下,该值为 1。
注意:如果要在 Studio v19.10 中使用包UiPath.OmniPage.Activities v1.8.0 中的此 OCR 活动,请安装 2.0.1 或更高版本的UiPath.CoreIPC包。重要提示: 当比例因子大于 1 时,大尺寸图像可能会导致错误。
输出
- “结果 ” - OCR 引擎提取的文本及其在屏幕上的位置,存储在
KeyValuePair<Rectangle,String>
中。 此字段仅支持KeyValuePair<Rectangle,String>
。 - “文本 ” - OCR 引擎提取的文本,存储在“字符串”变量中。 此字段仅支持
String
变量。
下表显示了 OmniPage OCR 支持的所有语言及其相应的语言代码。
语言代码 | |
---|---|
南非荷兰语 |
AFR |
阿尔巴尼亚语 |
SQI |
艾马拉语 |
AYM |
巴斯克语 |
EUS |
本巴 |
BEM |
黑脚 |
BLA |
巴西人 |
QBP |
布列塔尼 |
BRE |
布戈图 |
BGT |
保加利亚语 |
BUL |
白俄罗斯语 |
BEL |
加泰罗尼亚语 |
CAT |
查莫罗 |
CHA |
车臣 |
CHE |
科西嘉岛 |
COS |
克罗地亚语 |
HRV |
乌鸦 |
CRO |
捷克语 |
CES |
丹麦语 |
DAN |
荷兰语 |
NLD |
英文 |
ENG |
爱斯基摩人 (因纽特人) |
QES |
世界语 |
EPO |
爱沙尼亚语 |
东部标准时间 |
法罗语 |
FAO |
斐济语 |
FIJ |
芬兰语 |
FIN |
法语 |
FRA |
弗里斯兰语 |
FRY |
弗留利语 |
FUR |
盖尔语 (爱尔兰语) |
GLE |
盖尔语 (苏格兰语) |
GLA |
加利西亚语 |
GLG |
甘达 |
LUG |
德语 |
DEU |
希腊语 |
ELL |
瓜拉尼 |
GRN |
哈尼语 * |
HNI |
夏威夷菜 |
HAW |
匈牙利语 |
HUN |
冰岛语 |
ISL |
伊多 |
IDO |
印尼语 |
IND |
国际语 |
INA |
意大利语 |
ITA |
卡苏 |
CSB |
卡瓦 * |
WBM |
基库尤语 |
KIK |
金刚 |
KON |
克佩尔 |
KPE |
库尔德语 * |
KUR |
拉丁语 |
LAT |
拉脱维亚语 |
LAV |
立陶宛语 |
LIT |
卢巴 |
LUA |
卢森堡语 |
LTZ |
马其顿语 |
MKD |
马达加斯加语 |
MLG |
马来语 |
MSA |
马林克 |
MLQ |
马耳他语 |
MLT |
毛利语 |
MRI |
玛雅人 |
MYN |
苗 * |
HMN |
米南卡保 |
分 |
莫霍克 |
MOH |
摩尔达维亚 |
MOL |
纳瓦特尔语 |
NAH |
挪威语 |
NOR |
尼亚加 |
NYA |
西方国家 |
OCC |
奥吉布韦 |
OJI |
帕皮阿门托 |
PAP |
Pidgin 英语 |
TPI |
波兰语 |
POL |
葡萄牙语 |
POR |
普罗旺斯 |
PRV |
克丘亚语 |
QUE |
雷蒂克 |
ROH |
罗马尼亚语 |
RON |
罗姆语 |
ROM |
卢旺达 |
KIN |
润迪 |
运行 |
俄语 |
RUS |
萨米语 |
SMI |
鲁勒语萨米语 |
SMJ |
北部萨米人 |
SME |
南部萨米语 |
SMA |
萨摩亚语 |
SMO |
撒丁岛 |
SRD |
塞尔维亚语 |
SRP |
塞尔维亚语、拉丁语 |
QSL |
绍纳语 |
SNA |
苏 |
DAK |
斯洛伐克语 |
SLK |
斯洛文尼亚语 |
SLV |
索马里语 |
SOM |
索布语 (Wend) |
WEN |
索托语 |
SOT |
西班牙语 |
SPA |
巽他语 |
周日 |
斯瓦希里语 |
SWA |
斯威士兰语 |
SSW |
瑞典语 |
SWE |
他加禄语 |
TGL |
大溪地 |
TAH |
皮雷斯 |
QTI |
汤加语 |
TON |
茨瓦纳语(川纳语) |
TSN |
屯 * |
TUG |
土耳其语 |
TUR |
乌克兰语 |
UKR |
米沙鄢 |
QIS |
威尔士语 |
CYM |
沃洛夫 |
WOL |
科萨语 |
XHO |
萨波特克 |
ZAP |
Zulu |
ZUL |
= 仅当使用拉丁字母书写时,才能处理此语言。 |
语言代码 | |
---|---|
基本包中包含的所有语言 | |
日语 |
JPN |
简体中文 |
QCS |
繁体中文 |
QCT |
韩语 |
KOR |
泰语 |
THA |
阿拉伯语 |
ARA |
希伯来语 |
HEB |
越南语(拉丁语) |
VIE |