- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- 基本数据点类 - 预览
- 提取结果处理程序类 - 预览
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- 发行说明
- 关于“OmniPage”活动包
- 项目兼容性
- OmniPage OCR
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
Document Understanding 活动
UiPath.OmniPage.Activities
手写识别仅适用于手打印的文本,并且其中的字符没有连接。文档的理想大小为 25 到 45 像素。
描述
使用OmniPage OCR引擎从指定的用户界面元素或图像中提取字符串及其信息。在需要实施 OCR 引擎的所有活动中, OmniPage OCR可以替代其他 OCR 引擎。以下是一些可与OmniPage OCR一起使用的活动示例:单击 OCR 文本、悬停 OCR 文本、双击 OCR 文本、获取 OCR 文本、查找 OCR 文本位置、数字化文档、计算机视觉屏幕作用域、计算机视觉获取文本。
UiPath.OmniPage.Activities 包 v1.9.0 或更高版本已升级到 .NET5 Core。如果包在非 Windows 旧版工作流中运行,则此更改意味着在您的计算机上安装 .NET5 Framework。
OmniPage OCR 活动与 UiPath.IntelligentOCR.Activities 包 v2.0.0 或更高版本兼容,并且可以在任何 OCR 上下文中使用。
项目兼容性
Windows - Legacy | Windows
配置
属性面板
常见
- “显示名称”- 活动的显示名称。
输入
- “图像”- 要处理的图像。该字段仅支持“
Image”变量。
其他
- “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
选项
-
“包引擎” - 指定必须用于图像处理的嵌入式引擎。提供如下两个选项: “基本” - 支持多种语言, “扩展” - 包含对亚洲语言、阿拉伯语、泰语、希伯来语和越南语的额外支持。请查看本页末尾的Basic包所有可用语言列表。
备注:为了使用扩展引擎,您必须通过包管理器在当前项目中手动安装UiPath.OmniPage.Bundle.Extended包 。
-
ExtractWords - If selected, extracts the on-screen position of all detected words.
-
Language - The language used by the OCR engine. The default option is auto, meaning that the language is automatically detected. Multiple languages can be used separated by commas.
备注:You can use settings for multiple languages at the same time. For example, you can set "eng,fra" to process images that contain both English as well as French content.
请注意,日语、韩语和中文语言设置会调用专用的识别引擎。 一次只能选择其中的一种语言,并且不能与任何非亚洲语言结合使用。
在不选择英语作为识别语言的情况下,可以识别英语的短嵌入文本。
-
配置文件- 为指定图像或用户界面元素选择预处理配置文件,以实现更好的 OCR 读取。可选择以下选项:
- “无” - 不应用预处理配置文件,这是默认选项;
- 屏幕- 适用于远程桌面应用程序的预处理;
- 扫描- 适用于扫描文件的预处理;
- 旧版- 使用引擎的默认设置来预处理图像。
-
“缩放比例”- 所选用户界面元素或图像的比例因子。数字越大,图像的放大幅度也就越大。这样可以更好地读取 OCR,建议小图像使用较大比例因子。如果想要缩小,0 至 1 之间的值也可接受。默认情况下,此值为 1。
备注:如果要在 Studio v19.10 中使用包UiPath.OmniPage.Activities v1.8.0 中的此 OCR 活动,请安装UiPath.CoreIPC包 2.0.1 或更高版本。
重要提示:当缩放因子大于 1 时,大尺寸图像可能会导致错误。
输出
- Result - The text extracted by the OCR engine along with their on-screen position, stored in a
KeyValuePair<Rectangle,String>. This field supports onlyKeyValuePair<Rectangle,String>. - Text - The text extracted by the OCR engine, stored in a String variable. This field supports only
Stringvariables.
支持的语言
下表显示了 OmniPage OCR 支持的所有语言及其相应的语言代码。
表 1.OmniPage OCR 支持的语言和语言代码 - 基本包语言
| 语言代码 | |
|---|---|
| 南非荷兰语 | AFR |
| 阿尔巴尼亚语 | SQI |
| 艾马拉语 | AYM |
| 巴斯克语 | EUS |
| 本巴 | BEM |
| 黑脚 | BLA |
| 巴西人 | QBP |
| 布列塔尼 | BRE |
| 布戈图 | BGT |
| 保加利亚语 | BUL |
| 白俄罗斯语 | BEL |
| 加泰罗尼亚语 | CAT |
| 查莫罗 | CHA |
| 车臣 | CHE |
| 科西嘉岛 | COS |
| 克罗地亚语 | HRV |
| 乌鸦 | CRO |
| 捷克语 | CES |
| 丹麦语 | DAN |
| 荷兰语 | NLD |
| 英文 | ENG |
| 爱斯基摩人 (因纽特人) | QES |
| 世界语 | EPO |
| 爱沙尼亚语 | 东部标准时间 |
| 法罗语 | FAO |
| 斐济语 | FIJ |
| 芬兰语 | FIN |
| 法语 | FRA |
| 弗里斯兰语 | FRY |
| 弗留利语 | FUR |
| 盖尔语 (爱尔兰语) | GLE |
| 盖尔语 (苏格兰语) | GLA |
| 加利西亚语 | GLG |
| 甘达 | LUG |
| 德语 | DEU |
| 希腊语 | ELL |
| 瓜拉尼 | GRN |
| 哈尼语 * | HNI |
| 夏威夷菜 | HAW |
| 匈牙利语 | HUN |
| 冰岛语 | ISL |
| 伊多 | IDO |
| 印尼语 | IND |
| 国际语 | INA |
| 意大利语 | ITA |
| 卡苏 | CSB |
| 卡瓦 * | WBM |
| 基库尤语 | KIK |
| 金刚 | KON |
| 克佩尔 | KPE |
| 库尔德语 * | KUR |
| 拉丁语 | LAT |
| 拉脱维亚语 | LAV |
| 立陶宛语 | LIT |
| 卢巴 | LUA |
| 卢森堡语 | LTZ |
| 马其顿语 | MKD |
| 马达加斯加语 | MLG |
| 马来语 | MSA |
| 马林克 | MLQ |
| 马耳他语 | MLT |
| 毛利语 | MRI |
| 玛雅人 | MYN |
| 苗 * | HMN |
| 米南卡保 | 分 |
| 莫霍克 | MOH |
| 摩尔达维亚 | MOL |
| 纳瓦特尔语 | NAH |
| 挪威语 | NOR |
| 尼亚加 | NYA |
| 西方国家 | OCC |
| 奥吉布韦 | OJI |
| 帕皮阿门托 | PAP |
| Pidgin 英语 | TPI |
| 波兰语 | POL |
| 葡萄牙语 | POR |
| 普罗旺斯 | PRV |
| 克丘亚语 | QUE |
| 雷蒂克 | ROH |
| 罗马尼亚语 | RON |
| 罗姆语 | ROM |
| 卢旺达 | KIN |
| 润迪 | 运行 |
| 俄语 | RUS |
| 萨米语 | SMI |
| 鲁勒语萨米语 | SMJ |
| 北部萨米人 | SME |
| 南部萨米语 | SMA |
| 萨摩亚语 | SMO |
| 撒丁岛 | SRD |
| 塞尔维亚语 | SRP |
| 塞尔维亚语、拉丁语 | QSL |
| 绍纳语 | SNA |
| 苏 | DAK |
| 斯洛伐克语 | SLK |
| 斯洛文尼亚语 | SLV |
| 索马里语 | SOM |
| 索布语 (Wend) | WEN |
| 索托语 | SOT |
| 西班牙语 | SPA |
| 巽他语 | 周日 |
| 斯瓦希里语 | SWA |
| 斯威士兰语 | SSW |
| 瑞典语 | SWE |
| 他加禄语 | TGL |
| 大溪地 | TAH |
| 皮雷斯 | QTI |
| 汤加语 | TON |
| 茨瓦纳语(川纳语) | TSN |
| 屯 * | TUG |
| 土耳其语 | TUR |
| 乌克兰语 | UKR |
| 米沙鄢 | QIS |
| 威尔士语 | CYM |
| 沃洛夫 | WOL |
| 科萨语 | XHO |
| 萨波特克 | ZAP |
| Zulu | ZUL |
| = 仅当使用拉丁字母书写时,才能处理此语言。 |
表 2. OmniPage OCR 支持的语言和语言代码 - 扩展包语言
| 语言代码 | |
|---|---|
| 基本包中包含的所有语言 | |
| 日语 | JPN |
| 简体中文 | QCS |
| 繁体中文 | QCT |
| 韩语 | KOR |
| 泰语 | THA |
| 阿拉伯语 | ARA |
| 希伯来语 | HEB |
| 越南语(拉丁语) | VIE |
The Extended Pack can be used with the ISO/DIS 639-3 language codes mentioned above, with the ISO 639-1 and ISO 639-2 language codes, or with the actual name of the language.