- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- Document Understanding 数字化器
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
Document Understanding 活动
ABBYY OCR
UiPath.Abbyy.Activities.AbbyyOCR
有关更多详细信息,请查看弃用时间线。
使用 Abbyy OCR 引擎从指定的用户界面元素或图像中提取字符串及其信息。 可与其他 OCR 活动 (单击 OCR 文本、 悬停在 OCR 文本上方、 获取 OCR 文本、 查找 OCR 文本位置) 一起使用。
常见
- “显示名称”- 活动的显示名称。
输入
- 图像 - 要处理的图像。此字段仅支持
Image
变量。
其他
- “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
选项
- “更正 方向” - 如果选中,则引擎将检测页面方向,并在需要时自动更正。 默认情况下,此复选框处于选中状态。
- CorrectSkew - 检测页面是否倾斜并自动更正。 该下拉列表包含三个选项:“ 自动” - 仅对检测到有倾斜的图像进行校正, “是” - 强制对所有页面进行校正, “否” - 不自动校正页面。 默认情况下,此属性设置为 “自动”。
- “自定义识别配置文件路径 ” - 自定义构建的识别配置文件的完整路径。 此字段仅支持字符串和
String
变量。 - “提取文字”- 如果选中此复选框,则会提取每个检测到的文字在屏幕上的所处位置。
- FineReaderVersion - 指定要使用的 Fine Reader 引擎版本。 选项为 FineReaderEngine 11 和 FineReaderEngine 12。 默认情况下,此属性设置为 FineReaderEngine 11。
- “语言 ” - OCR 引擎用于从用户界面元素或图像中提取文本的语言。 默认情况下,ABBYY FineReader 引擎包含大多数受支持的 OCR 语言。 它们可以在成功安装引擎后立即使用。 必须写入完整的语言名称,例如“english”、“japanese”、“romanian”。
- “预定 义识别配置文件” - 指定处理图像时要使用的预定义识别配置文件。 此字段仅支持字符串和
String
变量。 有关预定义配置文件的列表,请查看“ 预定义的识别配置文件” 表格。 - 配置文件 - 为指定图像或用户界面元素选择预处理配置文件,以实现更好的 OCR 读取。 提供以下选项: 无 - 不应用预处理配置文件; 屏幕 - 适用于远程桌面应用程序的预处理; 扫描 - 适用于扫描文件的预处理; 旧版 - 使用引擎的默认设置来预处理图像。 默认选项为 “旧版”。
- “比例 ” - 所选用户界面元素或图像的比例因子。 数字越大,图像放大得越多。 这可以提供更好的 OCR 读取,建议用于小图像。 如果要按比例缩小,则还接受 0 到 1 之间的值。 默认情况下,该值为 1。
输出
- 置信 度 - 生成的置信度分数,存储在
Int32
变量中。 此字段仅支持Int32
变量。 - “结果”- 提取的文字及其在屏幕上的位置。此字段仅支持
KeyValuePair <rectangle,string>
变量。 - “文本 ” - 提取的文本。 此字段仅支持字符串变量。
识别配置文件 |
描述 |
---|---|
|
用于将文档转换为可编辑格式,优化了准确性。 |
|
用于将文档转换为可编辑格式,优化了速度。 |
|
用于创建数字档案,优化了准确性。 |
|
用于创建数字档案,优化了速度。 |
|
用于创建电子库,优化了准确性。 |
|
用于创建电子库,优化了速度。 |
|
用于从文档中提取文本,优化了准确性。 |
|
用于从文档中提取文本,优化了速度。 |
|
用于识别短文本片段。 |
|
用于提取条形码,优化了准确性;您可使用“
BarcodeRecognition ”名称对其进行调用。
|
|
用于提取条形码,优化了速度。 |
|
用于创建高度压缩的 PDF 文件,此文件包含以图片形式保存的整个文档。 |
|
用于识别商业名片。 |
|
用于识别技术制图,其中的文本按不同方向排列。 |
|
用于设置兼容性,将处理参数设为默认值“ABBYY FineReader Engine 9.0”。 |