Document Understanding 活动

上次更新日期 2024年12月5日

ABBYY OCR

UiPath.Abbyy.Activities.AbbyyOCR

注意： UiPath™.Abbyy.Activities 包已弃用，当前不受支持。此外，该包已从 UiPath™ Studio 的“管理包”官方订阅源中取消列出。

有关更多详细信息，请查看弃用时间线。

使用 Abbyy OCR 引擎从指定的用户界面元素或图像中提取字符串及其信息。可与其他 OCR 活动 (单击 OCR 文本、悬停在 OCR 文本上方、获取 OCR 文本、查找 OCR 文本位置) 一起使用。

注意：如果要在 Studio v19.10 中使用 UiPath.Abbyy.Activities v1.5.0 包中的此 OCR 活动，请安装 UiPath.CoreIPC 包 2.0.1 或更高版本。”

注意：需要 ABBYY FineReader Engine SDK。只有获得了 UiPath 销售部门分发的许可证，该引擎才会工作。有关这方面的更多信息，请转到此处。

属性

常见

“显示名称”- 活动的显示名称。

输入

图像 - 要处理的图像。此字段仅支持 Image 变量。

其他

“私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。

选项

“更正方向” - 如果选中，则引擎将检测页面方向，并在需要时自动更正。默认情况下，此复选框处于选中状态。
CorrectSkew - 检测页面是否倾斜并自动更正。该下拉列表包含三个选项：“ 自动” - 仅对检测到有倾斜的图像进行校正， “是” - 强制对所有页面进行校正， “否” - 不自动校正页面。默认情况下，此属性设置为 “自动”。
“自定义识别配置文件路径 ” - 自定义构建的识别配置文件的完整路径。此字段仅支持字符串和 String 变量。
“提取文字”- 如果选中此复选框，则会提取每个检测到的文字在屏幕上的所处位置。
FineReaderVersion - 指定要使用的 Fine Reader 引擎版本。选项为 FineReaderEngine 11 和 FineReaderEngine 12。默认情况下，此属性设置为 FineReaderEngine 11。
“语言 ” - OCR 引擎用于从用户界面元素或图像中提取文本的语言。默认情况下，ABBYY FineReader 引擎包含大多数受支持的 OCR 语言。它们可以在成功安装引擎后立即使用。必须写入完整的语言名称，例如“english”、“japanese”、“romanian”。
“预定义识别配置文件” - 指定处理图像时要使用的预定义识别配置文件。此字段仅支持字符串和 String 变量。有关预定义配置文件的列表，请查看“ 预定义的识别配置文件” 表格。
配置文件 - 为指定图像或用户界面元素选择预处理配置文件，以实现更好的 OCR 读取。提供以下选项：无 - 不应用预处理配置文件；屏幕 - 适用于远程桌面应用程序的预处理；扫描 - 适用于扫描文件的预处理；旧版 - 使用引擎的默认设置来预处理图像。默认选项为 “旧版”。
“比例 ” - 所选用户界面元素或图像的比例因子。数字越大，图像放大得越多。这可以提供更好的 OCR 读取，建议用于小图像。如果要按比例缩小，则还接受 0 到 1 之间的值。默认情况下，该值为 1。

输出

置信度 - 生成的置信度分数，存储在 Int32 变量中。此字段仅支持 Int32 变量。
“结果”- 提取的文字及其在屏幕上的位置。此字段仅支持 KeyValuePair <rectangle,string> 变量。
“文本 ” - 提取的文本。此字段仅支持字符串变量。

预定义识别配置文件

识别配置文件	描述
`DocumentConversion_Accuracy`	用于将文档转换为可编辑格式，优化了准确性。
`DocumentConversion_Speed`	用于将文档转换为可编辑格式，优化了速度。
`DocumentArchiving_Accuracy`	用于创建数字档案，优化了准确性。
`DocumentArchiving_Speed`	用于创建数字档案，优化了速度。
`BookArchiving_Accuracy`	用于创建电子库，优化了准确性。
`BookArchiving_Speed`	用于创建电子库，优化了速度。
`TextExtraction_Accuracy`	用于从文档中提取文本，优化了准确性。
`TextExtraction_Speed`	用于从文档中提取文本，优化了速度。
`FieldLevelRecognition`	用于识别短文本片段。
`BarcodeRecognition_Accuracy`	用于提取条形码，优化了准确性；您可使用“`BarcodeRecognition`”名称对其进行调用。
`BarcodeRecognition_Speed`	用于提取条形码，优化了速度。
`HighCompressedImageOnlyPdf`	用于创建高度压缩的 PDF 文件，此文件包含以图片形式保存的整个文档。
`BusinessCardsProcessing`	用于识别商业名片。
`EngineeringDrawingsProcessing`	用于识别技术制图，其中的文本按不同方向排列。
`Version9Compatibility`	用于设置兼容性，将处理参数设为默认值“ABBYY FineReader Engine 9.0”。