activities
latest
false
重要 :
请注意此内容已使用机器翻译进行了部分本地化。
UiPath logo, featuring letters U and I in white
用户界面自动化活动
Last updated 2024年10月28日

Tesseract OCR

UiPath.Core.Activities.GoogleOCR

使用 Tesseract OCR 引擎从指定的用户界面元素或图像中提取字符串及其信息。此操作可与其他 OCR 活动 (单击 OCR 文本悬停在 OCR 文本上方双击 OCR 文本获取 OCR 文本查找 OCR 文本位置) 一起使用。

注意:UiPath 中使用的 Tesseract OCR 引擎已更新至版本 4.0。您可在此处详细了解此引擎的功能。
注意: 此活动不支持旋转的文档,因此此类文档的结果无法预测。

先决条件

在运行 Tesseract OCR 引擎之前,请在相应的计算机上安装 Visual C++ Redistributable x86(32 位)。即使您的操作系统是 64 位 (x64),您仍需要安装 x86(32 位)版本。访问 Visual C++ Redistributable 最新支持的下载,选择并安装符合您要求的 Visual C++ 版本。

属性

选项
  • 允许的字符 - OCR 引擎根据此处指定的字符提取给定字符串。
  • 已拒绝的字符 - OCR 引擎在不考虑此处指定的字符情况下提取给定字符串。
  • 反相- 如果选中该复选框,则系统会在抓取之前反转用户界面元素的颜色。这在背景颜色比文本颜色更深的情况下有用。
  • 语言 - OCR 引擎从用户界面元素中提取字符串时所使用的语言。对于 Google OCR 引擎,该字段需要包含语言文件前缀,如表示罗马尼亚语的“ron”、表示意大利语的“ita”以及表示法语的“fra”。您可以在该页面找到支持的语言前缀。

    注意:可以从此处下载语言文件夹并将其添加到本地文件夹 %UserProfile%\.nuget\packages\uipath.vision\3.x.x\build\net461\tessdata。在本地添加语言文件夹后,请确保重新启动 UiPath Studio 应用程序。
  • “提取文字”- 如果选中此复选框,则会提取每个检测到的文字在屏幕上的所处位置。
  • 配置文件 - 为指定图像或用户界面元素选择预处理配置文件,以实现更好的 OCR 读取。为指定的图像或用户界面元素选择一个预处理配置文件,以实现更好的 OCR 读取。可用的选项如下: 无 - 不应用预处理配置文件;屏幕 - 适用于远程桌面应用程序的预处理;扫描 - 适用于扫描文件的预处理;旧版 - 使用引擎的默认设置进行图像预处理,这是默认选项。
  • 比例 - 选定用户界面元素或图像的比例因子。数字越大,将图像放大得越大。这样可以更好地读取 OCR,建议小图像使用较大比例因子。如果想要缩小,0 至 1 之间的值也可接受。默认情况下,此值为 2。

    重要提示: 当比例因子大于 1 时,大尺寸图像可能会导致错误。
输出
  • 文本 ” - 提取的字符串。 此字段仅支持 string 变量。
  • “结果”- 提取的文字及其在屏幕上的位置。此字段仅支持 KeyValuePair <rectangle,string> 变量。
输入
  • 图像 - 要处理的图像。此字段仅支持 image 变量。
常见
  • “显示名称”- 活动的显示名称。
其他
  • “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
  • 先决条件
  • 属性

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。