活动
最新
False
横幅背景图像
用户界面自动化活动
上次更新日期 2024年4月26日

Tesseract OCR

UiPath.Core.Activities.GoogleOCR

使用 Tesseract OCR 引擎从指定的用户界面元素或图像中提取字符串及其信息。此操作可与其他 OCR 活动 (单击 OCR 文本悬停在 OCR 文本上方双击 OCR 文本获取 OCR 文本查找 OCR 文本位置) 一起使用。

注意: UiPath 中使用的Tesseract OCR引擎已更新至版本 4.0。 您可以在此处找到有关此引擎功能的更多信息。
注意: 此活动不支持旋转的文档,因此此类文档的结果无法预测。

属性

选项
  • 允许的字符 - OCR 引擎根据此处指定的字符提取给定字符串。
  • 已拒绝的字符 - OCR 引擎在不考虑此处指定的字符情况下提取给定字符串。
  • 反相- 如果选中该复选框,则系统会在抓取之前反转用户界面元素的颜色。这在背景颜色比文本颜色更深的情况下有用。
  • 语言 - OCR 引擎从用户界面元素中提取字符串时所使用的语言。对于 Google OCR 引擎,该字段需要包含语言文件前缀,如表示罗马尼亚语的“ron”、表示意大利语的“ita”以及表示法语的“fra”。您可以在该页面找到支持的语言前缀。

    注意:可以从此处下载语言文件夹并将其添加到本地文件夹%UserProfile%\.nuget\packages\uipath.vision\3.x.x\build\net461\tessdata 。 在本地添加语言文件夹后,请确保重新启动UiPath Studio应用程序。
  • “提取文字”- 如果选中此复选框,则会提取每个检测到的文字在屏幕上的所处位置。
  • 配置文件 - 为指定图像或用户界面元素选择预处理配置文件,以实现更好的 OCR 读取。为指定的图像或用户界面元素选择一个预处理配置文件,以实现更好的 OCR 读取。可用的选项如下: 无 - 不应用预处理配置文件;屏幕 - 适用于远程桌面应用程序的预处理;扫描 - 适用于扫描文件的预处理;旧版 - 使用引擎的默认设置进行图像预处理,这是默认选项。
  • 比例 - 选定用户界面元素或图像的比例因子。数字越大,将图像放大得越大。这样可以更好地读取 OCR,建议小图像使用较大比例因子。如果想要缩小,0 至 1 之间的值也可接受。默认情况下,此值为 2。

    重要提示: 当比例因子大于 1 时,大尺寸图像可能会导致错误。
输出
  • 文本 ” - 提取的字符串。 此字段仅支持 string 变量。
  • “结果”- 提取的文字及其在屏幕上的位置。此字段仅支持 KeyValuePair <rectangle,string> 变量。
输入
  • 图像 - 要处理的图像。此字段仅支持 image 变量。
常见
  • “显示名称”- 活动的显示名称。
其他
  • “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
  • 属性

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.