activities
latest
false
重要 :
请注意,此内容已使用机器翻译进行了部分本地化。 新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

用户界面自动化活动

上次更新日期 2026年3月9日

Tesseract OCR

UiPath.Core.Activities.GoogleOCR

使用 Tesseract OCR 引擎从指定的用户界面元素或图像中提取字符串及其信息。可与其他 OCR 活动一起使用,例如单击 OCR 文本悬停在 OCR 文本上方双击 OCR 文本获取 OCR 文本查找 OCR 文本位置

备注:
  • UiPath 中使用的 Tesseract OCR 引擎已更新至版本 4.0。您可在此处详细了解此引擎的功能。
  • 此活动不支持轮换文档,因此,此类文档的结果是不可预测的。

先决条件

在运行 Tesseract OCR 引擎之前,请在相应的计算机上安装 Visual C++ Redistributable x86(32 位)。即使您的操作系统是 64 位 (x64),您仍需要安装 x86(32 位)版本。访问 Visual C++ Redistributable 最新支持的下载,选择并安装符合您要求的 Visual C++ 版本。

限制

“Tesseract OCR 引擎”不支持 Windows 10 N 版,因为此 Windows 版本不包含媒体功能包。为确保兼容性,我们建议您升级到包含所有必需媒体组件的 Windows 10 专业版。

属性

选项
  • “允许的字符”- OCR 引擎根据此处指定的字符提取给定字符串。

  • “已拒绝的字符”- OCR 引擎在不考虑此处指定的字符情况下提取给定字符串。

  • “反相”- 如果选中该复选框,则系统会在抓取之前反转用户界面元素的颜色。这适用于背景色比文本色更深的情况。

  • 语言- OCR 引擎从用户界面元素中提取字符串时所使用的语言。对于 Google OCR 引擎,该字段需要包含语言文件前缀,如表示罗马尼亚语的“ron”、表示意大利语的“ita”以及表示法语的“fra”。您可以在该页面找到支持的语言前缀。

    备注:

    可以从此处下载语言文件夹并将其添加到本地文件夹 %UserProfile%\.nuget\packages\uipath.vision\3.x.x\build\net461\tessdata。在本地添加语言文件夹后,请确保重新启动 UiPath Studio 应用程序。

  • “提取文字”- 如果选中此复选框,则会提取每个检测到的文字在屏幕上的所处位置。

  • “配置文件”- 为指定的图像或用户界面元素选择预处理配置文件,以改进 OCR 读取。可用的选项如下:无 - 不应用预处理配置文件;屏幕 - 适用于远程桌面应用程序的预处理;扫描 - 适用于扫描文件的预处理;旧版 - 使用引擎的默认设置进行图像预处理,这是默认选项。

  • Scale - The scaling factor of the selected UI element or image. The higher the number is, the more you enlarge the image. This can provide a better OCR read and it is recommended with small images. If you want to scale down, values between 0 and 1 are also accepted. By default, the value is 2.

    重要提示:

    当缩放因子大于 1 时,大尺寸图像可能会导致错误。

输出
  • “文本”- 提取的字符串。该字段仅支持“string”变量。
  • “结果”- 提取的文字及其在屏幕上的位置。该字段仅支持“KeyValuePair <rectangle,string>”变量。
输入
  • “图像”- 要处理的图像。该字段仅支持“image”变量。
常见
  • “显示名称”- 活动的显示名称。
其他
  • “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
  • 先决条件
  • 限制
  • 属性

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新