用户界面自动化活动

上次更新日期 2025年3月13日

Tesseract OCR

UiPath.Core.Activities.GoogleOCR

使用 Tesseract OCR 引擎从指定的用户界面元素或图像中提取字符串及其信息。此操作可与其他 OCR 活动 (单击 OCR 文本、悬停在 OCR 文本上方、双击 OCR 文本、获取 OCR 文本、查找 OCR 文本位置) 一起使用。

注意：UiPath 中使用的 Tesseract OCR 引擎已更新至版本 4.0。您可在此处详细了解此引擎的功能。

注意：此活动不支持旋转的文档，因此此类文档的结果无法预测。

先决条件

在运行 Tesseract OCR 引擎之前，请在相应的计算机上安装 Visual C++ Redistributable x86（32 位）。即使您的操作系统是 64 位 (x64)，您仍需要安装 x86（32 位）版本。访问 Visual C++ Redistributable 最新支持的下载，选择并安装符合您要求的 Visual C++ 版本。

属性

选项

允许的字符 - OCR 引擎根据此处指定的字符提取给定字符串。
已拒绝的字符 - OCR 引擎在不考虑此处指定的字符情况下提取给定字符串。
反相- 如果选中该复选框，则系统会在抓取之前反转用户界面元素的颜色。这在背景颜色比文本颜色更深的情况下有用。
语言 - OCR 引擎从用户界面元素中提取字符串时所使用的语言。对于 Google OCR 引擎，该字段需要包含语言文件前缀，如表示罗马尼亚语的“ron”、表示意大利语的“ita”以及表示法语的“fra”。您可以在该页面找到支持的语言前缀。

注意：可以从此处下载语言文件夹并将其添加到本地文件夹 %UserProfile%\.nuget\packages\uipath.vision\3.x.x\build\net461\tessdata。在本地添加语言文件夹后，请确保重新启动 UiPath Studio 应用程序。
“提取文字”- 如果选中此复选框，则会提取每个检测到的文字在屏幕上的所处位置。
配置文件 - 为指定图像或用户界面元素选择预处理配置文件，以实现更好的 OCR 读取。为指定的图像或用户界面元素选择一个预处理配置文件，以实现更好的 OCR 读取。可用的选项如下: 无 - 不应用预处理配置文件；屏幕 - 适用于远程桌面应用程序的预处理；扫描 - 适用于扫描文件的预处理；旧版 - 使用引擎的默认设置进行图像预处理，这是默认选项。
比例 - 选定用户界面元素或图像的比例因子。数字越大，将图像放大得越大。这样可以更好地读取 OCR，建议小图像使用较大比例因子。如果想要缩小，0 至 1 之间的值也可接受。默认情况下，此值为 2。

重要提示：当比例因子大于 1 时，大尺寸图像可能会导致错误。