用户界面自动化活动

上次更新日期 2025年2月19日

Google Cloud Vision OCR

UiPath.Core.Activities.GoogleCloudOCR

使用 Google Cloud OCR 引擎从指定的用户界面元素或图像中提取字符串及其信息。它可以与其他 OCR 活动一起使用，例如单击 OCR 文本、双击 OCR 文本、悬停在 OCR 文本上方、获取 OCR 文本和查找 OCR 文本位置。

检测模式 - 指定要向 Google Cloud Vision OCR 发送的检测标记。选择以下两个选项之一：文本检测和文档文本检测。默认值为文本检测。

重要提示： “ 文本检测 ”模式不会报告已识别单词的置信度值。在“ 数字化文档” 活动中使用 OCR 引擎时，所有单词的所有 OCR 可信度值都将设置为 -1（未知）。
“提取文字”- 如果选中此复选框，则会提取每个检测到的文字在屏幕上的所处位置。
语言 - OCR 引擎从用户界面元素或图像中提取文本所使用的语言。对于 Google OCR 引擎，该字段需要包含语言文件前缀，如表示罗马尼亚语的“rom”、表示意大利语的“ita”以及表示法语的“fra”。您可以在该页面找到支持的语言前缀。
根据需要调整尺寸至最大限制 - 选中此项时，引擎会尝试缩小目标图像的尺寸，使其维持在 Google Cloud Vision 引擎的尺寸限制范围内。默认情况下，该复选框处于未选中状态。
比例 - 选定用户界面元素或图像的比例因子。数字越大，将图像放大得越大。这样可以更好地读取 OCR，建议小图像使用较大比例因子。如果想要缩小，0 至 1 之间的值也可接受。默认情况下，此值为 2。

重要提示：当比例因子大于 1 时，大尺寸图像可能会导致错误。