activities
latest
false
- 概述
- 用户界面自动化
- 通过用户界面自动化实现自动化的应用程序和技术
- 项目兼容性
- UI-ANA-016 - 拉取打开浏览器 URL
- UI-ANA-017 - 出错时继续 True
- UI-ANA-018 - 列出 OCR/图像活动
- UI-DBP-006 - 容器使用情况
- UI-DBP-013 - Excel 自动化误用
- UI-DBP-030 - 选取器中的禁止变量使用情况
- UI-PRR-001 - 模拟单击
- UI-PRR-002 - 模拟键入
- UI-PRR-003 - 打开应用程序误用
- UI-PRR-004 - 硬编码延迟
- UI-REL-001 - 选取器中的大 IDX
- UI-SEC-004 - 选取器电子邮件数据
- UI-SEC-010 - 应用程序/Url 限制
- UI-USG-011 - 不允许的属性
- UX-SEC-010 - 应用程序/Url 限制
- UX-DBP-029 - 使用不安全的密码
- UI-PST-001 - 项目设置中的审核日志级别
- UiPath 浏览器迁移工具
- 剪切区域
- 计算机视觉录制器
- 激活
- 锚点基准
- 附加浏览器
- 附加窗口
- 阻止用户输入
- 标注
- 选中
- 单击
- 单击图像
- 单击图像触发器
- 单击 OCR 文本
- 单击文本
- 单击触发器
- 关闭应用程序
- 关闭选项卡
- 关闭窗口
- 上下文感知锚点
- 复制选定文本
- 元素属性更改触发器
- 存在元素
- 元素作用域
- 元素状态更改触发器
- 导出用户界面树
- 提取结构化数据
- 查找子元素
- 查找元素
- 查找图像
- 查找图像匹配项
- 查找 OCR 文本位置
- 查找相对元素
- 查找文本位置
- 获取活动窗口
- 获取上级
- 获取属性
- 获取事件信息
- 从剪贴板获取
- 获取全文
- 获取 OCR 文本
- 获取密码
- 获取位置
- 获取源元素
- 获取文本
- 获取可见文本
- 返回
- 前往
- 转至主页
- Google Cloud Vision OCR
- 隐藏窗口
- 高亮显示
- 热键触发器
- 悬停
- 悬停在图像上方
- 悬停在 OCR 文本上方
- 悬停文本
- 存在图像
- 在屏幕上指定
- 注入 .NET 代码
- 插入 Js 脚本
- 调用 ActiveX 方法
- 按键触发器
- 加载图像
- 最大化窗口
- Microsoft Azure 计算机视觉 OCR
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- 最小化窗口
- 监控事件
- 鼠标触发器
- 移动窗口
- 导航至
- 存在 OCR 文本
- 在元素出现时
- 在元素消失时
- 在图像出现时
- 在图像消失时
- 打开应用程序
- 打开浏览器
- 刷新浏览器
- 重播用户事件
- 还原窗口
- 保存图像
- 选择项目
- 选择多个项目
- 发送热键
- 设置剪切区域
- 设置焦点
- 设置文本
- 设置为剪贴板
- 设置网页属性
- 显示窗口
- 启动进程
- 系统触发器
- 截取屏幕截图
- Tesseract OCR
- 存在文本
- 工具提示
- 键入
- 输入安全文本
- 使用前台
- 等待属性
- 等待元素消失
- 等待图像消失
- Computer Vision Local Server
- 移动自动化
- 终端
重要 :
请注意此内容已使用机器翻译进行了部分本地化。
用户界面自动化活动
Last updated 2024年10月28日
Tesseract OCR
UiPath.Core.Activities.GoogleOCR
使用 Tesseract OCR 引擎从指定的用户界面元素或图像中提取字符串及其信息。此操作可与其他 OCR 活动 (单击 OCR 文本、悬停在 OCR 文本上方、双击 OCR 文本、获取 OCR 文本、查找 OCR 文本位置) 一起使用。
注意:UiPath 中使用的 Tesseract OCR 引擎已更新至版本 4.0。您可在此处详细了解此引擎的功能。
注意: 此活动不支持旋转的文档,因此此类文档的结果无法预测。
在运行 Tesseract OCR 引擎之前,请在相应的计算机上安装 Visual C++ Redistributable x86(32 位)。即使您的操作系统是 64 位 (x64),您仍需要安装 x86(32 位)版本。访问 Visual C++ Redistributable 最新支持的下载,选择并安装符合您要求的 Visual C++ 版本。
选项
- 允许的字符 - OCR 引擎根据此处指定的字符提取给定字符串。
- 已拒绝的字符 - OCR 引擎在不考虑此处指定的字符情况下提取给定字符串。
- 反相- 如果选中该复选框,则系统会在抓取之前反转用户界面元素的颜色。这在背景颜色比文本颜色更深的情况下有用。
-
语言 - OCR 引擎从用户界面元素中提取字符串时所使用的语言。对于 Google OCR 引擎,该字段需要包含语言文件前缀,如表示罗马尼亚语的“ron”、表示意大利语的“ita”以及表示法语的“fra”。您可以在该页面找到支持的语言前缀。
注意:可以从此处下载语言文件夹并将其添加到本地文件夹%UserProfile%\.nuget\packages\uipath.vision\3.x.x\build\net461\tessdata
。在本地添加语言文件夹后,请确保重新启动 UiPath Studio 应用程序。 - “提取文字”- 如果选中此复选框,则会提取每个检测到的文字在屏幕上的所处位置。
- 配置文件 - 为指定图像或用户界面元素选择预处理配置文件,以实现更好的 OCR 读取。为指定的图像或用户界面元素选择一个预处理配置文件,以实现更好的 OCR 读取。可用的选项如下: 无 - 不应用预处理配置文件;屏幕 - 适用于远程桌面应用程序的预处理;扫描 - 适用于扫描文件的预处理;旧版 - 使用引擎的默认设置进行图像预处理,这是默认选项。
-
比例 - 选定用户界面元素或图像的比例因子。数字越大,将图像放大得越大。这样可以更好地读取 OCR,建议小图像使用较大比例因子。如果想要缩小,0 至 1 之间的值也可接受。默认情况下,此值为 2。
重要提示: 当比例因子大于 1 时,大尺寸图像可能会导致错误。
输出
- “文本 ” - 提取的字符串。 此字段仅支持
string
变量。 - “结果”- 提取的文字及其在屏幕上的位置。此字段仅支持
KeyValuePair <rectangle,string>
变量。
输入
- 图像 - 要处理的图像。此字段仅支持
image
变量。
常见
- “显示名称”- 活动的显示名称。
其他
- “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。