活动
最新
False
- 概述
- 用户界面自动化
- 通过用户界面自动化实现自动化的应用程序和技术
- UI-ANA-016 - 拉取打开浏览器 URL
- UI-ANA-017 - 出错时继续 True
- UI-ANA-018 - 列出 OCR/图像活动
- UI-DBP-006 - 容器使用情况
- UI-DBP-013 - Excel 自动化误用
- UI-DBP-030 - 选取器中的禁止变量使用情况
- ST-DBP-021 - 硬编码超时
- UI-PRR-001 - 模拟单击
- UI-PRR-002 - 模拟键入
- UI-PRR-003 - 打开应用程序误用
- UI-PRR-004 - 硬编码延迟
- UI-REL-001 - 选取器中的大 IDX
- UI-SEC-004 - 选取器电子邮件数据
- UI-SEC-010 - 应用程序/Url 限制
- UI-USG-011 - 不允许的属性
- SY-USG-013 - 私有文件调用
- SY-USG-014 - 执行模板占位符不正确
- UiPath 浏览器迁移工具
- 计算机视觉录制器
- 激活
- 锚点基准
- 附加浏览器
- 附加窗口
- 阻止用户输入
- 调用事务
- 标注
- 选中
- 单击
- 单击图像
- 单击图像触发器
- 单击 OCR 文本
- 单击屏幕上的图片
- 单击文本
- 单击工具栏按钮
- 单击触发器
- 关闭应用程序
- 关闭选项卡
- 关闭窗口
- 上下文感知锚点
- 复制选定文本
- 元素属性更改触发器
- 存在元素
- 元素作用域
- 元素状态更改触发器
- 展开 ALV 层次结构表格
- 展开 ALV 树
- 展开树
- 导出用户界面树
- 提取结构化数据
- 查找子元素
- 查找元素
- 查找图像
- 查找图像匹配项
- 查找 OCR 文本位置
- 查找相对元素
- 查找文本位置
- 获取活动窗口
- 获取上级
- 获取属性
- 获取事件信息
- 从剪贴板获取
- 获取全文
- 获取 OCR 文本
- 获取密码
- 获取位置
- 获取源元素
- 获取文本
- 获取可见文本
- 返回
- 前往
- 转至主页
- Google Cloud Vision OCR
- 隐藏窗口
- 高亮显示
- 热键触发器
- 悬停
- 悬停在图像上方
- 悬停在 OCR 文本上方
- 悬停文本
- 存在图像
- 在屏幕上指定
- 注入 .NET 代码
- 注入 JS 脚本
- 调用 ActiveX 方法
- 按键触发器
- 加载图像
- 最大化窗口
- Microsoft Azure 计算机视觉 OCR
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- 最小化窗口
- 监控事件
- 鼠标触发器
- 移动窗口
- 导航至
- 存在 OCR 文本
- 在元素出现时
- 在元素消失时
- 在图像出现时
- 在图像消失时
- 打开应用程序
- 打开浏览器
- 读取状态栏
- 刷新浏览器
- 重播用户事件
- 还原窗口
- SAP 登录
- SAP 登录
- SAP 会话属性更改触发器
- 保存图像
- 在日历中选择日期
- 选择项目
- 选择菜单项
- 选择多个项目
- 发送热键
- 设置剪切区域
- 设置焦点
- 设置文本
- 设置为剪贴板
- 设置网页属性
- 显示窗口
- 启动进程
- 系统触发器
- 表格单元范围
- 截取屏幕截图
- Tesseract OCR
- 存在文本
- 工具提示
- 键入
- 输入安全文本
- 使用前台
- 等待属性
- 等待元素消失
- 等待图像消失
- Computer Vision Local Server
- 移动自动化
- 终端
用户界面自动化活动
上次更新日期 2024年4月26日
Tesseract OCR
UiPath.Core.Activities.GoogleOCR
使用 Tesseract OCR 引擎从指定的用户界面元素或图像中提取字符串及其信息。此操作可与其他 OCR 活动 (单击 OCR 文本、悬停在 OCR 文本上方、双击 OCR 文本、获取 OCR 文本、查找 OCR 文本位置) 一起使用。
注意: UiPath 中使用的Tesseract OCR引擎已更新至版本 4.0。 您可以在此处找到有关此引擎功能的更多信息。
注意: 此活动不支持旋转的文档,因此此类文档的结果无法预测。
选项
- 允许的字符 - OCR 引擎根据此处指定的字符提取给定字符串。
- 已拒绝的字符 - OCR 引擎在不考虑此处指定的字符情况下提取给定字符串。
- 反相- 如果选中该复选框,则系统会在抓取之前反转用户界面元素的颜色。这在背景颜色比文本颜色更深的情况下有用。
-
语言 - OCR 引擎从用户界面元素中提取字符串时所使用的语言。对于 Google OCR 引擎,该字段需要包含语言文件前缀,如表示罗马尼亚语的“ron”、表示意大利语的“ita”以及表示法语的“fra”。您可以在该页面找到支持的语言前缀。
注意:可以从此处下载语言文件夹并将其添加到本地文件夹%UserProfile%\.nuget\packages\uipath.vision\3.x.x\build\net461\tessdata
。 在本地添加语言文件夹后,请确保重新启动UiPath Studio应用程序。 - “提取文字”- 如果选中此复选框,则会提取每个检测到的文字在屏幕上的所处位置。
- 配置文件 - 为指定图像或用户界面元素选择预处理配置文件,以实现更好的 OCR 读取。为指定的图像或用户界面元素选择一个预处理配置文件,以实现更好的 OCR 读取。可用的选项如下: 无 - 不应用预处理配置文件;屏幕 - 适用于远程桌面应用程序的预处理;扫描 - 适用于扫描文件的预处理;旧版 - 使用引擎的默认设置进行图像预处理,这是默认选项。
-
比例 - 选定用户界面元素或图像的比例因子。数字越大,将图像放大得越大。这样可以更好地读取 OCR,建议小图像使用较大比例因子。如果想要缩小,0 至 1 之间的值也可接受。默认情况下,此值为 2。
重要提示: 当比例因子大于 1 时,大尺寸图像可能会导致错误。
输出
- “文本 ” - 提取的字符串。 此字段仅支持
string
变量。 - “结果”- 提取的文字及其在屏幕上的位置。此字段仅支持
KeyValuePair <rectangle,string>
变量。
输入
- 图像 - 要处理的图像。此字段仅支持
image
变量。
常见
- “显示名称”- 活动的显示名称。
其他
- “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。