activities
latest
false
- 概述
- 用户界面自动化
- 通过用户界面自动化实现自动化的应用程序和技术
- 项目兼容性
- UI-ANA-016 - 拉取打开浏览器 URL
- UI-ANA-017 - 出错时继续 True
- UI-ANA-018 - 列出 OCR/图像活动
- UI-DBP-006 - 容器使用情况
- UI-DBP-013 - Excel 自动化误用
- UI-DBP-030 - 选取器中的禁止变量使用情况
- UI-PRR-001 - 模拟单击
- UI-PRR-002 - 模拟键入
- UI-PRR-003 - 打开应用程序误用
- UI-PRR-004 - 硬编码延迟
- UI-REL-001 - 选取器中的大 IDX
- UI-SEC-004 - 选取器电子邮件数据
- UI-SEC-010 - 应用程序/Url 限制
- UI-USG-011 - 不允许的属性
- UX-SEC-010 - 应用程序/Url 限制
- UX-DBP-029 - 使用不安全的密码
- UI-PST-001 - 项目设置中的审核日志级别
- UiPath 浏览器迁移工具
- 剪切区域
- 计算机视觉录制器
- 激活
- 锚点基准
- 附加浏览器
- 附加窗口
- 阻止用户输入
- 标注
- 选中
- 单击
- 单击图像
- 单击图像触发器
- 单击 OCR 文本
- 单击文本
- 单击触发器
- 关闭应用程序
- 关闭选项卡
- 关闭窗口
- 上下文感知锚点
- 复制选定文本
- 元素属性更改触发器
- 存在元素
- 元素作用域
- 元素状态更改触发器
- 导出用户界面树
- 提取结构化数据
- 查找子元素
- 查找元素
- 查找图像
- 查找图像匹配项
- 查找 OCR 文本位置
- 查找相对元素
- 查找文本位置
- 获取活动窗口
- 获取上级
- 获取属性
- 获取事件信息
- 从剪贴板获取
- 获取全文
- 获取 OCR 文本
- 获取密码
- 获取位置
- 获取源元素
- 获取文本
- 获取可见文本
- 返回
- 前往
- 转至主页
- Google Cloud Vision OCR
- 隐藏窗口
- 高亮显示
- 热键触发器
- 悬停
- 悬停在图像上方
- 悬停在 OCR 文本上方
- 悬停文本
- 存在图像
- 在屏幕上指定
- 注入 .NET 代码
- 插入 Js 脚本
- 调用 ActiveX 方法
- 按键触发器
- 加载图像
- 最大化窗口
- Microsoft Azure 计算机视觉 OCR
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- 最小化窗口
- 监控事件
- 鼠标触发器
- 移动窗口
- 导航至
- 存在 OCR 文本
- 在元素出现时
- 在元素消失时
- 在图像出现时
- 在图像消失时
- 打开应用程序
- 打开浏览器
- 刷新浏览器
- 重播用户事件
- 还原窗口
- 保存图像
- 选择项目
- 选择多个项目
- 发送热键
- 设置剪切区域
- 设置焦点
- 设置文本
- 设置为剪贴板
- 设置网页属性
- 显示窗口
- 启动进程
- 系统触发器
- 截取屏幕截图
- Tesseract OCR
- 存在文本
- 工具提示
- 键入
- 输入安全文本
- 使用前台
- 等待属性
- 等待元素消失
- 等待图像消失
- Computer Vision Local Server
- 移动自动化
- 终端
重要 :
请注意此内容已使用机器翻译进行了部分本地化。
新发布内容的本地化可能需要 1-2 周的时间才能完成。
用户界面自动化活动
上次更新日期 2024年12月4日
Google Cloud Vision OCR
UiPath.Core.Activities.GoogleCloudOCR
使用 Google Cloud OCR 引擎从指定的用户界面元素或图像中提取字符串及其信息。 它可以与其他 OCR 活动一起使用,例如 单击 OCR 文本、 双击 OCR 文本、 悬停在 OCR 文本上方、 获取 OCR 文本和 查找 OCR 文本位置。
常见
- “显示名称”- 活动的显示名称。
输入
- 图像 - 要处理的图像。此字段仅支持“图像”变量。
登录
- API 密钥 - 用于访问 Google Cloud OCR 的 API 密钥。
其他
- “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
选项
-
检测模式 - 指定要向 Google Cloud Vision OCR 发送的检测标记。选择以下两个选项之一:文本检测和文档文本检测。默认值为文本检测。
重要提示: “ 文本检测 ”模式不会报告已识别单词的置信度值。 在“ 数字化文档” 活动中使用 OCR 引擎时,所有单词的所有 OCR 可信度值都将设置为 -1(未知)。 - “提取文字”- 如果选中此复选框,则会提取每个检测到的文字在屏幕上的所处位置。
- 语言 - OCR 引擎从用户界面元素或图像中提取文本所使用的语言。对于 Google OCR 引擎,该字段需要包含语言文件前缀,如表示罗马尼亚语的“rom”、表示意大利语的“ita”以及表示法语的“fra”。您可以在该页面找到支持的语言前缀。
- 根据需要调整尺寸至最大限制 - 选中此项时,引擎会尝试缩小目标图像的尺寸,使其维持在 Google Cloud Vision 引擎的尺寸限制范围内。默认情况下,该复选框处于未选中状态。
-
比例 - 选定用户界面元素或图像的比例因子。数字越大,将图像放大得越大。这样可以更好地读取 OCR,建议小图像使用较大比例因子。如果想要缩小,0 至 1 之间的值也可接受。默认情况下,此值为 2。
重要提示: 当比例因子大于 1 时,大尺寸图像可能会导致错误。
输出
- 文本- 提取的文本。此字段仅支持
string
变量。 - “结果”- 提取的文字及其在屏幕上的位置。此字段仅支持
KeyValuePair<rectangle,string>
变量。