- 概述
- 用户界面自动化
- 关于“用户界面自动化”活动包
- 通过用户界面自动化实现自动化的应用程序和技术
- 项目兼容性
- UI-ANA-016 - 拉取打开浏览器 URL
- UI-ANA-017 - 出错时继续 True
- UI-ANA-018 - 列出 OCR/图像活动
- UI-DBP-006 - 容器使用情况
- UI-DBP-013 - Excel 自动化误用
- UI-DBP-030 - 选取器中的禁止变量使用情况
- UI-DBP-031 - 活动验证
- UI-PRR-001 - 模拟单击
- UI-PRR-002 - 模拟键入
- UI-PRR-003 - 打开应用程序误用
- UI-PRR-004 - 硬编码延迟
- UI-REL-001 - 选取器中的大 IDX
- UI-SEC-004 - 选取器电子邮件数据
- UI-SEC-010 - 应用程序/Url 限制
- UI-USG-011 - 不允许的属性
- UX-SEC-010 - 应用程序/Url 限制
- UX-DBP-029 - 使用不安全的密码
- UI-PST-001 - 项目设置中的审核日志级别
- UiPath 浏览器迁移工具
- 剪切区域
- 计算机视觉录制器
- 活动索引
- 激活
- 锚点基准
- 附加浏览器
- 附加窗口
- 阻止用户输入
- 标注
- 选中
- 单击
- 单击图像
- 单击图像触发器
- 单击 OCR 文本
- 单击文本
- 单击触发器
- 关闭应用程序
- 关闭选项卡
- 关闭窗口
- 上下文感知锚点
- 复制选定文本
- 元素属性更改触发器
- 存在元素
- 元素作用域
- 元素状态更改触发器
- 导出用户界面树
- 提取结构化数据
- 查找子元素
- 查找元素
- 查找图像
- 查找图像匹配项
- 查找 OCR 文本位置
- 查找相对元素
- 查找文本位置
- 获取活动窗口
- 获取上级
- 获取属性
- 获取事件信息
- 从剪贴板获取
- 获取全文
- 获取 OCR 文本
- 获取密码
- 获取位置
- 获取源元素
- 获取文本
- 获取可见文本
- 返回
- 前往
- 转至主页
- Google Cloud Vision OCR
- 隐藏窗口
- 高亮显示
- 热键触发器
- 悬停
- 悬停在图像上方
- 悬停在 OCR 文本上方
- 悬停文本
- 存在图像
- 在屏幕上指定
- 注入 .NET 代码
- 插入 Js 脚本
- 调用 ActiveX 方法
- 按键触发器
- 加载图像
- 最大化窗口
- Microsoft Azure 计算机视觉 OCR
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- 最小化窗口
- 监控事件
- 鼠标触发器
- 移动窗口
- 导航至
- 存在 OCR 文本
- 在元素出现时
- 在元素消失时
- 在图像出现时
- 在图像消失时
- 打开应用程序
- 打开浏览器
- 刷新浏览器
- 重播用户事件
- 还原窗口
- 保存图像
- 选择项目
- 选择多个项目
- 发送热键
- 设置剪切区域
- 设置焦点
- 设置文本
- 设置为剪贴板
- 设置网页属性
- 显示窗口
- 启动进程
- 系统触发器
- 截取屏幕截图
- Tesseract OCR
- 存在文本
- 工具提示
- 键入
- 输入安全文本
- 使用前台
- 等待属性
- 等待元素消失
- 等待图像消失
- Computer Vision Local Server
- 移动自动化
- 终端

用户界面自动化活动
单击
UiPath.UIAutomationNext.Activities.NClick
描述
单击指定的用户界面元素,例如按钮或链接。 可以将其配置为使用任何鼠标键或双击,并且可以与修饰键结合使用。
此活动必须添加到“使用应用程序/浏览器”活动中。
如要在“使用应用程序/浏览器”活动之外使用该活动,您需要提供一个“输入”元素。
此活动可与对象存储库兼容。
项目兼容性
Windows - 旧版 | Windows | 跨平台
Windows 和跨平台配置
-
在作用域内工作 - 选择呈现要自动化的网页应用程序的浏览器选项卡。
-
在屏幕上指明目标
- 指定要用作目标的用户界面元素。指定目标后,选择加号按钮以访问以下选项:
- Indicate target on screen - Indicate the target again.
- “编辑目标” - 打开选择模式以配置目标。
-
验证- 定义活动执行验证步骤。
- 无- 表示未对目标元素执行验证。
- 元素已出现- 检查元素是否出现。
- 元素消失- 检查元素是否消失。
- 元素文本已更改- 检查元素文本是否有任何更改。
属性面板
输入/输出
- “输入元素” - 要在其上执行活动的用户界面元素,存储在
UIElement对象中。此字段仅支持UIElement对象。可以从其他用户界面自动化活动的“输出元素”属性字段中获取该对象。 - “输出元素” - 输出目标用户界面元素,并将其存储在
UIElement对象中,该对象可进一步用于与其他活动针对同一元素。
选项
- 单击类型- 从下拉菜单中选择要执行的单击类型:单击、双击、向下或向上。默认选项为“单击” 。
- “鼠标键” - 从下拉菜单中选择要用于单击的鼠标键: “左” 、 “中”或“右键” 。默认选项为“左” 。
- 修饰键- 添加一个或多个修饰键,以与单击组合使用。可用的选项如下: Alt 、 Ctrl 、 Shift和Win 。
- 更改禁用的元素- 如果选中,则即使禁用了指定的用户界面元素,该活动也仍会执行操作。该字段仅支持“布尔值”( True 、 False )。默认值为False 。如果将“输入模式”属性设置为“硬件事件”,则此属性不适用。
- 激活 - 将用户界面元素移至前台,并在单击该元素前将其激活。该字段仅支持“布尔值”(True 和 False)。默认值为 True。
- “光标移动类型”- 指定鼠标光标执行的运动类型。有两个可用选项:
- 即时- 光标跳至目标位置。这是默认选项。
- “平滑” - 光标以渐进的方式移动。仅当使用“硬件事件”输入模式时,该设置才生效。
- 取消阻止输入- 当单击操作触发模态对话框或阻止进一步交互的任何其他用户界面元素时,应使用。此操作仅适用于“模拟”输入方法。该字段仅支持“布尔值”( True 、 False )。
- Input mode - Select which method the Robot should use to interact with the target application:
- 与浏览器相同- 从父级“使用浏览器”活动中使用“输入模式”设置。
- 硬件事件- 充当真实用户,使用“硬件”输入(例如移动鼠标或敲击键盘)与应用程序交互。这些是直接发送到操作系统的硬件触发事件。虽然此方法可提供 100% 的行为模拟,但某些事件偶尔可能会丢失。作为开发者,您有责任确保所有事件都能可靠地到达目标应用程序。
- Chromium API - 使用调试器 API 执行操作。仅适用于 Chrome 和 Edge 元素。一次性发送所有文本。即使目标应用程序不在焦点中,也适用。
- 模拟 - 使用辅助功能 API 模拟单击。适用于浏览器。一次性发送所有文本。此输入法在后台运行 (即使目标应用程序未获得焦点)。
- Healing Agent 模式- 根据流程或作业级别的监管或 Orchestrator 设置,配置此活动的 Healing Agent 行为。
- 已禁用 - 关闭此活动的 Healing Agent。
- 继承作业设置- 在流程或作业级别应用在监管或 Orchestrator 中定义的设置。
- “仅建议” - 允许 Healing Agent 提供有关如何修复正在运行的作业中的用户界面自动化问题的建议,但前提是监管或 Orchestrator 设置允许。
- 与应用程序/浏览器相同- 从父级“使用应用程序/浏览器”活动继承配置。
- “出错时继续”- 指定在活动抛出错误时是否应继续自动化操作。该字段仅支持“布尔值”(True 和 False)。默认值为 FALSE。因此,如果该字段为空且活动引发错误,系统将停止执行项目。如果该值设为 True,则无论出现何种错误,系统都将继续执行项目。
目标
-
展开目标属性- 显示目标和锚点属性。这将隐藏其他活动属性,仅显示与目标相关的属性。
-
“折叠目标属性” - 隐藏“目标” 和锚点属性。这将隐藏目标相关属性并显示活动属性。
-
定位方式- 要用于识别元素的选取器类型。从下拉菜单中选择此属性后,可将其设置为任意组合:
- 无
- 精确选取器- 为目标用户界面元素生成的精确选取器。
- 模糊选取器- 模糊选取器参数。
- Computer Vision - 要将 Computer Vision 用作定位方法,您需要转到“项目设置” > “Computer Vision” ,并确保设置正确的服务器端点。您可以原样保留此字段,并使用 UiPath Cloud(默认情况下已填写),也可以通过选择特定于服务器区域的任何其他公共端点或您自己的本地部署服务器来输入其他值。将 Computer Vision 用作定位方法的另一种方法是将“使用本地服务器”设置为True 。这意味着UiPath.ComputerVision.LocalServer包已安装在项目中。启用“本地服务器”后,服务器值将被覆盖。但是,“本地服务器”在跨平台项目中不可用。
- CV 控件类型- 表示使用 Computer Vision 识别的控件的类型。
- CV 文本- 表示使用 Computer Vision 识别的文本。
- 计算机视觉文本出现次数- 当找到多个匹配项时,指示要使用的特定出现次数。
- 计算机视觉文本准确性- 指示 OCR 文本匹配的准确性级别。
- 语义选取器- 利用大型语言模型 (LLM) 为用户界面元素生成功能性、拟人化的描述。这些描述可靠性极高,既能适应用户界面的变更,又能在传统选取器失效时显着增强自动化弹性。
- 图像(仅限 Windows)
- 图像准确性- 指示图像匹配的准确性级别。
- 图像出现次数- 当找到多个匹配项时,指示要使用的特定出现次数。
- 原生文本(仅限 Windows)
- 原生文本- 要查找来识别用户界面元素的文本。
- 原生文本出现次数- 当找到多个匹配项时,指示要使用的特定出现次数。
-
窗口选取器(应用程序实例) - 应用程序窗口的选取器。仅在窗口附加模式设置为应用程序实例时可用。
-
等待页面加载- 在执行操作之前,等待应用程序做好接受输入的准备。选项包括:
- “无”- 不等待目标变为就绪状态。
- “交互式”– 等待直到加载了应用程序的一部分。
- “完整”– 等待整个应用程序被加载。
-
可见性检查- 启用后,该活动还会检查用户界面元素是否可见。您可以从下拉菜单中选择以下三个选项之一:
- 无- 不检查可见性。
- 交互式(用于模糊选取器)- 默认选项。检查元素是否可能可见,忽略页面滚动和其他应用程序的阻碍或者应用程序已最小化的情况。当尝试确保您没有以 DOM 中存在但隐藏的不可见元素为目标时,此检查非常有用。
- 完全可见- 检查用户界面元素是否可见。
-
响应式网站- 启用响应式网站布局。
-
单击偏移量- 指定单击活动的偏移量,该偏移量可以进一步配置。
- “锚点” - 描述光标从“偏移 X”和“偏移 Y”属性添加的偏移量的起点。提供以下选项:左上、右上、左下、右下和中间。默认情况下,选择“中心” 。
- 偏移 X - 根据“锚点”字段中选择的选项对光标位置进行的水平位移。此字段仅支持
Int32变量。 - 偏移 Y - 光标位置根据“锚点”字段中选择的选项而进行的垂直位移。此字段仅支持
Int32变量。
计时
- Delay before - Delay (in seconds) between the time the previous activity is completed and the time this activity begins performing any operations. The default value is 0.2 seconds. Adding a delay between activities ensures that one activity has enough time to complete before the next activity begins.
- Delay after - Delay (in seconds) between the time this activity is completed and the time the next activity begins any operations. The default value is 0.3 seconds. Adding a delay between activities ensures that one activity has enough time to complete before the next activity begins.
- “超时” - 指定在引发错误之前等待执行活动的时间(以秒为单位)。默认值为 30 秒。
Windows - 旧版配置
- 选择“在应用程序/浏览器中指明” ,以指定用作目标的用户界面元素。
指定目标后,选择“菜单”
按钮访问以下选项:
- Indicate target on screen - Indicate the target again.
- “编辑目标” - 打开选择模式以配置目标。
- 添加验证/删除验证- 在活动卡中添加或删除“在屏幕上指定验证目标”功能。默认情况下会启用验证执行。
- 删除信息性屏幕截图 - 删除目标应用程序或网页的屏幕截图。
- 添加到对象存储库- 将当前用户界面元素添加到库项目中,这样就可以在整个自动化流程中重用该元素。
- 单击类型- 从下拉菜单中选择要执行的单击类型:单击、双击、向下或向上。默认选项为“单击” 。
- “鼠标键” - 从下拉菜单中选择要用于单击的鼠标键: “左” 、 “中”或“右键” 。默认选项为“左” 。
- 在屏幕上指定验证目标- 指定要用作目标的用户界面元素,以及在执行操作后应显示或消失的用户界面元素。当您要确保在运行时正确执行活动所执行的特定操作时,请使用此功能。这在自动化流程中特别有用,因为您需要确认特定用户界面元素由于操作而显示或消失。它增加了额外的验证层,以确保流程按预期运行。因此,如果您的自动化流程取决于某些步骤的正确执行,您可能需要验证执行情况。可以从“项目设置”或从活动主体中选择“添加验证”来启用此功能。
属性面板
常见
-
“出错时继续” - 指定在活动抛出错误时是否应继续自动化操作。此字段仅支持
Boolean值( True , False )。默认值为False 。因此,如果该字段为空且活动引发错误,系统将停止执行项目。如果该值设为True ,则无论出现何种错误,系统都将继续执行项目。 -
Delay after - Delay (in seconds) between the time this activity is completed and the time the next activity begins any operations. The default value is 0.3 seconds. Adding a delay between activities ensures that one activity has enough time to complete before the next activity begins.
-
Delay before - Delay (in seconds) between the time the previous activity is completed and the time this activity begins performing any operations. The default value is 0.2 seconds. Adding a delay between activities ensures that one activity has enough time to complete before the next activity begins.
-
显示名称 -“设计器”面板中活动的显示名称。 指定目标时,系统会自动生成显示名称。
-
“超时” - 指定在引发错误之前等待执行活动的时间(以秒为单位)。默认值为 30 秒。
-
“单击类型” - 在“设计器” 面板中查看“单击类型” 。
-
“光标移动类型”- 指定鼠标光标执行的运动类型。有两个可用选项:
- 即时- 光标跳至目标位置。这是默认选项。
- “平滑” - 光标以渐进的方式移动。仅当使用“硬件事件”输入模式时,该设置才生效。
-
“鼠标键” - 在“设计器” 面板中查看“鼠标键” 。
-
“目标” - 目标元素。必须设置目标元素。在屏幕上指示之前,此字段设置为
(null)。指定目标后,将显示与指定元素相关的所有属性。- 单击偏移量- 指定单击活动的偏移量,您可以进一步配置该偏移量。
- “锚点” - 描述光标从“偏移 X”和“偏移 Y”属性添加的偏移量的起点。提供以下选项:左上、右上、左下、右下和中间。默认情况下,选择“中心” 。
- 偏移 X - 根据“锚点”字段中选择的选项对光标位置进行的水平位移。此字段仅支持
Int32变量。 - 偏移 Y - 光标位置根据“锚点”字段中选择的选项而进行的垂直位移。此字段仅支持
Int32变量。
- CV 控件类型- 表示使用 Computer Vision 识别的控件的类型。
- CV 文本- 表示使用 Computer Vision 识别的文本。
- Fuzzy selector - The parameters for the fuzzy selector.
- 原生文本- 用于标识用户界面元素的文本。
- 响应式网站- 启用响应式网站布局。
- 精确选取器- 为用户界面元素生成的精确选取器。
- 定位方式- 要用于识别元素的选取器类型。从下拉菜单中选择此属性后,可将其设置为任意组合:
- 无
- 精确选取器
- 模糊选取器
- 图像
- 原生文本
- Computer Vision - 要将 Computer Vision 用作定位方法,您需要转到“项目设置” > “Computer Vision” ,并确保设置正确的服务器端点。您可以原样保留此字段,并使用 UiPath Cloud(默认情况下已填写),也可以通过选择特定于服务器区域的任何其他公共端点或您自己的本地部署服务器来输入其他值。将 Computer Vision 用作定位方法的另一种方法是将“使用本地服务器”设置为True 。这意味着 UiPath.ComputerVision.LocalServer 包已安装在项目中。启用“本地服务器”后,服务器值将被覆盖。但是,“本地服务器”在跨平台项目中不可用。
- 语义选取器- 利用大型语言模型 (LLM) 生成功能性、拟人化的用户界面元素描述。这些描述可靠性极高,既能适应用户界面的变更,又能在传统选取器失效时显着增强自动化弹性。
- 可见性检查- 检查用户界面元素是否可见。您可以从下拉菜单中选择以下三个选项之一:
- 无- 不检查可见性。
- 交互式(用于模糊选取器)- 默认选项。检查元素是否可能可见,忽略页面滚动和其他应用程序的阻碍或者应用程序已最小化的情况。当尝试确保您没有以 DOM 中存在但隐藏的不可见元素为目标时,此检查非常有用。
- 完全可见
- 检查用户界面元素是否可见。
- 等待页面加载- 在执行操作之前,等待应用程序做好接受输入的准备。您可以从下拉菜单中选择以下三个选项之一:
- “无”- 不等待目标变为就绪状态。
- “交互式”– 等待直到加载了应用程序的一部分。
- “完整”– 等待整个应用程序被加载。
- 窗口选取器(应用程序实例) - 用于应用程序窗口的选取器。仅在窗口附加模式设置为“应用程序实例”时可用。
- 单击偏移量- 指定单击活动的偏移量,您可以进一步配置该偏移量。
-
验证执行 - 在运行时,验证活动执行的操作是否正确。这是通过指定应在执行操作后出现或消失的元素来完成的,该元素在活动执行后受到监控和验证。通过从上下文菜单中选择添加验证,可以从项目设置或每个活动的主体中启用此功能。
- “显示名称” - 验证操作的显示名称。系统会根据您选择的验证操作和元素自动填充此字段。设置“验证执行”后,此显示名称将在活动卡中可见。
- “重试” - 选择后,如果系统未获得预期结果,则将在活动超时的持续时间内再次执行此操作。默认情况下,该复选框处于选中状态。
- “目标” - 此目标用于指示要在运行时验证的元素。有关可在此属性下展开的属性字段的更多信息,请参阅上面的“目标”属性,因为属性的功能是相同的。
- “超时” - 等待验证元素出现、消失或更改的时间(以秒为单位)。如果选择“重试”复选框,则系统将在活动的“超时”属性中指定的持续时间内再次执行此操作,然后实施验证。默认值为 10 秒。
-
“输入元素” - 要在其上执行活动的用户界面元素,存储在
UIElement对象中。此字段仅支持UIElement对象。可以从其他用户界面自动化活动的“输出元素”属性字段中获取该对象。 -
“输出元素” - 输出目标用户界面元素,并将其存储在
UIElement对象中,该对象可进一步用于与其他活动针对同一元素。 -
“私有” - 选中后将不再以“Verbose”级别记录变量和参数的值。此字段仅支持
Boolean( True , False )值。默认值为False 。 -
激活 - 将用户界面元素移至前台,并在单击该元素前将其激活。该字段仅支持“布尔值”(True 和 False)。默认值为 True。
-
更改禁用的元素- 如果选中,则即使禁用了指定的用户界面元素,该活动也仍会执行操作。此字段仅支持
Boolean值( True , False )。默认值为False 。
如果输入模式属性设置为硬件事件,则此属性不适用。
- Healing Agent 模式- 根据流程或作业级别的监管或 Orchestrator 设置,配置此活动的 Healing Agent 行为。
- 已禁用 - 关闭此活动的 Healing Agent。
- 继承作业设置- 在流程或作业级别应用在监管或 Orchestrator 中定义的设置。
- “仅建议” - 允许 Healing Agent 提供有关如何修复正在运行的作业中的用户界面自动化问题的建议,但前提是监管或 Orchestrator 设置允许。
- 与应用程序/浏览器相同- 从父级“使用应用程序/浏览器”活动继承配置。
- 取消阻止输入- 当单击操作触发模态对话框或阻止进一步交互的任何其他用户界面元素时,应使用。此操作仅适用于“模拟”输入方法。此字段仅支持
Boolean值( True , False )。 - Input mode - Select which method the Robot should use to interact with the target application:
- 与应用程序/浏览器相同- 使用与使用应用程序/浏览器活动相同的输入模式。
- 硬件事件- 使用硬件驱动程序执行操作。该方法速度最慢,且不能在后台工作,但可兼容所有桌面应用程序。如果您更改以下任何属性的默认设置“点击类型” 、 “鼠标键”或“修饰键”,系统默认会选择此选项。
- 模拟- 使用辅助功能 API 进行模拟。建议用于浏览器、基于 Java 的应用程序、SAP。通常比“硬件事件”更可靠。在单个操作中发送所有文本。即使目标应用程序不在焦点中,也适用。请测试您的目标应用程序用户界面元素是否支持此方法。“模拟”只能与“单击”类型和“鼠标左键”选项一起使用。
- Chromium API - 使用调试器 API 执行操作。仅适用于 Chromium 元素。一次性发送所有文本。即使目标应用程序不在焦点中,也适用。有关更多详细信息,请查看此页面。 当使用 ChromiumAPI 启动浏览器时,将显示一个功能区,说明浏览器以调试模式启动。如果通过策略安装扩展程序,则不会显示此消息。
- Window 消息- 使用 Win32 消息进行模拟。推荐用于桌面应用程序。通常比“硬件事件”更可靠。在单个操作中发送所有文本。即使目标应用程序不在焦点中,也适用。请测试您的目标应用程序用户界面元素是否支持此方法。
- 修饰键- 添加一个或多个修饰键,以与活动的操作结合使用。可用的选项如下:无、 Alt 、 Ctrl 、 Shift和Win 。默认选项为无。修饰键不能与模拟输入模式一起使用。