- 概述
- 用户界面自动化
- 关于“用户界面自动化”活动包
- 通过用户界面自动化实现自动化的应用程序和技术
- 项目兼容性
- UI-ANA-016 - 拉取打开浏览器 URL
- UI-ANA-017 - 出错时继续 True
- UI-ANA-018 - 列出 OCR/图像活动
- UI-DBP-006 - 容器使用情况
- UI-DBP-013 - Excel 自动化误用
- UI-DBP-030 - 选取器中的禁止变量使用情况
- UI-DBP-031 - 活动验证
- UI-PRR-001 - 模拟单击
- UI-PRR-002 - 模拟键入
- UI-PRR-003 - 打开应用程序误用
- UI-PRR-004 - 硬编码延迟
- UI-REL-001 - 选取器中的大 IDX
- UI-SEC-004 - 选取器电子邮件数据
- UI-SEC-010 - 应用程序/Url 限制
- UI-USG-011 - 不允许的属性
- UX-SEC-010 - 应用程序/Url 限制
- UX-DBP-029 - 使用不安全的密码
- UI-PST-001 - 项目设置中的审核日志级别
- UiPath 浏览器迁移工具
- 剪切区域
- 计算机视觉录制器
- 活动索引
- 激活
- 锚点基准
- 附加浏览器
- 附加窗口
- 阻止用户输入
- 标注
- 选中
- 单击
- 单击图像
- 单击图像触发器
- 单击 OCR 文本
- 单击文本
- 单击触发器
- 关闭应用程序
- 关闭选项卡
- 关闭窗口
- 上下文感知锚点
- 复制选定文本
- 元素属性更改触发器
- 存在元素
- 元素作用域
- 元素状态更改触发器
- 导出用户界面树
- 提取结构化数据
- 查找子元素
- 查找元素
- 查找图像
- 查找图像匹配项
- 查找 OCR 文本位置
- 查找相对元素
- 查找文本位置
- 获取活动窗口
- 获取上级
- 获取属性
- 获取事件信息
- 从剪贴板获取
- 获取全文
- 获取 OCR 文本
- 获取密码
- 获取位置
- 获取源元素
- 获取文本
- 获取可见文本
- 返回
- 前往
- 转至主页
- Google Cloud Vision OCR
- 隐藏窗口
- 高亮显示
- 热键触发器
- 悬停
- 悬停在图像上方
- 悬停在 OCR 文本上方
- 悬停文本
- 存在图像
- 在屏幕上指定
- 注入 .NET 代码
- 插入 Js 脚本
- 调用 ActiveX 方法
- 按键触发器
- 加载图像
- 最大化窗口
- Microsoft Azure 计算机视觉 OCR
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- 最小化窗口
- 监控事件
- 鼠标触发器
- 移动窗口
- 导航至
- 存在 OCR 文本
- 在元素出现时
- 在元素消失时
- 在图像出现时
- 在图像消失时
- 打开应用程序
- 打开浏览器
- 刷新浏览器
- 重播用户事件
- 还原窗口
- 保存图像
- 选择项目
- 选择多个项目
- 发送热键
- 设置剪切区域
- 设置焦点
- 设置文本
- 设置为剪贴板
- 设置网页属性
- 显示窗口
- 启动进程
- 系统触发器
- 截取屏幕截图
- Tesseract OCR
- 存在文本
- 工具提示
- 键入
- 输入安全文本
- 使用前台
- 等待属性
- 等待元素消失
- 等待图像消失
- Computer Vision Local Server
- 移动自动化
- 终端

用户界面自动化活动
语义活动专为处理表单而设计,为数据提取和数据输入提供了直接而有效的方法。
这些活动使您可以使用灵活的方法,而复杂的细节将由我们的 AI 和高级内部组件处理,例如:
- AI 驱动的 DOM 提取引擎:该引擎会提取表单中所有可用的用户界面元素。
- 语义匹配引擎- 通过对文本标签进行语义匹配来增强自动化的弹性,确保针对用户界面更改的稳定性。
- 语义定位和执行引擎:消除了基于选取器的传统挑战,从而实现无缝定位和执行,而不会出现与使用选取器相关的常见复杂性和弹性问题。
本节包括以下活动:
Each Semantic activity consumes 0.5 AI units per request.
Each request made to Extract Form Data, Fill Form, and Set Value consumes 0.5 AI units by default.
The Close Popup activity consumes 0.5 AI units per request only when the AI-Enhanced mode toggle button is enabled. In this case, each close action via AI consumes 0.5 AI units. When the toggle button is disabled, the activity does not consume any AI units.
可以使用 Insights 中的“租户级别 AI Unit 使用量”仪表板监控 AI Unit 使用量。在 2025.4 版本之前,“语义活动”指标显示为“语义活动(促销)”,并涵盖您使用但无需付费的 AI Unit 数量。您可以在 2025.4 版本之后监控此仪表板,以预测语义活动中的 AI Unit 消耗量。
从版本 2024.10.6 开始直至 2025.4,Community 版和 Enterprise 版客户都可以免费使用语义活动,包括没有购买 AI Unit 的客户。此促销期旨在鼓励客户采用语义活动并让客户建立对此功能质量的信任。从 2025.4 版本开始,AI Unit 的使用情况如上所述,确保所有用户都能顺畅地以连续和公开透明的方式使用。
UiPath.UIAutomationNext.Activities.NClosePopup
描述
使用配置的关闭按钮关闭应用程序顶部的所有弹出窗口并阻止目标。
该活动可在“使用应用程序/浏览器”活动内部和外部使用。
项目兼容性
Windows |跨平台
配置
- 弹出窗口关闭按钮- 用于关闭弹出窗口的按钮标签。 在 Studio Desktop 中,默认情况下会填充“关闭”和“取消” 按钮标签。
- AI 增强模式 - 如果切换按钮设置为“开启”,则利用 AI 关闭弹出窗口。每个通过 AI 执行的关闭操作都会消耗一个 AI Unit。默认选项为“关闭”。
其他选项
计时
- 弹出窗口出现超时- 等待弹出窗口出现的时间(以秒为单位)。 默认值为 30 秒。
输入
- 检测到弹出窗口异常- 检测到弹出窗口时引发的异常。
输出
- 已处理弹出窗口 - 指明是否已处理弹出窗口。
UiPath.Semantic.Activities.NExtractFormDataGeneric
项目兼容性
Windows |跨平台
配置
- “从屏幕中发现字段” - DOM 分析,用于查找可操作元素及其关联的标签。
- “表单数据”- 保存提取的表单数据的位置。 输出结果为结构化数据自定义类型。
其他选项
计时
-
“在此之前延迟”- 上一个活动完成与此活动开始执行任何操作之间的延迟(以秒为单位)。默认值为 0.2 秒。在活动之间添加延迟可确保一个活动有足够的时间完成,然后再开始下一个活动。
-
“延迟 时间” - 此活动完成与下一个活动开始执行任何操作之间的延迟时间(以秒为单位)。 默认值为 0.3 秒。 在活动之间添加延迟可确保一个活动有足够的时间完成,然后再开始下一个活动。
-
“超时”- 指定最长等待时间(以秒为单位),如果超出该时间后活动并未执行,系统便会抛出错误。 默认值为 30 秒。
-
“出错时继续” - 指定在活动引发错误时是否应继续自动化操作。 此字段仅支持
Boolean值(True、 False)。 默认值为 False。 因此,如果该字段为空且活动引发错误,系统将停止执行项目。 如果该值设置为 True,则无论出现何种错误,系统都将继续执行项目。
UiPath.Semantic.Activities.NFillForm
项目兼容性
Windows |跨平台
配置
- 数据源 - 选择以下支持的类型中的数据源:
DocumentData、Dictionary、DataEntity、DataRow、DataTable、JSON 文件、非结构化文本文件或甚至是自定义类型,例如通过“提取表单数据”活动作为输出而生成的文件。备注:对于DataTable,仅使用第一行中的数据填充表单。要将“IEnumerable”用作数据源,您需要在“遍历循环” 活动中添加活动。 - 启用验证 - 如果切换按钮设置为“开启”,则为运行时值启用执行验证。如果内部验证机制在执行后检测到无效值,则会引发异常。默认选项为“关闭”。
其他选项
计时
-
“在此之前延迟”- 上一个活动完成与此活动开始执行任何操作之间的延迟(以秒为单位)。默认值为 0.2 秒。在活动之间添加延迟可确保一个活动有足够的时间完成,然后再开始下一个活动。
-
“延迟 时间” - 此活动完成与下一个活动开始执行任何操作之间的延迟时间(以秒为单位)。 默认值为 0.3 秒。 在活动之间添加延迟可确保一个活动有足够的时间完成,然后再开始下一个活动。
-
“超时”- 指定最长等待时间(以秒为单位),如果超出该时间后活动并未执行,系统便会抛出错误。 默认值为 30 秒。
-
“出错时继续” - 指定在活动引发错误时是否应继续自动化操作。 此字段仅支持
Boolean值(True、 False)。 默认值为 False。 因此,如果该字段为空且活动引发错误,系统将停止执行项目。 如果该值设置为 True,则无论出现何种错误,系统都将继续执行项目。
UiPath.Semantic.Activities.NSetValue
描述
使用 AI 无缝在任何输入字段中设置值:输入框、下拉列表、复选框、单选按钮、日期选取器。
它只能在 Chrome Edge、Firefox 和 Safari 中使用。
使用与 “填充表单”相同的功能,但在元素级别使用。
您可以使用单个通用的“更新用户界面元素” 活动,而不是对特定输入字段使用其他活动(例如,为输入框 使用“键入” ,为复选框提供“选中/取消选中” 等)。它还可以处理日期选取器和单选按钮组。
此活动必须添加到“使用应用程序/浏览器”活动中。
此活动可与对象存储库兼容。
项目兼容性
Windows |跨平台
配置
-
在屏幕上指定目标 - 指定要用作目标的用户界面元素。
指定目标后,选择加号按钮以访问以下选项:
- “在屏幕上指定目标”- 再次指定目标。
- 编辑目标 - 打开选择模式以配置目标。
-
值- 字段中设置的值。 此字段仅接受
String变量。如果指定的目标是复选框,则接受的值为以下值:- True:
"true"、"yes"、"checked"、"x" - False:
"false"、"no"、"unchecked"
- True:
- 启用验证 - 如果切换按钮设置为“开启”,则为运行时值启用执行验证。如果内部验证机制在执行后检测到无效值,则会引发异常。默认选项为“关闭”。
选项
- Healing Agent 模式- 根据流程或作业级别的监管或 Orchestrator 设置,配置此活动的 Healing Agent 行为。
- 已禁用- 关闭此活动的 Healing Agent。
- 继承作业设置- 在流程或作业级别应用在监管或 Orchestrator 中定义的设置。
- “仅建议” - 允许 Healing Agent 提供有关如何修复正在运行的作业中的用户界面自动化问题的建议,但前提是监管或 Orchestrator 设置允许。
- 与应用程序/浏览器相同- 从父级“使用应用程序/浏览器”活动继承配置。
-
“出错时继续” - 指定在活动引发错误时是否应继续自动化操作。 此字段仅支持
Boolean值(True、 False)。 默认值为 False。 因此,如果该字段为空且活动引发错误,系统将停止执行项目。 如果该值设置为 True,则无论出现何种错误,系统都将继续执行项目。
目标
- Expand target properties - Display target and anchor properties. This will hide the other activity properties and display only those related to the target.
- Collapse target properties - Hide target and anchor properties. This will hide target related properties and display the activity properties.
- 定位方法 - 要用于标识元素的选取器类型。 可以将此属性设置为下拉菜单中的任意组合:
- 无
- Strict selector - The strict selector generated for the target UI element.
- Fuzzy selector - The fuzzy selector parameters.
-
Computer Vision - 要将 Computer Vision 用作定位方法,您需要转到“项目设置”>“Computer Vision”,并确保设置正确的服务器端点。您可以原样保留此字段,并使用 UiPath Cloud(默认情况下已填写),也可以通过选择特定于服务器区域的任何其他公共端点或您自己的本地部署服务器来输入其他值。
Another way of using Computer Vision as a targeting method is to set Use Local Server to True. This implies that the UiPath.ComputerVision.LocalServer package is installed in your project. When Local Server is enabled, the server value is over-written. However, the Local Server is not available in cross-platform projects.
- CV 控件类型 - 指示使用 Computer Vision 识别的控件类型。
- 计算机视觉文本 - 表示使用 Computer Vision 识别的文本。
- CV Text occurrence - Indicates a specific occurrence to be used, when multiple matches are found.
- CV Text accuracy - Indicates the accuracy level for OCR text matching.
- Semantic selector - Leverages large language models (LLMs) to generate functional, human-like descriptions of UI elements. These descriptions are highly reliable making them adaptable to UI changes and significantly improving automation resilience when traditional selectors fail.
- Image (Windows only)
- Image accuracy - Indicates the accuracy level for image matching.
- Image occurrence - Indicates a specific occurrence to be used, when multiple matches are found.
- Native text (Windows only)
- Native text - The text to find to identify the UI element.
- Native text occurrence - Indicates a specific occurrence to be used, when multiple matches are found.
- Window selector (Application instance) - Selector for the application window. Only applicable when window attach mode is set to application instance.
- Wait for page load - Before performing the action, wait for the application to becaome ready to accept input. The options are:
- 无- 不等待目标变为就绪状态。
- “交互式”– 等待直到加载了应用程序的一部分。
- “完整”– 等待整个应用程序被加载。
- Visibility check - When enabled, the activity also checks whether the UI element is visible or not. You can choose one of three options from the drop-down menu:
- “无 ”- 不检查可见性。
- 交互式(用于模糊选取器) - 默认选项。 检查元素是否可能可见,忽略页面滚动和其他应用程序的阻碍或应用程序已最小化。 当尝试确保您没有以 DOM 中存在但隐藏的不可见元素为目标时,此检查非常有用。
- 完全可见 - 检查用户界面元素是否可见。
- 响应式网站 - 启用响应式网站布局。
计时
-
“在此之前延迟”- 上一个活动完成与此活动开始执行任何操作之间的延迟(以秒为单位)。默认值为 0.2 秒。在活动之间添加延迟可确保一个活动有足够的时间完成,然后再开始下一个活动。
-
“延迟 时间” - 此活动完成与下一个活动开始执行任何操作之间的延迟时间(以秒为单位)。 默认值为 0.3 秒。 在活动之间添加延迟可确保一个活动有足够的时间完成,然后再开始下一个活动。
-
“超时”- 指定最长等待时间(以秒为单位),如果超出该时间后活动并未执行,系统便会抛出错误。 默认值为 30 秒。