- Información general
- Automatización de IU
- Acerca del paquete de actividades de automatización de IU
- Aplicaciones y tecnologías automatizadas con UI Automation
- Compatibilidad de proyectos
- UI-ANA-016: Introducir URL para abrir el navegador
- UI-ANA-017: ContinueOnError verdadero
- UI-ANA-018: enumerar actividades de OCR / imagen
- UI-DBP-006: uso del contenedor
- UI-DBP-013: uso incorrecto de la automatización de Excel
- UI-DBP-030: uso de variables prohibidas en selectores
- UI-DBP-031: verificación de actividad
- UI-PRR-001: Simular clic
- UI-PRR-002: Simular tipo
- UI-PRR-003: uso incorrecto de aplicación abierta
- UI-PRR-004: retrasos codificados
- UI-REL-001: Idx grande en selectores
- UI-SEC-004: datos de correo electrónico del selector
- UI-SEC-010: Restricciones de aplicaciones / URL
- UI-USG-011: atributos no permitidos
- UX-SEC-010: restricciones de aplicaciones / URL
- UX-DBP-029: uso no seguro de contraseña
- UI-PST-001: nivel de registro de auditoría en la configuración del proyecto
- Herramienta de migración del navegador de UiPath
- Recorte de región
- Grabadora de Computer Vision
- Acerca de la automatización de imágenes y texto
- Actividades con el ratón y el teclado
- Ejemplo de uso de la automatización de ratón y teclado
- Actividades de texto
- Ejemplo de uso de la automatización de texto
- Actividades de OCR
- Actividades de imagen
- Ejemplo de uso de la automatización de OCR y la automatización de imágenes
- Índice de actividades
- Activar
- Base de anclaje
- Asociar navegador
- Asociar ventana
- Bloquear entrada de usuario
- Aviso
- Comprobar
- Clic
- Clic en imagen
- Desencadenador de clic de imagen
- Clic en texto OCR
- Clic en el texto
- Desencadenador de clic
- Cerrar aplicación
- Cerrar pestaña
- Cerrar ventana
- Anclaje consciente de contexto
- Copiar texto seleccionado
- Desencadenador de cambio del atributo del elemento
- Elemento existente
- Ámbito del elemento
- Desencadenador de cambio de estado de elemento
- Exportar el árbol de la IU
- Extraer datos estructurados
- Buscar elementos secundarios
- Buscar elemento
- Buscar imagen
- Buscar coincidencias de imágenes
- Buscar texto OCR
- Buscar elemento relativo
- Buscar posición de texto
- Obtener ventana activa
- Obtener antecesor
- Obtener atributo
- Obtener información de atributo
- Obtener a partir del portapapeles
- Obtener texto completo
- Obtener texto OCR
- Obtener contraseña
- Obtener posición
- Obtener elemento de origen
- Obtener texto
- Obtener texto visible
- Volver
- Avanzar
- Ir a inicio
- Google Cloud Vision OCR
- Ocultar ventana
- Resaltar
- Desencadenador de tecla de acceso rápido
- Mantener el puntero
- Mantener el puntero en imagen
- Mantener el puntero sobre texto OCR
- Mantener el puntero en el texto
- Imagen existente
- Indicar en pantalla
- Insertar código .NET
- Inject Js Script
- Invocar método de ActiveX
- Desencadenador de pulsación de tecla
- Cargar imagen
- Maximizar ventana
- Microsoft Azure Computer Vision OCR
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- Minimizar ventana
- Supervisar eventos
- Desencadenador del ratón
- Mover ventana
- Ir a
- Texto OCR existente
- Apariencia en elemento
- Fuga en elemento
- Apariencia en imagen
- Fuga en imagen
- Abrir aplicación
- Abrir navegador
- Actualizar navegador
- Reproducir evento de usuario
- Restaurar ventana
- Guardar imagen
- Seleccionar elemento
- Seleccionar varios elementos
- Enviar tecla de acceso rápido
- Establecer región de recorte
- Establecer foco
- Establecer texto
- Establecer en portapapeles
- Establecer atributo web
- Mostrar ventana
- Iniciar proceso
- Desencadenador del sistema
- Realizar captura
- Tesseract OCR
- Texto existente
- Información sobre herramientas
- Escribir en
- Escribir Texto Seguro
- Utilizar primer plano
- Esperar a atributo
- Esperar a fuga de elemento
- Esperar a fuga de imagen
- Comprobación de accesibilidad
- Desencadenador de eventos de aplicación
- Bloquear entrada de usuario
- Marcar/Desmarcar
- Comprobar estado de aplicación
- Comprobar elemento
- Clic
- Clic desencadenador de eventos
- Arrastrar y soltar
- Extraer datos de tabla
- Buscar elementos
- Para cada elemento de interfaz de usuario
- Obtener datos del navegador
- Obtener Portapapeles
- Obtener texto
- Obtener URL
- Ir a URL
- Resaltar
- Mantener el puntero
- Inject Js Script
- Atajos del teclado
- Desencadenador de eventos de pulsación de tecla
- Desplazamiento del ratón
- Navegar por el navegador
- Guardar imagen
- Seleccionar elemento
- Establecer datos del navegador
- Configurar el portapapeles
- Establecer navegador de Runtime
- Establecer foco
- Establecer texto
- Realizar captura
- Escribir en
- Desbloquear entrada de usuario
- Browser automation mode
- Operación de ventana
- Transacción de llamada
- Clic en imagen en pantalla
- Hacer clic en botón de barra de herramientas
- Expandir tabla jerárquica ALV
- Expandir árbol ALV
- Expandir árbol
- Lectura de barra de estado
- Inicio de sesión en SAP
- Inicio de sesión en SAP
- Desencadenador de cambio de atributos de sesión de SAP
- Seleccionar fechas en el calendario
- Seleccionar elemento de menú
- Ámbito de la celda de la tabla
- Transacción de llamada
- Clic en imagen en pantalla
- Hacer clic en botón de barra de herramientas
- Expandir tabla jerárquica ALV
- Expandir árbol ALV
- Expandir árbol
- Lectura de barra de estado
- Inicio de sesión en SAP
- Inicio de sesión en SAP
- Seleccionar fechas en el calendario
- Seleccionar elemento de menú
- Ámbito de la celda de la tabla
- Realizar búsquedas en el navegador y recuperar resultados mediante las API de automatización de IU
- Exploración web
- Buscar imágenes
- Hacer clic en imágenes
- Eventos de desencadenador y supervisor
- Crear y anular archivos
- Páginas HTML: extraer y manipular información
- Manipulación de ventana
- Selección de lista automatizada
- Buscar y manipular elementos de ventana
- Gestionar automatización de texto
- Cargar y procesar imágenes
- Gestionar acciones activadas por el ratón
- Automatizar tiempo de ejecución de aplicación
- Ejecución automática de una aplicación local
- Navegación de explorador
- Automatización web
- Ejemplo de ámbito de desencadenador
- Habilitar soporte de automatización de IU en DevExpress
- Computer Vision Local Server
- Automatización móvil
- Notas relacionadas
- Acerca de la arquitectura de automatización de dispositivos móviles
- Compatibilidad de proyectos
- Obtener tipos de registro
- Obtener registros
- Obtener origen de la página
- Obtener la orientación del dispositivo
- Obtener identificador de sesión
- Instalar aplicación
- Administrar aplicación actual
- Administrar otras aplicaciones
- Abrir enlace profundo
- Abrir URL
- Conexión de dispositivo móvil
- Deslizamiento direccional
- Patrón de dibujo
- Pase de dedo posicional
- Pulse un botón del hardware
- Establecer orientación del dispositivo
- Realizar captura
- Tomar parte de la captura de pantalla
- Elemento existente
- Ejecutar comando
- Obtener atributo
- Obtener elemento seleccionado
- Obtener texto
- Establecer elemento seleccionado
- Establecer texto
- Deslizamiento
- Pulsar
- Escribir Texto
- Primeros pasos con las API de automatización móvil
- Gestionar cuadros de diálogo emergentes en automatizaciones móviles
- Creating variables from selector attributes
- Creación de flujos de trabajo de automatización móvil
- Utilizar automatización móvil para una aplicación de banca móvil
- Automatización para aplicaciones React Native
- Terminal
- Notas relacionadas
- Acerca del paquete de actividades de Terminal
- Compatibilidad de proyectos
- Mejores prácticas
- Buscar texto
- Obtener color de la posición
- Obtener la posición del cursor
- Obtener campo
- Obtener campo en posición
- Obtener área de pantalla
- Obtener texto
- Obtener texto en posición
- Mover cursor
- Mover cursor al texto
- Enviar tecla de control
- Teclas de envío
- Teclas de envío seguras
- Establecer campo
- Configurar campo en posición
- Sesión del terminal
- Esperar texto de campo
- Esperar a que la pantalla esté lista
- Esperar texto en pantalla
- Esperar texto en posición
- API de automatización codificadas de terminal
Actividades UIAutomation
UiPath supports multiple methods for automating browsers, each suited to different deployment environments and browser targets. The Browser Automation Mode setting lets you choose which method to use — either for a specific workflow scope via the Use Application/Browser activity, or as a project-wide default in UI Automation Modern Project Settings > Application/Browser.
Automation methods
UiPath provides three underlying automation methods, exposed as five modes:
Browser Extension injects the UiPath extension into the browser to interact with web pages directly. It requires the extension to be installed, but provides the richest automation coverage and is compatible with all four major supported browsers: Chrome, Edge, Firefox, Safari.
WebDriver uses the W3C WebDriver protocol to open and control a dedicated browser session via a browser-specific driver binary (chromedriver, msedgedriver, geckodriver). It works without the UiPath extension and supports all four major browsers. A headless variant runs the browser without a visible window.
Chromium Automation uses the Chrome DevTools Protocol (CDP) to control Chromium-based browsers directly, with no extension or driver download required. It is the simplest to configure on Chrome and Edge. A headless variant is also available.
Available modes
Extensión del Explorador
Uses the UiPath browser extension to automate the target browser. The extension injects scripts into web pages to interact with the page and reports element information back to the Robot.
- Requires: UiPath browser extension installed and enabled in the target browser profile
- Supported browsers: Chrome, Edge, Firefox, Safari
- Browser window: Visible
This is the default mode. Choose it for standard attended or unattended automation where the browser runs on the same machine as the Robot and extension installation is possible.
To automate pages in Incognito (private) mode, open chrome://extensions, locate the UiPath extension, and enable Allow in Incognito and Allow access to file URLs.
WebDriver with GUI
Opens a new, visible browser session controlled by the W3C WebDriver protocol. UiPath communicates with the browser via a browser-specific WebDriver server.
- Requires: WebDriver binary compatible with the installed browser version
- Supported browsers: Chrome, Edge, Firefox
- Browser window: Visible
WebDriver creates a new user-data-dir for each session and cannot connect to a browser instance already open on the user's desktop. This makes WebDriver unsuitable for attended automation. For unattended automation this is not a limitation.
WebDriver Headless
Same as WebDriver with GUI, but the browser runs without a visible window.
- Requires: WebDriver binary compatible with the installed browser version
- Supported browsers: Chrome, Edge, Firefox
- Browser window: None (headless)
Some operations that require a visible window — such as native drag-and-drop or hardware mouse simulation — are not supported in headless mode.
Like WebDriver with GUI, this mode creates a new user-data-dir and cannot connect to an already-open browser. A compatible WebDriver binary must be downloaded at runtime. Incognito mode is supported without additional configuration.
Chromium Automation
Uses the Chrome DevTools Protocol (CDP) to control the browser directly. No extension installation or WebDriver binary is required — UiPath launches and manages the browser session internally.
- Requires: Browser process launched with the
--remote-debugging-port=0flag - Supported browsers: Chrome, Edge, and all Chromium-based browsers
- Browser window: Visible
Choose this mode for the simplest setup on Chrome or Edge. It does not support Firefox or Safari.
Chromium Automation creates a new user-data-dir for each session and cannot connect to a browser instance already open on the user's desktop. This makes it unsuitable for attended automation. For unattended automation this is not a limitation.
Incognito mode is supported without additional configuration.
Chromium Automation Headless
Same as Chromium Automation, but the browser runs without a visible window.
- Requires: Browser process launched with the
--remote-debugging-port=0flag - Supported browsers: Chrome, Edge, and all Chromium-based browsers
- Browser window: None (headless)
This mode combines zero-configuration setup with headless execution, making it well suited for unattended automation on servers or CI/CD pipelines.
Like Chromium Automation, this mode creates a new user-data-dir and is blocked when the DeveloperToolsAvailability Group Policy is set to 2. Incognito mode is supported without additional configuration.
Comparación
Setup requirements
What each mode depends on before it can run.
| Mode | Extension required | WebDriver required | Headless | Additional setup |
|---|---|---|---|---|
| Extensión del Explorador | ✅ | ❌ | ❌ | Install UiPath extension |
| WebDriver with GUI | ❌ | ✅ | ❌ | Download WebDriver binary |
| WebDriver Headless | ❌ | ✅ | ✅ | Download WebDriver binary |
| Chromium Automation | ❌ | ❌ | ❌ | Launch browser with the --remote-debugging-port=0 flag |
| Chromium Automation Headless | ❌ | ❌ | ✅ | Launch browser with the --remote-debugging-port=0 flag |
Capacidades
What each mode supports once it is running.
| Mode | Automatización atendida | Incognito (no config) | Navegadores compatibles |
|---|---|---|---|
| Extensión del Explorador | ✅ | ❌ | Chrome, Edge, Firefox, Safari |
| WebDriver with GUI | ❌ | ✅ | Chrome, Edge, Firefox |
| WebDriver Headless | ❌ | ✅ | Chrome, Edge, Firefox |
| Chromium Automation | ❌ | ✅ | Chrome, Edge, Chromium-based |
| Chromium Automation Headless | ❌ | ✅ | Chrome, Edge, Chromium-based |
Choosing a mode
| Escenario | Recommended mode |
|---|---|
| Standard desktop automation, extension can be installed | Extensión del Explorador |
| Attended automation (work with the user's already-open browser) | Extensión del Explorador |
| Extension cannot be installed, browser must be visible | WebDriver with GUI |
| Extension cannot be installed, no display available | WebDriver Headless |
| Chrome or Edge, simplest possible setup | Chromium Automation |
| Unattended or server automation on Chrome/Edge, no display | Chromium Automation Headless |
| Firefox or Safari without extension | WebDriver with GUI or WebDriver Headless |
DeveloperToolsAvailability Group Policy restricts Developer Tools | Browser Extension or WebDriver |
Configure the mode
For a specific activity
- Add a Use Application/Browser activity to your workflow.
- In the Properties panel, locate Browser automation mode.
- Select the desired mode from the dropdown.
Result: The selected mode applies to every UI Automation activity scoped to this Use Application/Browser container.
As a project default
- Open Project Settings from the gear icon in the Project panel.
- Go to UI Automation Modern > Application/Browser.
- Set Browser automation mode to your preferred default.
- Selecciona Guardar.
Result: New Use Application/Browser activities added to the project use the selected mode unless overridden on a specific activity.
The activity-level setting takes precedence over the project default within its scope.
The Browser automation mode property for the Use Application/Browser activity and the project setting in UI Automation Modern > Application/Browser are available only in preview versions starting with UIAutomation v26.4.0-preview.
Limitaciones
- Chromium Automation modes only support Chromium-based browsers. Using them with Firefox or Safari returns an error; no automatic fallback occurs.
- Headless modes do not support operations that depend on a visible window or OS-level rendering, such as hardware mouse drag-and-drop or certain screenshot operations.
- WebDriver and Chromium Automation create a new
user-data-dirfor each session. They cannot connect to a browser already open on the user's desktop, making them unsuitable for attended automation. This is not a limitation for unattended automation. - WebDriver and Chromium Automation sessions use an isolated browser profile. Extensions, saved passwords, and user session cookies from the default browser profile are unavailable.
- WebDriver requires a browser-specific binary (
chromedriver,msedgedriver, orgeckodriver) to be downloaded at runtime and kept compatible with the installed browser version. Browser Extension and Chromium Automation have no such external binary dependency. - Chromium Automation is blocked when the DeveloperToolsAvailability Group Policy is set to
2(Disallow usage of the Developer Tools). Use Browser Extension or WebDriver in environments where this policy is enforced. - Browser Extension requires additional manual setup to automate pages in Incognito mode: the user must open chrome://extensions, locate the UiPath extension, and enable Allow in Incognito and Allow access to file URLs. WebDriver and Chromium Automation support Incognito mode without any additional configuration.