- Vue d'ensemble (Overview)
- Automatisation de l'interface utilisateur
- À propos du package d'activités UIAutomation
- Applications et technologies automatisées avec UI Automation
- Compatibilité du projet
- UI-ANA-016 - Extraire l'URL ouverte du navigateur
- UI-ANA-017 - ContinuerSurErreur (ContinueOnError) True
- UI-ANA-018 - Répertorier les activités d'OCR/d'image
- UI-DBP-006 - Utilisation du conteneur
- UI-DBP-013 - Utilisation abusive de l’automatisation Excel
- UI-DBP-030 - Utilisation de variables interdites dans les sélecteurs
- UI-DBP-031 : Vérification de l’activité
- UI-PRR-001 - Simuler un clic
- UI-PRR-002 - Type de simulation
- UI-PRR-003 - Ouverture d'une utilisation abusive de l'application
- UI-PRR-004 - Délais codés en dur
- UI-REL-001 - Idx volumineux dans les sélecteurs
- UI-SEC-004 - Données d’e-mail du sélecteur
- UI-SEC-010 - Restrictions d'applications/d'URL
- UI-USG-011 - Attributs non autorisés
- UX-SEC-010 - Restrictions d'applications/d'URL
- UX-DBP-029 - Utilisation d'un mot de passe non sécurisé
- UI-PST-001 - Niveau du journal d'audit dans les paramètres du projet
- Outil de migration de navigateur UiPath
- Zone de détourage
- Enregistreur de Computer Vision
- À propos des éléments d'interface utilisateur
- Propriétés des activités de l'interface utilisateur
- Exemple d'utilisation des méthodes de saisie
- Méthodes de sortie ou de capture de données d'écran
- Exemple d'utilisation de méthodes de sortie ou de capture de données d'écran
- Génération de tables à partir de données non structurées
- Capture relative de données
- À propos de l'automatisation des images et des textes
- Activités liées à la souris et au clavier
- Exemple d'utilisation de l'automatisation de la souris et du clavier
- Les activités de type texte
- Exemple d'utilisation d'automatisation de texte
- Activités de type OCR
- Activités de type image
- Exemple d'utilisation de l'automatisation d'image et d'OCR
- Index des activités
- Activer (Activate)
- Base d'ancrage (Anchor Base)
- Lier à un navigateur (Attach Browser)
- Lier à une fenêtre (Attach Window)
- Block User Input
- Légende (Callout)
- Vérifier (Check)
- Cliquer (Click)
- Cliquer sur l'image (Click Image)
- Déclencheur de clic image (Click Image Trigger)
- Cliquer sur le texte OCR (Click OCR Text)
- Cliquer sur le texte (Click Text)
- Déclencheur de clic (Click Trigger)
- Fermer l'application (Close Application)
- Fermer l'onglet (Close Tab)
- Fermer la fenêtre (Close Window)
- Context Aware Anchor
- Copier le texte sélectionné (Copy Selected Text)
- Element Attribute Change Trigger
- Élément existant (Element Exists)
- Étendue de l'élément (Element Scope)
- Element State Change Trigger
- Export UI Tree
- Extraire les données structurées (Extract Structured Data)
- Rechercher les enfants (Find Children)
- Rechercher l'élément (Find Element)
- Rechercher l'image (Find Image)
- Rechercher les correspondances de l'image (Find Image Matches)
- Rechercher une position de texte OCR (Find OCR Text Position)
- Rechercher l'élément relatif (Find Relative Element)
- Rechercher la position du texte (Find Text Position)
- Obtenir la fenêtre active (Get Active Window)
- Obtenir l'ancêtre (Get Ancestor)
- Obtenir l'attribut (Get Attribute)
- Obtenir les infos de l'événement (Get Event Info)
- Récupérer du presse-papiers (Get From Clipboard)
- Obtenir le texte complet (Get Full Text)
- Obtenir le texte OCR (Get OCR Text)
- Récupérer le mot de passe (Get Password)
- Obtenir la position (Get Position)
- Obtenir l'élément source (Get Source Element)
- Obtenir le texte (Get Text)
- Obtenir le texte visible (Get Visible Text)
- Revenir en arrière (Go Back)
- Avancer (Go Forward)
- Accéder à l'accueil (Go Home)
- Google Cloud Vision OCR
- Masquer la fenêtre (Hide Window)
- Mettre en surbrillance (Highlight)
- Déclencheur de raccourci (Hotkey Trigger)
- Pointer (Hover)
- Pointer sur l'image (Hover Image)
- Pointer sur le texte OCR (Hover OCR Text)
- Pointer sur le texte (Hover Text)
- Image existante (Image Exists)
- Indiquer sur l'écran (Indicate On Screen)
- Injecter du code .NET
- Inject Js Script
- Invoquer la méthode ActiveX
- Déclencheur de pression de touche (Key Press Trigger)
- Charger l'image (Load Image)
- Agrandir la fenêtre (Maximize Window)
- Microsoft Azure ComputerVision OCR
- Reconnaissance optique des caractères Microsoft (Microsoft OCR)
- Microsoft Project Oxford Online OCR
- Réduire la fenêtre (Minimize Window)
- Surveiller les événements (Monitor Events)
- Déclencheur de souris (Mouse Trigger)
- Déplacer la fenêtre (Move Window)
- Accéder à (Navigate To)
- Texte OCR existant (OCR Text Exists)
- Sur affichage de l'élément (On Element Appear)
- Sur disparition de l'élément (On Element Vanish)
- Sur apparition de l'image (On Image Appear)
- Sur disparition de l'image (On Image Vanish)
- Ouvrir l'application (Open Application)
- Ouvrir le navigateur (Open Browser)
- Actualiser le navigateur (Refresh Browser)
- Relire l'événement utilisateur (Replay User Event)
- Restaurer la fenêtre (Restore Window)
- Enregistrer l'image (Save Image)
- Sélectionner l'élément (Select Item)
- Sélectionner plusieurs éléments (Select Multiple Items)
- Envoyer le raccourci (Send Hotkey)
- Définir la zone de détourage (Set Clipping Region)
- Définir le focus (Set Focus)
- Définir le texte (Set Text)
- Placer dans le presse-papiers (Set To Clipboard)
- Définir l'attribut Web (Set Web Attribute)
- Afficher la fenêtre (Show Window)
- Déclencher le processus (Start Process)
- Déclencheur système (System Trigger)
- Prendre une capture d'écran (Take Screenshot)
- Tesseract OCR
- Texte existant (Text Exists)
- Info-bulle
- Saisir dans (Type Into)
- Saisir un texte sécurisé (Type Secure Text)
- Utiliser le premier plan
- Attendre un attribut (Wait Attribute)
- Attendre que l'élément disparaisse (Wait Element Vanish)
- Attendre que l'image disparaisse (Wait Image Vanish)
- Vérification de l’accessibilité
- Application event trigger
- Block User Input
- Check/Uncheck
- Check App State
- Check Element
- Cliquer (Click)
- Click Event Trigger
- Glisser et déposer
- Extract Table Data
- Find Elements
- For Each UiElement
- Get Browser Data
- Get Clipboard (Obtenir le Presse-papiers)
- Obtenir le texte (Get Text)
- Get URL
- Go To URL
- Mettre en surbrillance (Highlight)
- Pointer (Hover)
- Inject Js Script
- Raccourcis clavier
- Keypress Event Trigger
- Mouse scroll
- Navigate Browser
- Enregistrer l'image (Save Image)
- Sélectionner l'élément (Select Item)
- Set Browser Data
- Set Clipboard (Définir le Presse-papiers)
- Définir le navigateur du runtime (Set Runtime Browser)
- Définir le focus (Set Focus)
- Définir le texte (Set Text)
- Prendre une capture d'écran (Take Screenshot)
- Saisir dans (Type Into)
- Unblock User Input
- Browser automation mode
- Window operation
- Joindre
- Vérifier (Check)
- Cliquer (Click)
- Glisser et déposer
- Extraire des données
- Obtenir l'attribut (Get Attribute)
- ObtenirEnfants
- ObtenirCibleRuntime
- GetText
- Get URL
- GoToUrl
- Mettre en surbrillance (Highlight)
- Pointer (Hover)
- IsEnabled
- Raccourci clavier
- Mouse scroll
- Ouvrir
- Sélectionner l'élément (Select Item)
- Prendre une capture d'écran (Take Screenshot)
- Saisir dans (Type Into)
- ÉtatAttente
- Effectuez une recherche par navigateur et récupérez les résultats à l'aide des API UI Automation
- Navigation sur le Web
- Rechercher des images
- Cliquer sur des images
- Déclencher et surveiller des événements
- Créer et remplacer des fichiers
- Pages HTML : extraire et manipuler des informations
- Manipulation des fenêtres
- Sélection de liste automatisée
- Rechercher et manipuler des éléments de fenêtre
- Gérer l'automatisation du texte
- Charger et traiter des images
- Gérer les actions activées par la souris
- Automatiser l'exécution des applications
- Exécution automatisée d'une application locale
- Navigation avec le navigateur
- Automatisation Web
- Exemple de fonctionnalités du déclencheur
- Activer la prise en charge d’UI Automation dans DevExpress
- Computer Vision Local Server
- Automatisation mobile
- Notes de publication
- À propos de l'architecture d'automatisation des appareils mobiles
- Compatibilité du projet
- Get Log Types
- Get Logs
- Get Page Source
- Get Device Orientation
- Get Session Identifier
- Installer l'application
- Gérer l'application actuelle
- Gérer une autre application
- Ouvrir DeepLink
- Ouvrir l'URL
- Mobile Device Connection
- Balayer directionnel
- Dessiner un modèle
- Positional Swipe
- Press Hardware Button
- Set Device Orientation
- Prendre une capture d'écran (Take Screenshot)
- Prendre une partie de capture d'écran
- Élément existant (Element Exists)
- Execute Command
- Obtenir l'attribut (Get Attribute)
- Get Selected Item
- Obtenir le texte (Get Text)
- Set Selected Item
- Définir le texte (Set Text)
- Balayer
- Tap
- Saisir texte
- Premiers pas avec les API d’automatisation mobile
- Gestion des boîtes de dialogue contextuelles dans les automatisations mobiles
- Creating variables from selector attributes
- Créer des workflows d'automatisation mobile
- Utiliser l’automatisation mobile pour les applications de banque mobile
- Automatisation pour les applications React Native
- Terminal
- Notes de publication
- À propos du package d'activités Terminal
- Compatibilité du projet
- Meilleures pratiques
- Rechercher un texte (Find Text)
- Get Color At Position
- Obtenir la position du curseur (Get Cursor Position)
- Obtenir le champ (Get Field)
- Obtenir le champ en position (Get Field at Position)
- Accéder à la zone d'écran (Get Screen Area)
- Obtenir le texte (Get Text)
- Obtenir le texte en position (Get Text at Position)
- Déplacer le curseur (Move Cursor)
- Move Cursor to Text
- Envoyer la touche Contrôle (Send Control Key)
- Envoyer les touches (Send Keys)
- Envoyer les touches en toute sécurité (Send Keys Secure)
- Définir le champ (Set Field)
- Définir le champ en position (Set Field at Position)
- Session de terminal (Terminal Session)
- Attendre le texte de champ (Wait Field Text)
- Wait Screen Ready
- Attendre le texte d'écran (Wait Screen Text)
- Attendre le texte en position (Wait Text at Position)
- API d'automatisation codée par terminal
Activités UIAutomation
UiPath supports multiple methods for automating browsers, each suited to different deployment environments and browser targets. The Browser Automation Mode setting lets you choose which method to use — either for a specific workflow scope via the Use Application/Browser activity, or as a project-wide default in UI Automation Modern Project Settings > Application/Browser.
Automation methods
UiPath provides three underlying automation methods, exposed as five modes:
Browser Extension injects the UiPath extension into the browser to interact with web pages directly. It requires the extension to be installed, but provides the richest automation coverage and is compatible with all four major supported browsers: Chrome, Edge, Firefox, Safari.
WebDriver uses the W3C WebDriver protocol to open and control a dedicated browser session via a browser-specific driver binary (chromedriver, msedgedriver, geckodriver). It works without the UiPath extension and supports all four major browsers. A headless variant runs the browser without a visible window.
Chromium Automation uses the Chrome DevTools Protocol (CDP) to control Chromium-based browsers directly, with no extension or driver download required. It is the simplest to configure on Chrome and Edge. A headless variant is also available.
Available modes
Extension de navigateur
Uses the UiPath browser extension to automate the target browser. The extension injects scripts into web pages to interact with the page and reports element information back to the Robot.
- Requires: UiPath browser extension installed and enabled in the target browser profile
- Supported browsers: Chrome, Edge, Firefox, Safari
- Browser window: Visible
This is the default mode. Choose it for standard attended or unattended automation where the browser runs on the same machine as the Robot and extension installation is possible.
To automate pages in Incognito (private) mode, open chrome://extensions, locate the UiPath extension, and enable Allow in Incognito and Allow access to file URLs.
WebDriver with GUI
Opens a new, visible browser session controlled by the W3C WebDriver protocol. UiPath communicates with the browser via a browser-specific WebDriver server.
- Requires: WebDriver binary compatible with the installed browser version
- Supported browsers: Chrome, Edge, Firefox
- Browser window: Visible
WebDriver creates a new user-data-dir for each session and cannot connect to a browser instance already open on the user's desktop. This makes WebDriver unsuitable for attended automation. For unattended automation this is not a limitation.
WebDriver Headless
Same as WebDriver with GUI, but the browser runs without a visible window.
- Requires: WebDriver binary compatible with the installed browser version
- Supported browsers: Chrome, Edge, Firefox
- Browser window: None (headless)
Some operations that require a visible window — such as native drag-and-drop or hardware mouse simulation — are not supported in headless mode.
Like WebDriver with GUI, this mode creates a new user-data-dir and cannot connect to an already-open browser. A compatible WebDriver binary must be downloaded at runtime. Incognito mode is supported without additional configuration.
Chromium Automation
Uses the Chrome DevTools Protocol (CDP) to control the browser directly. No extension installation or WebDriver binary is required — UiPath launches and manages the browser session internally.
- Requires: Browser process launched with the
--remote-debugging-port=0flag - Supported browsers: Chrome, Edge, and all Chromium-based browsers
- Browser window: Visible
Choose this mode for the simplest setup on Chrome or Edge. It does not support Firefox or Safari.
Chromium Automation creates a new user-data-dir for each session and cannot connect to a browser instance already open on the user's desktop. This makes it unsuitable for attended automation. For unattended automation this is not a limitation.
Incognito mode is supported without additional configuration.
Chromium Automation Headless
Same as Chromium Automation, but the browser runs without a visible window.
- Requires: Browser process launched with the
--remote-debugging-port=0flag - Supported browsers: Chrome, Edge, and all Chromium-based browsers
- Browser window: None (headless)
This mode combines zero-configuration setup with headless execution, making it well suited for unattended automation on servers or CI/CD pipelines.
Like Chromium Automation, this mode creates a new user-data-dir and is blocked when the DeveloperToolsAvailability Group Policy is set to 2. Incognito mode is supported without additional configuration.
Comparaison
Setup requirements
What each mode depends on before it can run.
| Mode | Extension required | WebDriver required | Headless | Additional setup |
|---|---|---|---|---|
| Extension de navigateur | ✅ | ❌ | ❌ | Install UiPath extension |
| WebDriver with GUI | ❌ | ✅ | ❌ | Download WebDriver binary |
| WebDriver Headless | ❌ | ✅ | ✅ | Download WebDriver binary |
| Chromium Automation | ❌ | ❌ | ❌ | Launch browser with the --remote-debugging-port=0 flag |
| Chromium Automation Headless | ❌ | ❌ | ✅ | Launch browser with the --remote-debugging-port=0 flag |
Capabilities
What each mode supports once it is running.
| Mode | Automatisation assistée | Incognito (no config) | Navigateurs pris en charge |
|---|---|---|---|
| Extension de navigateur | ✅ | ❌ | Chrome, Edge, Firefox, Safari |
| WebDriver with GUI | ❌ | ✅ | Chrome, Edge, Firefox |
| WebDriver Headless | ❌ | ✅ | Chrome, Edge, Firefox |
| Chromium Automation | ❌ | ✅ | Chrome, Edge, Chromium-based |
| Chromium Automation Headless | ❌ | ✅ | Chrome, Edge, Chromium-based |
Choosing a mode
| Scénario | Recommended mode |
|---|---|
| Standard desktop automation, extension can be installed | Extension de navigateur |
| Attended automation (work with the user's already-open browser) | Extension de navigateur |
| Extension cannot be installed, browser must be visible | WebDriver with GUI |
| Extension cannot be installed, no display available | WebDriver Headless |
| Chrome or Edge, simplest possible setup | Chromium Automation |
| Unattended or server automation on Chrome/Edge, no display | Chromium Automation Headless |
| Firefox or Safari without extension | WebDriver with GUI or WebDriver Headless |
DeveloperToolsAvailability Group Policy restricts Developer Tools | Browser Extension or WebDriver |
Configure the mode
For a specific activity
- Add a Use Application/Browser activity to your workflow.
- In the Properties panel, locate Browser automation mode.
- Select the desired mode from the dropdown.
Result: The selected mode applies to every UI Automation activity scoped to this Use Application/Browser container.
As a project default
- Open Project Settings from the gear icon in the Project panel.
- Go to UI Automation Modern > Application/Browser.
- Set Browser automation mode to your preferred default.
- Sélectionnez Enregistrer.
Result: New Use Application/Browser activities added to the project use the selected mode unless overridden on a specific activity.
The activity-level setting takes precedence over the project default within its scope.
The Browser automation mode property for the Use Application/Browser activity and the project setting in UI Automation Modern > Application/Browser are available only in preview versions starting with UIAutomation v26.4.0-preview.
Limitations
- Chromium Automation modes only support Chromium-based browsers. Using them with Firefox or Safari returns an error; no automatic fallback occurs.
- Headless modes do not support operations that depend on a visible window or OS-level rendering, such as hardware mouse drag-and-drop or certain screenshot operations.
- WebDriver and Chromium Automation create a new
user-data-dirfor each session. They cannot connect to a browser already open on the user's desktop, making them unsuitable for attended automation. This is not a limitation for unattended automation. - WebDriver and Chromium Automation sessions use an isolated browser profile. Extensions, saved passwords, and user session cookies from the default browser profile are unavailable.
- WebDriver requires a browser-specific binary (
chromedriver,msedgedriver, orgeckodriver) to be downloaded at runtime and kept compatible with the installed browser version. Browser Extension and Chromium Automation have no such external binary dependency. - Chromium Automation is blocked when the DeveloperToolsAvailability Group Policy is set to
2(Disallow usage of the Developer Tools). Use Browser Extension or WebDriver in environments where this policy is enforced. - Browser Extension requires additional manual setup to automate pages in Incognito mode: the user must open chrome://extensions, locate the UiPath extension, and enable Allow in Incognito and Allow access to file URLs. WebDriver and Chromium Automation support Incognito mode without any additional configuration.