- 概要
- UI Automation
- UI Automation アクティビティ パッケージについて
- UI Automation を使用して自動化されるアプリケーションと技術
- プロジェクトの対応 OS
- UI-ANA-016 - [ブラウザーを開く] に使用されている URL を検出
- UI-ANA-017 - [エラー発生時に実行を継続] の値が True
- UI-ANA-018 - OCR/画像関連のアクティビティのリスト
- UI-DBP-006 - コンテナーの使用
- UI-DBP-013 - Excel の自動化方法の誤用
- UI-DBP-030 - セレクター内での変数の使用禁止
- UI-DBP-031 - アクティビティの検証
- UI-PRR-001 - クリックをシミュレート
- UI-PRR-002 - 入力をシミュレート
- UI-PRR-003 - [アプリケーションを開く] の誤用
- UI-PRR-004 - ハードコードされた待機時間
- UI-REL-001 - セレクター内の大きいインデックス値
- UI-SEC-004 - メール アドレスのデータを含むセレクター
- UI-SEC-010 - アプリ/URL の制限
- UI-USG-011 - 許可されていない属性
- UX-SEC-010 - アプリ/URL の制限
- UX-DBP-029 - セキュリティで保護されていないパスワードの使用
- UI-PST-001 - [プロジェクト設定] の監査ログ レベル
- UiPath ブラウザー移行ツール
- クリッピング領域
- Computer Vision レコーダー
- アクティビティの索引
- アクティベート
- アンカー ベース
- ブラウザーにアタッチ
- ウィンドウにアタッチ
- ユーザー入力をブロック
- 吹き出し
- チェック
- クリック
- 画像をクリック
- 画像クリック トリガー
- OCR で検出したテキストをクリック
- テキストをクリック
- クリック トリガー
- アプリケーションを閉じる
- タブを閉じる
- ウィンドウを閉じる
- コンテキスト対応のアンカー
- 選択されたテキストをコピー
- 要素属性変更トリガー
- 要素の存在を確認
- 要素スコープ
- 要素ステート変更トリガー
- UI ツリーをエクスポート
- 構造化データを抽出
- 子要素を探す
- 要素を探す
- 画像を探す
- 一致する画像を探す
- OCR でテキスト位置を探す
- 相対要素を探す
- テキスト位置を探す
- アクティブ ウィンドウを取得
- 親要素を取得
- 属性を取得
- イベント情報を取得
- クリップボードから取得
- フル テキストを取得
- OCR でテキストを取得
- パスワードを取得
- 位置を取得
- ソース要素を取得
- テキストを取得
- 表示中のテキストを取得
- 前に戻る
- 次に進む
- ホームに移動
- Google Cloud Vision OCR
- ウィンドウを隠す
- 強調表示
- ホットキー トリガー
- ホバー
- 画像上でホバー
- OCR で検出したテキスト上でホバー
- テキスト上でホバー
- 画像の存在を確認
- 画面上で指定
- .NET コードを挿入
- JS スクリプトを挿入
- ActiveX メソッドを呼び出し
- キー操作トリガー
- 画像を読み込み
- ウィンドウを最大化
- Microsoft Azure ComputerVision OCR
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- ウィンドウを最小化
- イベントを監視
- マウス トリガー
- ウィンドウを移動
- URL に移動
- OCR でテキストの存在を確認
- 要素が出現したとき
- 要素が消滅したとき
- 画像が出現したとき
- 画像が消滅したとき
- アプリケーションを開く
- ブラウザーを開く
- ブラウザーを更新
- ユーザー イベントを再生
- ウィンドウを復元
- 画像を保存
- 項目を選択
- 複数の項目を選択
- ホットキーを押下
- クリッピング領域を設定
- フォーカスを設定
- テキストを設定
- クリップボードに設定
- Web 属性を設定
- ウィンドウを表示
- プロセスを開始
- システム トリガー
- スクリーンショットを作成
- Tesseract OCR
- テキストの存在を確認
- ツールチップ
- 文字を入力
- SecureString で文字を入力
- フォアグラウンドを使用
- 属性を待つ
- 要素の消滅を待つ
- 画像の消滅を待つ
- アクセシビリティ チェック
- アプリケーション イベント トリガー
- ユーザー入力をブロック
- チェック/チェック解除
- アプリのステートを確認
- 要素を確認
- クリック
- クリック イベント トリガー
- ドラッグ アンド ドロップ
- 表データを抽出
- 要素を探す
- 繰り返し (各 UI 要素)
- ブラウザーのデータを取得
- クリップボードを取得
- テキストを取得
- URL を取得
- URL に移動
- 強調表示
- ホバー
- JS スクリプトを挿入
- キーボード ショートカット
- キー押下イベント トリガー
- マウス スクロール
- ブラウザー内を移動
- 画像を保存
- 項目を選択
- ブラウザーのデータを設定
- クリップボードに設定
- ランタイム ブラウザーを設定
- フォーカスを設定
- テキストを設定
- スクリーンショットを作成
- 文字を入力
- ユーザー入力のブロックを解除
- Browser automation mode
- ウィンドウ操作
- UI Automation API を使用してブラウザー検索を実行し、結果を取得する
- Web の閲覧
- 画像を検索する
- 画像をクリックする
- イベントをトリガーおよび監視する
- ファイルを作成して上書きする
- HTML ページ: 情報を抽出して操作する
- ウィンドウの操作
- リスト項目の選択の自動化
- ウィンドウ要素を探して操作する
- テキスト操作の自動化を行う
- 画像を読み込んで処理する
- マウスでアクティブ化する操作を管理する
- アプリケーションランタイムの操作を自動化する
- ローカル アプリケーションの自動実行
- ブラウザーのナビゲーション
- Web オートメーション
- トリガー スコープの例
- DevExpress での UI Automation の有効化
- Computer Vision Local Server
- モバイル オートメーション
- ターミナル
UI Automation アクティビティ
UiPath supports multiple methods for automating browsers, each suited to different deployment environments and browser targets. The Browser Automation Mode setting lets you choose which method to use — either for a specific workflow scope via the Use Application/Browser activity, or as a project-wide default in UI Automation Modern Project Settings > Application/Browser.
Automation methods
UiPath provides three underlying automation methods, exposed as five modes:
Browser Extension injects the UiPath extension into the browser to interact with web pages directly. It requires the extension to be installed, but provides the richest automation coverage and is compatible with all four major supported browsers: Chrome, Edge, Firefox, Safari.
WebDriver uses the W3C WebDriver protocol to open and control a dedicated browser session via a browser-specific driver binary (chromedriver, msedgedriver, geckodriver). It works without the UiPath extension and supports all four major browsers. A headless variant runs the browser without a visible window.
Chromium Automation uses the Chrome DevTools Protocol (CDP) to control Chromium-based browsers directly, with no extension or driver download required. It is the simplest to configure on Chrome and Edge. A headless variant is also available.
Available modes
ブラウザーの拡張機能
Uses the UiPath browser extension to automate the target browser. The extension injects scripts into web pages to interact with the page and reports element information back to the Robot.
- Requires: UiPath browser extension installed and enabled in the target browser profile
- Supported browsers: Chrome, Edge, Firefox, Safari
- Browser window: Visible
This is the default mode. Choose it for standard attended or unattended automation where the browser runs on the same machine as the Robot and extension installation is possible.
To automate pages in Incognito (private) mode, open chrome://extensions, locate the UiPath extension, and enable Allow in Incognito and Allow access to file URLs.
WebDriver with GUI
Opens a new, visible browser session controlled by the W3C WebDriver protocol. UiPath communicates with the browser via a browser-specific WebDriver server.
- Requires: WebDriver binary compatible with the installed browser version
- Supported browsers: Chrome, Edge, Firefox
- Browser window: Visible
WebDriver creates a new user-data-dir for each session and cannot connect to a browser instance already open on the user's desktop. This makes WebDriver unsuitable for attended automation. For unattended automation this is not a limitation.
WebDriver Headless
Same as WebDriver with GUI, but the browser runs without a visible window.
- Requires: WebDriver binary compatible with the installed browser version
- Supported browsers: Chrome, Edge, Firefox
- Browser window: None (headless)
Some operations that require a visible window — such as native drag-and-drop or hardware mouse simulation — are not supported in headless mode.
Like WebDriver with GUI, this mode creates a new user-data-dir and cannot connect to an already-open browser. A compatible WebDriver binary must be downloaded at runtime. Incognito mode is supported without additional configuration.
Chromium Automation
Uses the Chrome DevTools Protocol (CDP) to control the browser directly. No extension installation or WebDriver binary is required — UiPath launches and manages the browser session internally.
- Requires: Browser process launched with the
--remote-debugging-port=0flag - Supported browsers: Chrome, Edge, and all Chromium-based browsers
- Browser window: Visible
Choose this mode for the simplest setup on Chrome or Edge. It does not support Firefox or Safari.
Chromium Automation creates a new user-data-dir for each session and cannot connect to a browser instance already open on the user's desktop. This makes it unsuitable for attended automation. For unattended automation this is not a limitation.
Incognito mode is supported without additional configuration.
Chromium Automation Headless
Same as Chromium Automation, but the browser runs without a visible window.
- Requires: Browser process launched with the
--remote-debugging-port=0flag - Supported browsers: Chrome, Edge, and all Chromium-based browsers
- Browser window: None (headless)
This mode combines zero-configuration setup with headless execution, making it well suited for unattended automation on servers or CI/CD pipelines.
Like Chromium Automation, this mode creates a new user-data-dir and is blocked when the DeveloperToolsAvailability Group Policy is set to 2. Incognito mode is supported without additional configuration.
比較
Setup requirements
What each mode depends on before it can run.
| モード | Extension required | WebDriver required | Headless | Additional setup |
|---|---|---|---|---|
| ブラウザーの拡張機能 | ✅ | ❌ | ❌ | Install UiPath extension |
| WebDriver with GUI | ❌ | ✅ | ❌ | Download WebDriver binary |
| WebDriver Headless | ❌ | ✅ | ✅ | Download WebDriver binary |
| Chromium Automation | ❌ | ❌ | ❌ | Launch browser with the --remote-debugging-port=0 flag |
| Chromium Automation Headless | ❌ | ❌ | ✅ | Launch browser with the --remote-debugging-port=0 flag |
機能
What each mode supports once it is running.
| モード | 有人オートメーション | Incognito (no config) | サポートされているブラウザー |
|---|---|---|---|
| ブラウザーの拡張機能 | ✅ | ❌ | Chrome, Edge, Firefox, Safari |
| WebDriver with GUI | ❌ | ✅ | Chrome, Edge, Firefox |
| WebDriver Headless | ❌ | ✅ | Chrome, Edge, Firefox |
| Chromium Automation | ❌ | ✅ | Chrome, Edge, Chromium-based |
| Chromium Automation Headless | ❌ | ✅ | Chrome, Edge, Chromium-based |
Choosing a mode
| シナリオ | Recommended mode |
|---|---|
| Standard desktop automation, extension can be installed | ブラウザーの拡張機能 |
| Attended automation (work with the user's already-open browser) | ブラウザーの拡張機能 |
| Extension cannot be installed, browser must be visible | WebDriver with GUI |
| Extension cannot be installed, no display available | WebDriver Headless |
| Chrome or Edge, simplest possible setup | Chromium Automation |
| Unattended or server automation on Chrome/Edge, no display | Chromium Automation Headless |
| Firefox or Safari without extension | WebDriver with GUI or WebDriver Headless |
DeveloperToolsAvailability Group Policy restricts Developer Tools | Browser Extension or WebDriver |
Configure the mode
For a specific activity
- Add a Use Application/Browser activity to your workflow.
- In the Properties panel, locate Browser automation mode.
- Select the desired mode from the dropdown.
Result: The selected mode applies to every UI Automation activity scoped to this Use Application/Browser container.
As a project default
- Open Project Settings from the gear icon in the Project panel.
- Go to UI Automation Modern > Application/Browser.
- Set Browser automation mode to your preferred default.
- [保存] を選択します。
Result: New Use Application/Browser activities added to the project use the selected mode unless overridden on a specific activity.
The activity-level setting takes precedence over the project default within its scope.
The Browser automation mode property for the Use Application/Browser activity and the project setting in UI Automation Modern > Application/Browser are available only in preview versions starting with UIAutomation v26.4.0-preview.
制限事項
- Chromium Automation modes only support Chromium-based browsers. Using them with Firefox or Safari returns an error; no automatic fallback occurs.
- Headless modes do not support operations that depend on a visible window or OS-level rendering, such as hardware mouse drag-and-drop or certain screenshot operations.
- WebDriver and Chromium Automation create a new
user-data-dirfor each session. They cannot connect to a browser already open on the user's desktop, making them unsuitable for attended automation. This is not a limitation for unattended automation. - WebDriver and Chromium Automation sessions use an isolated browser profile. Extensions, saved passwords, and user session cookies from the default browser profile are unavailable.
- WebDriver requires a browser-specific binary (
chromedriver,msedgedriver, orgeckodriver) to be downloaded at runtime and kept compatible with the installed browser version. Browser Extension and Chromium Automation have no such external binary dependency. - Chromium Automation is blocked when the DeveloperToolsAvailability Group Policy is set to
2(Disallow usage of the Developer Tools). Use Browser Extension or WebDriver in environments where this policy is enforced. - Browser Extension requires additional manual setup to automate pages in Incognito mode: the user must open chrome://extensions, locate the UiPath extension, and enable Allow in Incognito and Allow access to file URLs. WebDriver and Chromium Automation support Incognito mode without any additional configuration.