- 概要
- UI Automation
- UI Automation アクティビティ パッケージについて
- UI Automation を使用して自動化されるアプリケーションと技術
- プロジェクトの対応 OS
- UI-ANA-016 - [ブラウザーを開く] に使用されている URL を検出
- UI-ANA-017 - [エラー発生時に実行を継続] の値が True
- UI-ANA-018 - OCR/画像関連のアクティビティのリスト
- UI-DBP-006 - コンテナーの使用
- UI-DBP-013 - Excel の自動化方法の誤用
- UI-DBP-030 - セレクター内での変数の使用禁止
- UI-DBP-031 - アクティビティの検証
- UI-PRR-001 - クリックをシミュレート
- UI-PRR-002 - 入力をシミュレート
- UI-PRR-003 - [アプリケーションを開く] の誤用
- UI-PRR-004 - ハードコードされた待機時間
- UI-REL-001 - セレクター内の大きいインデックス値
- UI-SEC-004 - メール アドレスのデータを含むセレクター
- UI-SEC-010 - アプリ/URL の制限
- UI-USG-011 - 許可されていない属性
- UX-SEC-010 - アプリ/URL の制限
- UX-DBP-029 - セキュリティで保護されていないパスワードの使用
- UI-PST-001 - [プロジェクト設定] の監査ログ レベル
- UiPath ブラウザー移行ツール
- クリッピング領域
- Computer Vision レコーダー
- アクティビティの索引
- アクティベート
- アンカー ベース
- ブラウザーにアタッチ
- ウィンドウにアタッチ
- ユーザー入力をブロック
- 吹き出し
- チェック
- クリック
- 画像をクリック
- 画像クリック トリガー
- OCR で検出したテキストをクリック
- テキストをクリック
- クリック トリガー
- アプリケーションを閉じる
- タブを閉じる
- ウィンドウを閉じる
- コンテキスト対応のアンカー
- 選択されたテキストをコピー
- 要素属性変更トリガー
- 要素の存在を確認
- 要素スコープ
- 要素ステート変更トリガー
- UI ツリーをエクスポート
- 構造化データを抽出
- 子要素を探す
- 要素を探す
- 画像を探す
- 一致する画像を探す
- OCR でテキスト位置を探す
- 相対要素を探す
- テキスト位置を探す
- アクティブ ウィンドウを取得
- 親要素を取得
- 属性を取得
- イベント情報を取得
- クリップボードから取得
- フル テキストを取得
- OCR でテキストを取得
- パスワードを取得
- 位置を取得
- ソース要素を取得
- テキストを取得
- 表示中のテキストを取得
- 前に戻る
- 次に進む
- ホームに移動
- Google Cloud Vision OCR
- ウィンドウを隠す
- 強調表示
- ホットキー トリガー
- ホバー
- 画像上でホバー
- OCR で検出したテキスト上でホバー
- テキスト上でホバー
- 画像の存在を確認
- 画面上で指定
- .NET コードを挿入
- JS スクリプトを挿入
- ActiveX メソッドを呼び出し
- キー操作トリガー
- 画像を読み込み
- ウィンドウを最大化
- Microsoft Azure ComputerVision OCR
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- ウィンドウを最小化
- イベントを監視
- マウス トリガー
- ウィンドウを移動
- URL に移動
- OCR でテキストの存在を確認
- 要素が出現したとき
- 要素が消滅したとき
- 画像が出現したとき
- 画像が消滅したとき
- アプリケーションを開く
- ブラウザーを開く
- ブラウザーを更新
- ユーザー イベントを再生
- ウィンドウを復元
- 画像を保存
- 項目を選択
- 複数の項目を選択
- ホットキーを押下
- クリッピング領域を設定
- フォーカスを設定
- テキストを設定
- クリップボードに設定
- Web 属性を設定
- ウィンドウを表示
- プロセスを開始
- システム トリガー
- スクリーンショットを作成
- Tesseract OCR
- テキストの存在を確認
- ツールチップ
- 文字を入力
- SecureString で文字を入力
- フォアグラウンドを使用
- 属性を待つ
- 要素の消滅を待つ
- 画像の消滅を待つ
- アクセシビリティ チェック
- アプリケーション イベント トリガー
- ユーザー入力をブロック
- チェック/チェック解除
- アプリのステートを確認
- 要素を確認
- クリック
- クリック イベント トリガー
- ドラッグ アンド ドロップ
- 表データを抽出
- 要素を探す
- 繰り返し (各 UI 要素)
- ブラウザーのデータを取得
- クリップボードを取得
- テキストを取得
- URL を取得
- URL に移動
- 強調表示
- ホバー
- JS スクリプトを挿入
- キーボード ショートカット
- キー押下イベント トリガー
- マウス スクロール
- ブラウザー内を移動
- 項目を選択
- ブラウザーのデータを設定
- クリップボードに設定
- ランタイム ブラウザーを設定
- フォーカスを設定
- テキストを設定
- スクリーンショットを作成
- 文字を入力
- ユーザー入力のブロックを解除
- アプリケーション/ブラウザーを使用
- ウィンドウ操作
- UI Automation API を使用してブラウザー検索を実行し、結果を取得する
- Web の閲覧
- 画像を検索する
- 画像をクリックする
- イベントをトリガーおよび監視する
- ファイルを作成して上書きする
- HTML ページ: 情報を抽出して操作する
- ウィンドウの操作
- リスト項目の選択の自動化
- ウィンドウ要素を探して操作する
- テキスト操作の自動化を行う
- 画像を読み込んで処理する
- マウスでアクティブ化する操作を管理する
- アプリケーションランタイムの操作を自動化する
- ローカル アプリケーションの自動実行
- ブラウザーのナビゲーション
- Web オートメーション
- トリガー スコープの例
- DevExpress での UI Automation の有効化
- Computer Vision Local Server
- モバイル オートメーション
- ターミナル

UI Automation アクティビティ
ScreenPlay
UiPath.Semantic.Activities.NUITask
説明
ScreenPlay は UiPath® の次世代のオートメーション エージェントであり、エージェンティックな動作とコグニティブ機能をデスクトップでも利用できるように設計されています。ScreenPlay は、人間とほぼ同じようにアプリケーションを操作します。つまり、インターフェイスをナビゲートし、変化に適応し、従来の自動化手法では実現不可能だった複雑なタスクを処理します。
詳しくは、「ScreenPlay」をご覧ください。
このアクティビティは [アプリケーション/ブラウザーを使用] アクティビティに追加する必要があります。
プロジェクトの対応 OS
Windows | クロスプラットフォーム
構成
-
タスク - 実行する UI タスクを説明するプロンプトです。以下を実行できます。
- 変数を使用します。
- 画面から画像を (テキストと一緒にインラインで) 追加する
- 前回の実行トレースを表示する。詳しくは、「実行して実行結果を調べる」をご覧ください。
-
モデル - UiPath ScreenPlay がタスクの実行計画と推論のために使用する、基になる LLM を指定します。利用可能なオプションは [UiPath Screen Agent (Gemini 2.5 Flash を使用)] です。
- 基本モデル
- ブラウザーで最適に動作します。
- ページの DOM に基づく独自の実装を使用し、推論と画像の理解に Gemini Flash を使用します。
- 適度に速く動作します。
UiPath Screen Agent (GPT-4.1 を使用)
- 標準モデル - 複雑なタスク向けです。
- ブラウザーで最適に動作します。
- ページの DOM と画像理解に基づく独自の実装を使用し、推論に GPT-4.1 を使用します。
- 実行速度はあまり速くありません。
UiPath Screen Agent (GPT-4.1 mini を使用)
- 処理スピードがより速く、より安価な基本モデルです。
- ブラウザーで最適に動作します。
- ページの DOM と画像理解に基づく独自の実装を使用し、推論に GPT-4.1 mini を使用します。
- 適度に速く動作します。
UiPath Screen Agent (GPT-5 を使用)
- 標準モデル - 複雑なタスク向けです。
- ブラウザーで最適に動作します。
- ページの DOM と画像理解に基づく独自の実装を使用し、推論に GPT-5 を使用します。
- 低速
UiPath Screen Agent (GPT-5 mini を使用)
- 処理スピードがより速く、より安価な基本モデルです。
- ブラウザーで最適に動作します。
- ページの DOM と画像理解に基づく独自の実装を使用し、推論に GPT-5 mini を使用します。
- 適度に速く動作します。
OpenAI - Opeartor
- 標準モデル - 複雑なタスク向けです。
- 画像ベースのインターフェイスなど、あらゆるタイプのアプリケーションで動作します。
- 画像ベースの推論モデルである OpenAI Operator を使用します
- 低速
Anthropic - Computer Use
- 標準モデル - 複雑なタスク向けです。
- 画像ベースのインターフェイスなど、あらゆるタイプのアプリケーションで動作します。
- 画像ベースの推論モデルである Anthropic Computer Use を使用します。
- 低速
-
このアクティビティを評価 - [良い] または [悪い]
その他のオプション
オプション
-
最大ステップ数 - ScreenPlay が目標を達成するために実行できるステップの最大数です。このプロパティは、無限のエージェンティック ループを防止するための基本的なガードレールとして使用できます。
-
クリップボードで入力 - 指定したテキストの入力にクリップボードを使用するかどうかを指定します。次のオプションが利用できます。
- なし - クリップボードを使用しません。
- 常時 - 常にクリップボードを使用します。
- 可能な場合 - 可能な場合はクリップボードを使用します。これは、OS と入力するテキストによって異なります (例: 特殊キーを使用すると、クリップボードは使用されません)。
-
利用可能な場合は DOM を使用 - DOM を抽出できるアプリケーションで、DOM データを使用またはLLM モデルに送信するかどうかを指定します。DOM は UiPath LAM の実装でのみ使用できます。
DOM ベースのターゲット設定によって要素の座標が不正確になる場合は、無効化します。
既定値は True です。
-
変数のセキュリティを無効化 - 変数のセキュリティを無効化するかどうかを指定します。変数セキュリティのため、プロンプトの指示を変数値で渡すことは不可能になっています。
この機能はプロンプト インジェクション攻撃の防止を目的としたもので、LLM に基づいているため、「誤検知」が発生する場合は、ScreenPlay アクティビティごとに無効化できます。「誤検知」であるかどうかを判断する場合、実行トレース、システム プロンプト、推論、アクションを調べることができます。
変数の値を使用してプロンプトの指示を渡す必要がある場合、および「誤検知」の結果が発生した場合にのみ、このオプションを有効化してください。
既定値は [False] です。
-
入力モード - キーボードまたはマウスの入力の生成に使用するメソッドを選択します。
- アプリ/ブラウザーと同一 - 親の [アプリケーション/ブラウザーを使用 ] アクティビティの [入力モード] の設定を使用します。
- ハードウェア イベント - マウスの動きやキーボード ストロークなどの「ハードウェア」の入力を使用してアプリケーションを操作することにより、実際のユーザーとして動作します。これらは、オペレーティング システムに直接送信されるハードウェアによってトリガーされるイベントです。このメソッドでは動作が 100% 模倣されますが、まれに一部のイベントが失われる場合があります。開発者には、すべてのイベントが対象のアプリケーションに確実に到達するようにする責任があります。
- Chromium API - デバッガー API を使用してアクションを実行します。これは、Chromium の要素に対してのみ動作します。すべてのテキストを一度に送信します。対象のアプリにフォーカスしていなくても動作します。詳しくは、「Chromium API」をご覧ください。
- シミュレート - アクセシビリティ API を使用してシミュレートします。ブラウザー、Java ベースのアプリケーション、および SAP を使用する場合に推奨されます。通常はハードウェア イベントよりも信頼性が高くなります。すべてのテキストを 1 回の操作で送信します。対象のアプリにフォーカスしていなくても動作します。
注:対象のアプリケーションの UI 要素がこの方法をサポートしているかどうかをテストしてください。
- ウィンドウ メッセージ - Win32 メッセージを使用してシミュレートします。デスクトップ アプリに適しています。通常はハードウェア イベントよりも信頼性が高くなります。すべてのテキストを一度に送信します。対象のアプリにフォーカスしていなくても動作します。
注:対象のアプリケーションの UI 要素がこの方法をサポートしているかどうかをテストしてください。
-
エラー発生時に実行を継続 - アクティビティでエラーが発生した場合でも、オートメーションを継続するかどうかを指定します。このフィールドでは Boolean 値 (True、False) のみがサポートされています。既定値は False です。そのため、フィールドが空白でエラーが発生すると、プロジェクトの実行が停止します。値を True に設定すると、プロジェクトの実行はエラーに関係なく継続されます。
タイミング
- 実行前の待機時間 - 前のアクティビティが完了してから、現在のアクティビティが何らかの操作を開始するまでの遅延時間を秒単位で指定します。既定値は 0.2 秒です。アクティビティとアクティビティの間に遅延を追加すると、次のアクティビティを開始する前に、現在のアクティビティを確実に終了できる時間を確保できます。
- 実行後の待機時間 - 現在のアクティビティが完了してから、次のアクティビティが何らかの操作を開始するまでの遅延時間を秒単位で指定します。既定値は 0.3 秒です。アクティビティとアクティビティの間に遅延を追加すると、次のアクティビティを開始する前に、現在のアクティビティを確実に終了できる時間を確保できます。
- タイムアウト - エラーを発生させる前にアクティビティの実行を待機する時間を秒単位で指定します。既定値は 30 秒です。
出力
- 結果 - タスクの結果です (存在する場合)。現在は、
String型の出力のみをサポートしています。