- 概要
- UI Automation
- UI Automation を使用して自動化されるアプリケーションと技術
- プロジェクトの対応 OS
- UI-ANA-016 - [ブラウザーを開く] に使用されている URL を検出
- UI-ANA-017 - [エラー発生時に実行を継続] の値が True
- UI-ANA-018 - OCR/画像関連のアクティビティのリスト
- UI-DBP-006 - コンテナーの使用
- UI-DBP-013 - Excel の自動化方法の誤用
- UI-DBP-030 - セレクター内での変数の使用禁止
- UI-PRR-001 - クリックをシミュレート
- UI-PRR-002 - 入力をシミュレート
- UI-PRR-003 - [アプリケーションを開く] の誤用
- UI-PRR-004 - ハードコードされた待機時間
- UI-REL-001 - セレクター内の大きいインデックス値
- UI-SEC-004 - メール アドレスのデータを含むセレクター
- UI-SEC-010 - アプリ/URL の制限
- UI-USG-011 - 許可されていない属性
- UX-SEC-010 - アプリ/URL の制限
- UX-DBP-029 - セキュリティで保護されていないパスワードの使用
- UI-PST-001 - [プロジェクト設定] の監査ログ レベル
- UiPath ブラウザー移行ツール
- クリッピング領域
- Computer Vision レコーダー
- Activities index
- アクティベート
- アンカー ベース
- ブラウザーにアタッチ
- ウィンドウにアタッチ
- ユーザー入力をブロック
- 吹き出し
- チェック
- クリック
- 画像をクリック
- 画像クリック トリガー
- OCR で検出したテキストをクリック
- テキストをクリック
- クリック トリガー
- アプリケーションを閉じる
- タブを閉じる
- ウィンドウを閉じる
- コンテキスト対応のアンカー
- 選択されたテキストをコピー
- 要素属性変更トリガー
- 要素の存在を確認
- 要素スコープ
- 要素ステート変更トリガー
- UI ツリーをエクスポート
- 構造化データを抽出
- 子要素を探す
- 要素を探す
- 画像を探す
- 一致する画像を探す
- OCR でテキスト位置を探す
- 相対要素を探す
- テキスト位置を探す
- アクティブ ウィンドウを取得
- 親要素を取得
- 属性を取得
- イベント情報を取得
- クリップボードから取得
- フル テキストを取得
- OCR でテキストを取得
- パスワードを取得
- 位置を取得
- ソース要素を取得
- テキストを取得
- 表示中のテキストを取得
- 前に戻る
- 次に進む
- ホームに移動
- Google Cloud Vision OCR
- ウィンドウを隠す
- 強調表示
- ホットキー トリガー
- ホバー
- 画像上でホバー
- OCR で検出したテキスト上でホバー
- テキスト上でホバー
- 画像の存在を確認
- 画面上で指定
- .NET コードを挿入
- JS スクリプトを挿入
- ActiveX メソッドを呼び出し
- キー操作トリガー
- 画像を読み込み
- ウィンドウを最大化
- Microsoft Azure ComputerVision OCR
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- ウィンドウを最小化
- イベントを監視
- マウス トリガー
- ウィンドウを移動
- URL に移動
- OCR でテキストの存在を確認
- 要素が出現したとき
- 要素が消滅したとき
- 画像が出現したとき
- 画像が消滅したとき
- アプリケーションを開く
- ブラウザーを開く
- ブラウザーを更新
- ユーザー イベントを再生
- ウィンドウを復元
- 画像を保存
- 項目を選択
- 複数の項目を選択
- ホットキーを押下
- クリッピング領域を設定
- フォーカスを設定
- テキストを設定
- クリップボードに設定
- Web 属性を設定
- ウィンドウを表示
- プロセスを開始
- システム トリガー
- スクリーンショットを作成
- Tesseract OCR
- テキストの存在を確認
- ツールチップ
- 文字を入力
- SecureString で文字を入力
- フォアグラウンドを使用
- 属性を待つ
- 要素の消滅を待つ
- 画像の消滅を待つ
- UI Automation API を使用してブラウザー検索を実行し、結果を取得する
- Web の閲覧
- 画像を検索する
- 画像をクリックする
- イベントをトリガーおよび監視する
- ファイルを作成して上書きする
- HTML ページ: 情報を抽出して操作する
- ウィンドウの操作
- リスト項目の選択の自動化
- ウィンドウ要素を探して操作する
- テキスト操作の自動化を行う
- 画像を読み込んで処理する
- マウスでアクティブ化する操作を管理する
- アプリケーションランタイムの操作を自動化する
- ローカル アプリケーションの自動実行
- ブラウザーのナビゲーション
- Web オートメーション
- トリガー スコープの例
- DevExpress での UI Automation の有効化
- Computer Vision Local Server
- モバイル オートメーション
- ターミナル
UI Automation のアクティビティ
Computer Vision アクティビティ
このセクションには、UiPath.UIAutomation.Activities パッケージに含まれる Computer Vision 関連のアクティビティが記載されています。
- CV チェック
- CV クリック
- CV ドロップダウン リストから選択
- CV 要素の存在を確認
- CV 表を抽出
- CV テキストを取得
- CV 強調表示
- CV ホバー
- CV 更新
- CV 画面スコープ
- CV 文字を入力
Computer Vision アクティビティには、リファクタリングされた [クリック]、[文字を入力]、[テキストを取得] などの基本的な UI Automation アクティビティが含まれています。これらの Computer Vision アクティビティが従来のアクティビティと異なる大きな点は、UiPath のマシン ラーニング部門の独自開発による Computer Vision のニューラル ネットワークを使用している点です。このニューラル ネットワークは、ボタン、テキスト入力フィールド、チェック ボックスなどの UI 要素をセレクターを使用せずに識別することができます。
これらのアクティビティは、Citrix マシンなどの仮想デスクトップ環境でのオートメーション向けに作成されたものであり、セレクターが存在しない/信頼性に乏しいという問題を回避します。これらのアクティビティは、ニューラル ネットワークに自動化対象ウィンドウの画像を送信します。ニューラル ネットワークでは、これらの画像が解析され、すべての UI 要素が特定され、どのような要素であるかに従ってラベル付けされます。スマート アンカーを使用してやり取りしている UI 要素の正確な場所をピンポイントで特定し、意図するアクションが確実に成功するようにしています。
すべての Computer Vision アクティビティは [CV 画面スコープ] アクティビティ内でのみ機能します。[CV 画面スコープ] アクティビティは、ニューラル ネットワーク サーバーへの実際の接続を確立して、自動化するアプリケーションの UI を分析できるようにします。
Computer Vision アクティビティを使用するワークフローは、デザイナー パネルに [CV 画面スコープ] アクティビティをドラッグして開始する必要があります。
その後、スコープ アクティビティの本体にある [画面上で指定] ボタンを使用して、作業する画面の領域を選択できます。
[CV 画面スコープ] アクティビティが適切に設定されたら、オートメーションを構築するためにパッケージの他のアクティビティすべてを使用し始めることができます。
アクティビティ カードにある [画面上で指定] ボタンを使って、UI 要素のアクションを実行するアクティビティを設計時に構成できます。この機能を持つアクティビティは次のとおりです:
[画面上で指定] (ホットキー:I) ボタンをクリックすると、ヘルパー ウィザードが開きます。
[指定] フィールドは、現時点で示されているものを指定します。ヘルパーが初めて開かれたとき、[ターゲット] が示される必要があります。考えられるターゲットごとに、ウィザードはアンカーを自動的に選択します (アンカーがある場合) 。
[画面を更新] (ホットキー: F5) ボタンは、ターゲット アプリで変更があった場合に設計時に使用でき、新しい画像を Computer Vision サーバーに送信して再分析することができます。
[待機後に画面を更新] (ホットキー: F2) ボタンは、3 秒待った後、対象のアプリを更新します。実行時の自動スクロールの方向もキャプチャされます ([スクロール方向] プロパティ)。
[指定] ウィザードが含まれるアクティビティには [相対要素] 機能も含まれています。ターゲットは安定した要素であり、ターゲットを基準とした距離をドラッグします。メインである安定ターゲットは、2 番目の相対ターゲットのプロキシ ターゲットとして機能します。
これは、Computer Vision エンジンが識別した UI 要素に対応しない領域を選択する場合や、特定の UI 要素を指定することなく UI 内の一般的な領域を選択する場合に便利です。
相対ターゲットは、自動化するアプリケーションの単一のポイントにすることも、領域選択にすることもできます。
単一ポイント選択は通常、Computer Vision での検出が正確ではなく、特定の要素が見つからない可能性がある場所に配置されます。 単一ポイント選択を使用するアクティビティは、[CV クリック]、[CV ホバー]、および [CV 文字を入力] です。
領域選択は [CV テキストを取得] で使用され、このアクティビティでは自動的にアクティブ化されます。
一般的なルールとして、追加するアンカーは実行時に検出される必要があります。つまり、少なくとも 1 つのアンカーが検出されなかった場合、選択全体が検出されなくなります。 そのため、アンカーは、Computer Vision で毎回確実に検出でき、実行時に UI 上で大きく変化しない安定した要素である必要があります。
たとえば、下の画像の「X」ボタンをクリックするとします。 ターゲットは「X」ボタンにありますが、クリックは緑色の円で発生します。これは、「X」ボタンに対して相対的にクリックすることを選択したためです。 したがって、Computer Vision が特定の UI 要素を検出できない場合を除き、[相対要素] 機能を使用する必要はありません。
相対的な領域ではなく「X」ボタンを選択するには、「X」ボタンの枠線が緑色であることを確認してください。
「X」ボタンが安定していない場合は、安定した要素を基準にしてクリックできます。
Computer Vision アクティビティは、表の指定もサポートしています。表内でターゲットを設定するには、操作するセルを選択し、セルの位置を定義する列と行を自動的に特定してグリッドに表示するようニューラル ネットワークに指示します。
既定では、記述子で列と行の名前を使用して、セルの位置を正確に特定します。列インデックスと行インデックスをクリックすると、自動的に記述子に追加されます。これは、列名と行名が変更された場合に、セルの同じ位置を抽出するのに便利です。
Target が正常に示されると、ウィザードが閉じて、選択したターゲットでアクティビティが構成されます。