- 基本情報
- Studio Web での UiPath Agents
- Agent Builder での UiPath Agents
- UiPath のコード化されたエージェント

Agents ガイド
会話型エージェントは新たな種類の UiPath エージェントであり、ユーザーと複数のターンでリアルタイムかつ動的に対話するように設計されています。単一のプロンプトに応答する自律型エージェントとは異なり、会話型エージェントは、ユーザー メッセージの連続的なストリームを解釈して応答します。会話のコンテキスト、ツールの実行、人間へのエスカレーション、メモリを管理することで、より豊かで適応性の高いオートメーション エクスペリエンスを実現します。会話型エージェントとは、コンテキストを理解し、曖昧さを自然に処理するインテリジェントなデジタル アシスタントだと考えてください。
会話型エージェントは以下のようなシナリオで特に役立ちます。
- 継続的な明確化や相互のやり取り
- ユーザーの意図に基づいてパーソナライズされたガイダンス
- 信頼度が低い場合における、人間へのシームレスなフォールバック
機能 | 会話型エージェント | 自律型エージェント |
---|---|---|
対話モデル | マルチターン、相互の対話 | 最初のプロンプトに基づく単一ターンでのタスクの実行 |
主なユース ケース | リアルタイムのユーザー サポートと支援、インタラクティブな情報収集 | 定義済みのプロンプトからのタスクの実行 |
ユーザー入力 | 連続的なユーザー チャット メッセージ | 単一の構造化プロンプト |
中心となる強み | 会話の維持と曖昧さへの対処 | 複数のツールでのプランの実行 |
会話型エージェントを使用すべき状況
会話型エージェントは、オートメーション シナリオにおいて、コンテキストを認識したリアルタイムの対話が必要な場合に使用します。会話型エージェントは以下に最適です。
- 顧客や従業員向けのセルフサービス エクスペリエンス。たとえば、ヘルプデスク サポートやオンボーディング アシスタントなどです。
- 複数ステップのプロセス、フォーム、またはデシジョン ツリーを通じたインタラクティブなガイダンス。
- コンテキストを認識した会話。ユーザーはフォローアップの質問をしたり、情報を段階的に提供したりできます。
- アプリケーション、システム、またはナレッジ ベース用の自然言語のインターフェイス。ユーザーは会話形式で情報をクエリできます。
タスクを 1 つのプロンプトで完全に説明し、必要な入力をすべて事前に提供できる場合は、代わりに自律型エージェントを使用します。理想的な例は次のとおりです。
- 構造化されたドキュメントの処理 (例: 請求書や契約書からのデータの抽出)
- 定義済みのロジックに基づく、レポートの自動生成
- 1 回限りの明確な要件を持つ要約タスクや変換タスク
いくつかのチャット エクスペリエンスが利用可能であるため、どのエクスペリエンスをいつ使用すべきかを知っておくことが重要です。
会話型エージェントと Autopilot for Everyone
- 連携: これら 2 つのエクスペリエンスは並行して機能します。会話型エージェントは、Autopilot for Everyone に代わるものではありません。
- さまざまな目的: Autopilot for Everyone は UiPath の汎用エージェントであり、生産性を高めるタスクや UiPath Platform とのやり取りに最適化されています。会話型エージェントは、特定のユースケース (人事ポリシー アシスタントなど) 向けに構築するスペシャリストです。
- アクセス: Autopilot for Everyone から業務特化された会話型エージェントに直接アクセスできるため、Autopilot for Everyone は会話に関するあらゆるニーズに対応する一元的なハブとなります。
会話型エージェントと業務特化型 Autopilot
-
重複: どちらも、ユースケース固有の目的のために設計されています。
-
推奨事項: 会話型エージェントを使用して構築することをお勧めします。これにより、ユースケース固有のエージェントを構築、テスト、改良するための、より豊富で堅牢な設計時エクスペリエンスが提供されます。
-
主な違い: 現在、会話型エージェントはファイルのアップロードとローカルのデスクトップ オートメーションをサポートしていませんが、業務特化型 Autopilot はサポートしています。
パブリック プレビュー中は、会話型エージェントを実行してもプラットフォーム ユニットやエージェント ユニットは消費されません。ただし、エージェントが DeepRAG ツールなどの有料サービスを使用している場合は、そのツールを呼び出すために必要なユニットが消費されます。
会話型エージェントの正式なライセンスの詳細は、2025.10 の一般提供でお知らせします。
会話型エージェントを設計する際は、以下のベスト プラクティスを考慮してください。
- 明確なペルソナで始める: エージェントのトーンとスコープを定義します (例: 「あなたはフレンドリーな人事アシスタントです...」)。
- 予測できない結果に対応できるように設計する: ユーザーは不完全な情報や誤った情報を提供する可能性があります。曖昧さに適切に対応できるようにします。
- ツールの使用方法をガイドする: ツールの説明に、そのツールをいつ、どのように使用するかを明確に記載します。
- 評価によって反復処理する: 好結果が得られたパスと得られなかったパスの両方のテスト ケースを作成します。それに従ってエージェントのロジックを更新します。
会話型エージェントの構築は、設計、テスト、デプロイ、監視を含む系統だったライフサイクルに従います。主な手順は次のとおりです。
- エージェントを設計する: Studio Web を使用して、エージェントのシステム プロンプトの定義、利用可能なツールの設定、コンテキスト グラウンディングの追加、エスカレーション ワークフローの設定を行います。
- テストして評価する: 組み込みのデバッグ チャットを使用して、複数ターンの対話をテストします。実際の会話またはシミュレートした会話を評価セットに追加し、動作とパフォーマンスを検証します。
- パブリッシュしてデプロイする: エージェントをソリューション パッケージとして Orchestrator にパブリッシュします。ソリューション フォルダーに、実行に使用するサーバーレス ロボットと Unattended ロボットが含まれていることを確認します。
- アクセスおよび管理する: インスタンスの管理を使用してエージェントと対話します。実行時の動作を監視し、トレース ログを確認して、フィードバックに基づいて反復処理を行います。
会話型エージェントは、自律型エージェントの場合と同じく Studio Web のローコード デザイナーを使用して作成できますが、重要な違いとして、会話型エージェントはリアルタイムに複数ターンの対話を行えるように調整されています。
エージェントを作成する
開始するには、以下の手順を実行します。
- [studio.uipath.com] に移動します。
- [新規作成] ボタン、[エージェント] の順に選択します。
- エージェントの種類として [会話型] を選択します。
必要に応じて、エージェントを Autopilot に説明し、出発点となる設定を生成します。
システム プロンプトを設定する
システム プロンプトでは、エージェントのペルソナ、目標、動作の制約、ツール/エスカレーションのロジックを定義します。システム プロンプトを使用して、以下をどのように行うかをエージェントに指示します。
- ユーザーへの挨拶
- 不明なクエリの処理
- 問題のエスカレーションまたはツールの呼び出し
- 一貫したトーンとスタイルの維持
会話型エージェントは、ユーザー プロンプトやデータ マネージャーの入力/出力を使用しません。入力はすべて会話中にライブで収集されます。
ツールを設定
ツールを使用すると、エージェントは会話中にアクションを実行できます。たとえば、オートメーションの実行、プロセスの実行、API の呼び出しなどが可能です。サポートされるツールの種類としては、RPA ワークフロー、API ワークフロー、アクティビティ、およびその他のエージェント (会話型エージェントを除く) があります。
ツールレベルのガードレールを使用してランタイム ポリシーを適用します。ガードレールはテスト時と実行時の両方に適用され、トレース ログに表示されます。詳しくは、「ガードレール」をご覧ください。
コンテキストを設定する
コンテキスト グラウンディングのインデックスを追加し、エージェントが特定のナレッジ ソースにアクセスできるようにします。エージェントは、これらのインデックスに対してクエリを実行することで、情報に基づき引用に裏付けられた応答を提供できます。詳しくは、「コンテキスト」をご覧ください。
エスカレーションとエージェント メモリを設定する
会話型エージェントは、意思決定を向上させるために、エスカレーション ワークフローとエージェント メモリをサポートしています。
- エスカレーションにより、エージェントは、信頼度が低い場合やユーザーの意図が不明確な場合、Action Center を介して会話を人間に引き渡すことができます。会話は同期的に実行されます。つまり、エージェントはエスカレーションが解決されるまで、それ以降のすべての対話を一時停止します。
- エージェント メモリにより、エージェントは以前に解決されたエスカレーションを記憶して再利用できるため、重複が減り、効率が向上します。
詳しくは、「エスカレーションとエージェント メモリ」をご覧ください。
エージェントを評価およびテストする
評価により、会話型エージェントがさまざまな対話パスで確実に動作することを確認できます。このプロセスは自律型エージェントの評価と同様ですが、対話のために調整されています。
[出力] パネルを使用して、実際の会話をシミュレートします。[クラウドでテスト] を選択して、エージェントをチャットに似た環境で実行し、自然言語を使用してエージェントと対話します。
リアルタイムの実行ログを表示する
- エージェントによる LLM の呼び出しと応答
- ツールの呼び出しと、引数および最終出力
テスト ケースを追加する
[出力] パネルからテスト ケースを直接追加できます。そのためには、テスト実行後に [評価セットに追加] を選択します。以下を使用して、会話の評価テストが作成されます。
- 会話履歴: 会話における前のターンの記録です。
- 現在のユーザー メッセージ: 会話におけるユーザーの最新のメッセージです。
- 期待されるエージェントの応答。
これにより、エージェントがどの程度適切にコンテキストを維持し、フォローアップの質問を処理しているかをテストできます。これは、優れた会話エクスペリエンスのために不可欠です。
各評価テストについて、[会話ビルダー] インターフェイスを使用して、会話履歴と現在のユーザー プロンプトを編集できます。同様のインターフェイスを使用してエージェントの期待される応答を定義および調整することで、テストで正確に検証できます。
会話型エージェントにアクセスする
会話型エージェントをパブリッシュしてデプロイすると、Automation Cloud の [Agents] セクションにあるインスタンスの管理で対話できるようになります。
UiPath Apps に会話型エージェントを埋め込む
IFrame コンポーネントを使用して、会話型エージェントを UiPath アプリに直接埋め込むこともできます。
- 作成とパブリッシュ: まず、会話型エージェントが作成され、パブリッシュされていることを確認します。
- IFrame を追加: Studio でアプリを開き、ページに IFrame コンポーネントを追加します。
- URL を設定: IFrame の [ソース] プロパティを、
"https://<cloud_env>.uipath.com/<organization>/<tenant>/autopilotforeveryone_/conversational-agents/?agentId=<agent_id>&mode=embedded&title=<title>&welcomeTitle=<welcome_title>&welcomeDescription=<welcome_description>&suggestions=<suggestions>"
形式とパラメーターで構築された URL に設定します。詳しくは、以下の表をご覧ください。
- アプリをパブリッシュ: アプリをパブリッシュします。これで、エージェントが埋め込まれ、使用する準備が整いました。
パラメーター | Required | 説明 |
---|---|---|
agentId | はい | パブリッシュ済みのエージェントのリリース ID です。これを見つけるには、[エージェント] > [会話型エージェント] に移動し、エージェントの [今すぐ会話] をクリックして、URL から ID をコピーします。 |
mode | いいえ |
既定では
fullscreen です。
|
title | いいえ | チャット コンポーネントのヘッダーに表示されるタイトルです。既定ではエージェントの名前が使用されます。 |
welcomeTitle | いいえ | 初回実行のウェルカム画面のタイトルです。既定値は空の文字列です。 |
welcomeDescription | いいえ | 初回実行のウェルカム画面の説明です。既定値は空の文字列です。 |
suggestions | いいえ | ユーザー向けの初回実行時に推奨されるプロンプトの配列です。既定では空の配列 [] です。注:
|
showHistory | いいえ | チャット履歴パネルの表示/非表示を制御するブール値 (true または false ) です。既定値は true です。
|
機能 | 説明 |
---|---|
ユーザー プロンプト | ユーザー プロンプトは必要ありません。会話型エージェントは、入力を収集するために、事前定義されたプロンプトに依存しません。代わりに、メッセージをリアルタイムに使用し、それに応じて一度に 1 ターンずつ応答します。 |
データ マネージャー | Data Manager は現在無効化されています。出力は会話中に会話型エージェントによって動的に生成されるため、出力引数を設定する必要はありません。入力の設定機能 (会話を初期化するための高レベルのパラメーター) は、今後のリリースで利用可能になる予定です。 |
ファイルのアップロード | 会話中にエージェントにファイル (PDF、画像など) をアップロードすることはできません。
ファイルをアップロードする機能は、今後のリリースで利用可能になる予定です。 |
ローカルのデスクトップ オートメーション | エージェントは、ローカル デスクトップとやり取りする (例: Assistant 経由) オートメーションを実行することはできません。 |
個人用コネクション | 個人用の Integration Service コネクションを使用してツールを実行することはできません。現在使用できるのは共有されたコネクションのみです。 |
ツールの確認 | エージェントは、ツールを実行する前に確認を求めません。 |
音声でのやり取り |
エージェントとは、テキスト コマンドでのみやり取りできます。 プッシュツートークと双方向の音声でのやり取りは、今後のリリースでプレビューで利用できるようになります。 |
エージェントのヘルス スコア | 業績評価のためのエージェントのスコア機能はまだ利用できません。 |
インスタンスの管理 | エージェントのパフォーマンスを監視するための高度なオブザーバビリティ機能はまだ利用できません。 |
ユーザー フィードバック | エージェントの応答に対してフィードバック (高評価や低評価など) を提供することはできません。 |
SDK | エージェントをサードパーティの外部アプリケーションに埋め込むためのヘッドレス SDK と UI SDK はまだ利用できません。 |
サードパーティ連携 | Slack、Microsoft Teams、MSFT Copilot などのサーフェスを介した会話型エージェント アクセスはまだ利用できません。 |
ライセンス | 正式なライセンスの詳細は、一般提供リリースで最終決定される予定です。 |
会話型エージェントに対して Orchestrator ジョブが多数存在するのはなぜですか?
ユーザーが会話型エージェントとの会話を開始するたびに、そのセッションを処理する新しい Orchestrator ジョブが作成されます。これらのジョブは次のように動作します。
-
非アクティブな状態が最大 8 時間続いても、アクティブな状態を維持します。
-
その期間内にそれ以上ユーザー入力を受信しない場合、自動的に終了します。
-
会話の進行中にエージェント セッションをすぐに応答できるアクティブな状態に維持しておくことで、起動時間を最小限に抑えます。
このような動作により、エージェントは常にすぐに応答できる状態になっており、同時にアイドル期間中のリソース使用量も最適化されます。
会話型エージェントがインスタンスの管理から開始しないのはなぜですか?
会話型エージェントがインスタンスの管理で開始しない場合は、以下の要件を確認してください。
-
エージェントが含まれるソリューション フォルダーに、サーバーレス ロボットと Unattended ロボットの両方が割り当てられていることを確認します。
-
テナントで、ランタイム実行をサポートするのに十分な数のロボット ユニットが利用可能であることを確認します。
これらのリソースがないと、エージェントをインスタンスの管理からトリガーしても、エージェントは初期化または実行されません。