agents
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Agents ガイド

最終更新日時 2025年10月28日

エージェントのパブリッシュとデプロイのベスト プラクティス

エージェントが堅牢であり、運用環境で使用でき、企業の標準に整合していることを確認するには、Orchestrator にパブリッシュしてデプロイする前に、以下のベスト プラクティスに従ってください。これらの手順は、エージェントのライフサイクル全体にわたる検証、ガバナンス、準備状況に対応しています。

クイックスタートに不可欠なゲート

パブリッシュする前に、次の基本的なチェックが完了していることを確認します。

表 1. エージェントのパブリッシュの検証に関するゲート
不可欠なゲート確認する内容確認する場所
プロンプトと例の確定時システム/ユーザー プロンプトに、役割、制約、および入力にマップされた 3 個から 5 個の例が含まれるAgent Builder → システム プロンプトとユーザー プロンプト
ツールの説明時とバインド時すべてのツールに名前、説明、入力/出力スキーマがあるAgent Builder → ツール
ガードレール ログの有効化時 (任意)監査/デバッグのためにツールの呼び出しがログに記録されている (ガードレールの設定で有効化)ツール → ガードレール ビルダー
コンテキスト ソースの接続時関連するナレッジ ベースが少なくとも 1 つグラウンディングされているコンテキスト グラウンディング → ソース
30 以上の対話型テストの実施時手動テストが標準の入力、エッジ入力、形式が正しくない入力をカバーしているAgent Builder → テスト実行
評価セットの作成時選定されたテスト ケースが 30 以上あり、実際の使用法をカバーしているAgent Builder → [評価] タブ
評価パフォーマンスの検証時評価セットのスコアが 70% 以上で、回帰がないAgent Builder → [評価] タブ
ヒント: これらのゲートをデプロイ前のチェックリストとして使用し、自身のリリース プロセスに組み込むことができます。

エージェント定義を確定する

パブリッシュする前に、エージェントのスコープが完全に設定されていて、エージェントがプロンプトに整合しており、コンテキストを認識していることを確認します。

  • スコープと境界を定義する: スコープ内の意図とスコープ外の意図をシステム プロンプトに記述します。ツールとエスカレーション パスがこれらの境界と一致することを確認し、スコープ クリープを防止します。
  • プロンプトと引数を改良する: 構造化されたシステム プロンプトとユーザー プロンプトを記述します。入力引数に対応した現実的な例を使用します。入力を検証し、正しくない形式のデータや敵対的なデータから保護します。
  • 最小コンテキストの原則を適用する: 不可欠なコンテキストのみを LLM に渡します。コンテキスト グラウンディングを使用して、ペイロードの肥大化を回避します。
  • ツールの説明とガードレールを完成させる: 各ツールに対して、名前、目的、スキーマ、副作用を定義します。ログ、フィルター、リトライ、エスカレーション動作を追加します。
  • ツールの出力を正規化する: すべてのツールが一貫して構造化された応答を返すようにして、実行時の問題を防止します。
  • 関連するコンテキスト ソースを接続する: 必要なインデックスを追加し、関連性と新規性のしきい値を調整します。

テストと評価によって検証する

パフォーマンス、回復性、推論の品質を検証する必要があります。

  • 対話型テストを実行する: エッジ ケース、形式が正しくない入力、多言語の例など、30 種類以上のさまざまなシナリオをテストします。
  • 選定されたテスト セットで評価する: 断定的な評価器を使用して 30 以上のテスト ケースを作成します。LLM による評価、完全一致、軌跡スコアリングなどの方法を使用します。
  • パフォーマンスの安定性を確保する: プロンプトまたはツールの変更すべてにわたってスコアを追跡します。デプロイ前に、70% 以上の一貫した評価スコアを目指します。

運用環境のデプロイを準備する

下流の連携とインフラストラクチャの準備状況を検証します。
  • ワークフローからスモーク テストを実行する: Studio または Maestro からエージェントをトリガーし、エンドツーエンドのデータ フローと成功時の処理を検証します。
  • プラットフォームの準備状況を検証する: Orchestrator で資格情報、フォルダー、RBAC、テナントの設定を確認します。

  • トレースとログを検査する: 実行トレースに、長いプロンプト、ツールの非効率的な使用、コンテキストの過剰な検索がないかを確認します。

  • 人間参加型のエスカレーションを有効化する: エスカレーション アプリを設定し、結果の処理を検証します。関連するトランスクリプトとメモリの更新を渡します。

ガバナンスとリリース制御を実装する

エージェントはエンタープライズ ソフトウェアと同様に扱います。つまり、バージョンを管理し、レビューし、所有します。

  • バージョン管理と変更ログを維持する: セマンティック バージョン管理を使用し、動作の監査とロールバックの変更を追跡します。
  • 承認ワークフローを把握する: 運用環境にデプロイする前に、セキュリティ チーム、運用チーム、製品チームの承認を得ます。
  • 運用ドキュメントの下書きを作成する: Runbook とクイックスタート ガイドを作成します。入力/出力、資格情報のローテーション、回復の手順を含めます。
  • サポート チームをトレーニングする: エージェントのロジック、エスカレーションの処理、フォールバックの手順を説明します。

デプロイ後に監視して反復する

エージェントの品質はエージェントの立ち上げ時点で終わるわけではありません。継続的な改善を組み込みます。

  • 段階的なロールアウトを計画する: カナリア デプロイまたはトラフィック分割を使用して、少量で動作を検証します。
  • 継続的な評価スケジュールを設定する: 評価セットを定期的に再実行します。トレースを監視して、ドリフトやパフォーマンスの低下を見つけます。
  • 定期的に確認する: プロンプト、ツール、コンテキストを四半期ごとに見直して、ビジネス ルールやデータ ソースの変更を反映させます。

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo
信頼とセキュリティ
© 2005-2025 UiPath. All rights reserved.