- 基本情報
- Studio Web での UiPath Agents
- UiPath のコード化されたエージェント

Agents ガイド
UiPath Agents には、組み込みツール、定義済みのすぐに使えるコンポーネントが付属しており、カスタム開発や外部構成は必要ありません。
Analyze Attachments ツールを使用すると、エージェントは LLM を使用してファイルの内容を処理し、推論を行うことができます。
現在サポートされているファイルの種類は、GIF、JPE、JPEG、PDF、PNG、WEBP です。
このツールをエージェントに追加するには、次の手順を実行します。
- 
                        ファイル入力を定義します。[データ マネージャー] パネルで、ファイル入力用の引数をエージェントのスキーマに追加します。これらは File型である必要があります。図 1. ファイル入力引数の作成
 
-  次の手順を実行して Analyze Attachments ツールを追加します。 
                        - [ツール] パネルで [ツールを追加] を選択します。
- [組み込みツール] カテゴリから [Analyze Attachments] を選択します。
- 必要に応じて、ツールの名前と説明を更新して、エージェントがツールをいつ使用すべきかをより適切に判断できるようにします。
 
- 
                        
                        ツールの入力について理解します。このツールは、次の 2 つの主要な入力で事前設定されています。 - 
                              attachments(配列): 分析対象の 1 つ以上のファイルのリストです。
- 
                              analysisTask(文字列): タスクを説明するプロンプトまたは指示です。ユース ケースに含まれるファイルが 1 つのみの場合は、それが 1 つの添付ファイルであることが反映されるよう、入力の説明を更新できます。
 
- 
                              
- 入力ファイルを使用してエージェントを実行します。 
                        - 次の手順を実行して [デバッグ設定] ウィンドウを開きます。
                              - [プロジェクトの引数] タブに移動します。
- analysisTaskの値を指定します (例: 「2 つの画像を比較してください」)。
- attachments引数にバインドされているフィールドに、入力ファイルをアップロードします。
 
- [保存] をクリックして、デバッグ セッションを実行します。
 
- 次の手順を実行して [デバッグ設定] ウィンドウを開きます。
                              
- エージェントの実行後、下部のパネルで実行トレースを確認します。
                        図 2. 実行証跡の分析
 
添付ファイルのトレース
Analyze Attachments ツールを使用すると、すべてのファイルの入力と出力が [実行証跡] パネルの [履歴] タブにキャプチャされます。このトレースにより、エージェントの実行中に添付ファイルがどのように処理されたかを詳細に可視化できます。
ファイルごとに、トレースには以下が表示されます。
- ID: 添付ファイルの一意の識別子です。
- 
                        名前: 元のファイル名です (例: 1.jpg)。
- 
                        MIME タイプ: 検出されたファイルの種類です (例: image/jpeg)。
- ダウンロード URL: 検査または再利用の目的でファイルをダウンロードするための直接リンクです。現在、トレースに表示されるダウンロード リンクの Time-to-Live 期間は 30 分です。
ベスト プラクティスとよくある質問
Analyze Attachments ツールを使用すると、エージェントは LLM を使用してドキュメントや画像を処理できます。これは強力な機能ですが、ファイル駆動型エージェントを設計する際に注意すべき重要な制限事項と動作がいくつかあります。
大きなファイルはトークンの制限を超過する可能性がある
エージェントは、その内容を LLM プロンプトに埋め込むことでファイルを処理しますが、LLM プロンプトはモデルのトークン制限による制約を受けます。大きな PDF やスキャンされた画像ドキュメントは、特にモデルのトークン予算を超えた場合に、警告なしに失敗したり、「エラーが発生しました」などの曖昧なエラーを返したりすることがあります。
- 
                           
                           トークン容量の大きいモデルを使用します。 
- 
                           
                           特に、大きなファイルや複数ページのファイルの場合は、ファイル全体の埋め込みではなくコンテキスト グラウンディングを使用します。 
- 
                           
                           ドキュメントを事前にインデックス化し、カスタム ツールを使用してエージェントの実行前または実行中に同期します。 
LLM により画像のサイズが変更される
.jpg、 .png など) を LLM プロンプトの一部として送信すると、ほとんどのモデルで自動的にサイズが変更されます。これにより、アスペクト比が歪んだり、ピクセル単位のデータが失われたりする可能性があります。
                  正確な座標、境界ボックス、またはピクセル整列された比較に依存するプロンプト (特定の X/Y 位置を必要とする画像の差分など) は避けてください。モデル固有のサイズ変更動作の詳細については、OpenAI の画像ビジョン ガイドをご覧ください。
サポートされているファイルの種類
サポートされているファイル拡張子は、GIF、JPE、JPEG、PDF、PNG、WEBP です。
ファイルの種類のサポートは、LLM プロバイダーによって異なります。たとえば、ファイル名やエンコードによっては、一部の Anthropic モデルで PDF が正しくサポートされない場合があります。
より良い結果を得るためのヒント
- サイズの大きい PDF を使用している場合は、エージェントに渡す前に、PDF をよりサイズの小さいチャンクまたはページに分割することを検討してください。
- ファイル名はクリーンである必要があります。特に Anthropic モデルでは、特殊文字や空白の繰り返しが含まれるファイル名は拒否されます。
- 画像数を少なくします。GPT-4o などの一部のモデルでは、1 回の要求で最大 10 〜 50 の画像がサポートされています。