activities
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 Integration Service で提供されるコネクタ パッケージの一部は機械翻訳で処理されています。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Integration Service のアクティビティ

最終更新日時 2024年12月16日

画像分析

説明

静的テキスト、変数、引数、および画像ファイルまたはパブリックにアクセスできる画像 URL を置くことができるカスタム プロンプトを使用して、完了を生成します。

プロジェクトの対応 OS

Windows | クロスプラットフォーム

構成

  • コネクション ID - Integration Service で確立されたコネクションです。ドロップダウン メニューからコネクションを選択、追加、または管理します。

  • モデル名 - 完了に使用する Vision モデルまたはデプロイの名前または ID です。既定では、観測された出力が最高品質のモデルが使用されます。ただし、目的の出力とテストに基づいて別のモデルを選択できます。モデルを切り替えると、出力に影響を与える可能性があります。利用可能なすべてのモデルは Vision を装備しているので画像も確認できます。テキスト プロンプトのみを送信する場合は、代わりに コンテンツ生成 を使用できます。
  • プロンプト - チャット補完要求に使用するユーザー プロンプトです。このフィールドでは String 型の入力がサポートされます。
  • 画像の種類 - 画像分析が必要な場合にメッセージと共に送信する画像の種類です。[ファイル][パブリック URL] のいずれかのオプションを選択します。
    • ファイル - 完了要求に使用する画像ファイルです。このフィールドには、IResource 型を入力できます。このフィールドは、[画像の種類][ファイル] に設定している場合に表示されます。
    • パブリック URL - ユーザー プロンプトとともに送信する、画像が公開されている URL です。このフィールドには、String 型を入力できます。このフィールドは、[画像の種類][パブリック URL] に設定している場合に表示されます。
  • システム プロンプト - 補完要求のためのシステム プロンプトまたは状況に応じた指示です。このフィールドでは String 型の入力がサポートされます。
注: 対応している画像ファイル形式は、選択したモデルによって異なります。新しいモデルがリリースされると、より多くの画像形式が利用可能になります。
  • GPT-4o:PNG (.png)、JPEG (.jpeg および .jpg)、WEBP (.webp)、および非アニメーション GIF (.gif)。
  • Gemini Flash:= PNG (.png)、JPEG (.jpeg および .jpg)。
  • Gemini Pro = PNG (.png)、JPEG (.jpeg および .jpg)
プロパティを管理

[プロパティを管理] ウィザードを使用して、オブジェクトの標準フィールドまたはカスタム フィールドを設定または使用します。フィールドを選択して、アクティビティ キャンバスに追加できます。 追加した標準フィールドまたはカスタム フィールドは、[ プロパティ] パネル (デスクトップ版の Studio) または [ その他のプロパティを表示] (Studio Web の場合) で使用できます。

その他のプロパティ
  • 最大トークン数 - 完了時に生成するトークンの最大数です。プロンプトのトークン数と結果/完了のトークン数は、このフィールドに指定した値を超えることはできません。プロンプト トークン カウントの余地を確保するために、この値をモデルの最大カウントより小さく設定することをお勧めします。既定値は 1024 です。値を設定しない場合、要求に対応するために必要なトークン、またはモデルで許可される最大トークンが既定で使用されます。このフィールドには、Int64 型を入力できます。
  • 温度 - 使用する創造性因子またはサンプリング温度の値です。値が大きいほど、モデルの出力は不確定になります。より創造的な応答または補完を得る場合は「0.9」に設定し、明確に定義されたまたはより正確な答えを含む補完を得る場合は「0」(最大確率サンプリングともいう) に設定します。一般的には、この値または核サンプル値を既定値から変更することが推奨されており、両方の値を変更することは推奨されていません。既定値は 0 です。
  • 頻度ペナルティ - -2.0 から 2.0 の数値です。正の値は、テキストにおける既存の頻度に基づいて新しいトークンにペナルティを与え、モデルが同じ行をそのまま繰り返す可能性を減少させます。既定値は 0 です。
  • プレゼンス ペナルティ - -2.0 から 2.0 の数値です。正の値は、これまでのテキストに表示されているかどうかに基づいて新しいトークンにペナルティを与え、モデルが新しいトピックについて話す可能性を高めます。既定値は 0 です。
  • 補完の選択肢の数 - 要求に対して生成する補完の選択肢の数です。このフィールドの値が高いほど、使用されるトークンの数が多くなり、コストが高くなります。このフィールドの値を設定する際は、この点にご注意ください。既定値は 1 です。
  • 停止シーケンス - API が追加のトークンの生成を停止する最大 4 つのシーケンスです。返されたテキストには停止シーケンスは含まれません。既定値は null です。
出力
  • 上位の生成テキスト - 画像分析の完了テキストです。
  • 画像分析オブジェクト - 応答オブジェクトには、画像分析の補完テキスト、使用されたモデル、その他の詳細情報が含まれます。
  • 説明
  • プロジェクトの対応 OS
  • 構成

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.