activities
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 Integration Service で提供されるコネクタ パッケージの一部は機械翻訳で処理されています。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white
Integration Service のアクティビティ
Last updated 2024年11月19日

画像分析

説明

静的テキスト、変数、引数、および画像ファイルまたはパブリックにアクセス可能な画像 URL を含むことができるカスタムプロンプトで補完を生成します。

プロジェクトの対応 OS

Windows | クロスプラットフォーム

構成

  • コネクション ID - Integration Service で確立されたコネクションです。ドロップダウン メニューからコネクションを選択、追加、または管理します。

  • モデル名 - 補完に使用するビジョンモデルまたはデプロイの名前または ID です。 既定では、観測された出力が最高品質のモデルが使用されます。 ただし、目的の出力とテストに基づいて別のモデルを選択できます。 モデルを切り替えると、出力に影響を与える可能性があります。 利用可能なすべてのモデルはビジョン装備されており、画像を確認することもできます。 テキストプロンプトのみを送信する場合は、代わりに コンテンツ生成 を使用できます。
  • Prompt - チャット完了要求の入力を求めるユーザーです。 このフィールドでは String 型の入力がサポートされています。
  • 画像の種類 - 画像の分析が必要な場合にメッセージと共に送信する画像の種類です。 [ ファイル]、[ パブリック URL] のいずれかのオプションを選択します。
    • ファイル - 完了要求に使用する画像ファイルです。 このフィールドでは IResource 型の入力がサポートされています。 このフィールドは、[ 画像の種類 ] が [ファイル] に設定されている場合に表示されます。
    • パブリック URL - ユーザー プロンプトとともに送信する、画像のパブリックにアクセス可能な URL です。 このフィールドでは String 型の入力がサポートされています。 このフィールドは、[ 画像の種類 ] が [パブリック URL] に設定されている場合に表示されます。
  • システム プロンプト - 完了要求のシステム プロンプトまたはコンテキスト命令です。 このフィールドでは String 型の入力がサポートされています。
手記: サポートされる画像ファイル形式は、選択したモデルによって異なります。 新しいモデルがリリースされると、より多くの画像形式が利用可能になります。
  • GPT-4o: PNG (.png)、JPEG (.jpeg および .jpg)、 WEBP (.webp)、およびアニメーション化されていない GIF (.gif)
  • ジェミニフラッシュ:= PNG(.png)、JPEG(.jpegおよび.jpg)。
  • ジェミニプロ= PNG(.png)、JPEG(.jpegおよび.jpg)。
プロパティを管理

[プロパティを管理] ウィザードを使用して、オブジェクトの標準フィールドまたはカスタム フィールドを設定または使用します。フィールドを選択して、アクティビティ キャンバスに追加できます。 追加した標準フィールドまたはカスタム フィールドは、[ プロパティ] パネル (デスクトップ版の Studio) または [ その他のプロパティを表示] (Studio Web の場合) で使用できます。

その他のプロパティ
  • 最大トークン数 - 完了時に生成するトークンの最大数です。 プロンプトのトークン数と結果/完了のトークン数は、このフィールドに指定された値を超えることはできません。 プロンプト トークン カウント用のスペースを確保するために、この値をモデルの最大数より小さく設定することをお勧めします。 デフォルト値は 1024 です。 設定されていない場合、アクティビティは既定で、要求に対応するために必要なトークン、またはモデルで許可されている最大トークン数を使用します。 このフィールドでは Int64 型の入力がサポートされています。
  • 温度 - 使用する創造性因子またはサンプリング温度の値です。 値が大きいほど、モデルの出力は不確定になります。 より創造的な応答または補完を得るには 0.9 に設定し、明確に定義された、またはより正確な答えを含む補完を得るには 0 (最大確率サンプリングとも呼ばれる) に設定します。 一般的には、この値または核サンプル値をデフォルト値から変更することが推奨されており、両方の値を変更することは推奨されていません。 既定値は 0 です。
  • 頻度ペナルティ - -2.0 から 2.0 の数値です。正の値は、テキストにおける既存の頻度に基づいて新しいトークンにペナルティを与え、モデルが同じ行をそのまま繰り返す可能性を減少させます。既定値は 0 です。
  • プレゼンス ペナルティ - -2.0 から 2.0 までの数値。 正の値は、新しいトークンがこれまでにテキストに出現したかどうかに基づいてペナルティを課し、モデルが新しいトピックについて話す可能性を高めます。 既定値は 0 です。
  • 完了の選択肢の数 - 要求に対して生成する完了の選択肢の数です。 このフィールドの値が大きいほど、使用されるトークンの数が多くなります。 その結果コストが高くなるので、このフィールドの値を設定する際はこの点に注意する必要があります。 既定値は 1 です。
  • 停止シーケンス - API がそれ以上トークンの生成を停止するシーケンスを最大 4 つ指定します。 返されるテキストには、停止シーケンスが含まれていません。 既定値は null です。
出力
  • 上位の生成テキスト - 画像分析の完了テキストです。
  • Image analysis object - 応答オブジェクトには、画像分析の完了テキスト、使用されたモデル、その他の詳細が含まれます。
  • 説明
  • プロジェクトの対応 OS
  • 構成

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.