activities
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 Integration Service で提供されるコネクタ パッケージは機械翻訳で処理されています。
Integration Service のアクティビティ
Last updated 2024年9月9日

画像分析

説明

Generate completion with a custom prompt that can contain static text, variables, arguments, and also an image file or a publicly accessible image URL.

プロジェクトの対応 OS

Windows | クロスプラットフォーム

構成

  • コネクション ID - Integration Service で確立されたコネクションです。ドロップダウン メニューからコネクションを選択、追加、または管理します。

  • Model name - The name or ID of the vision model or deployment to use for the completion. This activity defaults to the model with the highest quality observed output. However, you can select a different model based on desired outputs and testing. Switching models can impact the output. All available models are vision-equipped, meaning they can also review an image. If only submitting a text prompt, you can use Content GenerationContent Generation instead.
  • Prompt - チャット完了要求の入力を求めるユーザーです。 このフィールドでは String 型の入力がサポートされています。
  • Image type - The type of image to send along with a message if image analysis is needed. Select one of the following options: File, Public URL.
    • File - The image file to be used for the completion request. This field supports IResource type input. This field is displayed if Image type is set to File.
    • Public URL - The publicly accessible URL of the image to send along with the user prompt. This field supports String type input. This field is displayed if Image type is set to Public URL.
  • System prompt - The system prompt or context instruction for the completion request. This field supports String type input.
Note: The supported image file format depends on the selected model. As new models are released, more image formats will be available.
  • GPT-4o: PNG (.png), JPEG (.jpeg and .jpg), WEBP (.webp), and non-animated GIF (.gif).
  • Gemini Flash: = PNG (.png), JPEG (.jpeg and .jpg).
  • Gemini Pro = PNG (.png), JPEG (.jpeg and .jpg).
プロパティを管理

[プロパティを管理] ウィザードを使用して、オブジェクトの標準フィールドまたはカスタム フィールドを設定または使用します。フィールドを選択して、アクティビティ キャンバスに追加できます。 追加した標準フィールドまたはカスタム フィールドは、[ プロパティ] パネル (デスクトップ版の Studio) または [ その他のプロパティを表示] (Studio Web の場合) で使用できます。

その他のプロパティ
  • Maximum tokens count - The maximum number of tokens to generate in the completion. The token count of your prompt plus those from the result/completion cannot exceed the value provided for this field. It's best to set this value to be less than the model's maximum count so as to have some room for the prompt token count. Default value is 1024. If not set, the activity defaults to the necessary tokens to accommodate the request or the maximum tokens allowed by the model. This field supports Int64 type input.
  • 温度 - 使用する創造性因子またはサンプリング温度の値です。値が大きいほど、モデルの出力は不確定になります。より創造的な応答または補完を得る場合は「0.9」に設定し、明確に定義されたまたはより正確な答えを含む補完を得る場合は「0」(最大確率サンプリングともいう) に設定します。一般的には、この値または核サンプル値を既定値から変更することが推奨されており、両方の値を変更することは推奨されていません。既定値は 1 です。
  • 頻度ペナルティ - -2.0 から 2.0 の数値です。正の値は、テキストにおける既存の頻度に基づいて新しいトークンにペナルティを与え、モデルが同じ行をそのまま繰り返す可能性を減少させます。既定値は 0 です。
  • プレゼンス ペナルティ - -2.0 から 2.0 までの数値。 正の値は、新しいトークンがこれまでにテキストに出現したかどうかに基づいてペナルティを課し、モデルが新しいトピックについて話す可能性を高めます。 既定値は 0 です。
  • 完了の選択肢の数 - 要求に対して生成する完了の選択肢の数です。 このフィールドの値が大きいほど、使用されるトークンの数が多くなります。 その結果コストが高くなるので、このフィールドの値を設定する際はこの点に注意する必要があります。 既定値は 1 です。
  • 停止シーケンス - API がそれ以上トークンの生成を停止するシーケンスを最大 4 つ指定します。 返されるテキストには、停止シーケンスが含まれていません。 既定値は null です。
出力
  • Top generated text - The image analysis completion text. Automatically generated output variable.
  • Image analysis object - The response object contains the image analysis completion text, the model used, and other details. Automatically generated output variable.
  • 説明
  • プロジェクトの対応 OS
  • 構成

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.