activities
latest
false
重要 :
请注意此内容已使用机器翻译进行了部分本地化。 Integration Service 中提供的连接器包采用的是机器翻译的译文。
Integration Service 活动
Last updated 2024年9月9日

图像分析

描述

Generate completion with a custom prompt that can contain static text, variables, arguments, and also an image file or a publicly accessible image URL.

项目兼容性

Windows | 跨平台

配置

  • 连接 ID - 在 Integration Service 中建立的连接。 访问下拉菜单以选择、添加或管理连接。

  • Model name - The name or ID of the vision model or deployment to use for the completion. This activity defaults to the model with the highest quality observed output. However, you can select a different model based on desired outputs and testing. Switching models can impact the output. All available models are vision-equipped, meaning they can also review an image. If only submitting a text prompt, you can use Content GenerationContent Generation instead.
  • 提示” - 会话补全请求的用户提示。 此字段支持String类型输入。
  • Image type - The type of image to send along with a message if image analysis is needed. Select one of the following options: File, Public URL.
    • File - The image file to be used for the completion request. This field supports IResource type input. This field is displayed if Image type is set to File.
    • Public URL - The publicly accessible URL of the image to send along with the user prompt. This field supports String type input. This field is displayed if Image type is set to Public URL.
  • System prompt - The system prompt or context instruction for the completion request. This field supports String type input.
Note: The supported image file format depends on the selected model. As new models are released, more image formats will be available.
  • GPT-4o: PNG (.png), JPEG (.jpeg and .jpg), WEBP (.webp), and non-animated GIF (.gif).
  • Gemini Flash: = PNG (.png), JPEG (.jpeg and .jpg).
  • Gemini Pro = PNG (.png), JPEG (.jpeg and .jpg).
管理属性

使用“管理属性”向导配置或使用对象的任何标准或自定义字段。 您可以选择字段以将其添加到活动画布中。 添加的标准或自定义字段可在“属性”面板(在 Studio Desktop 中)或在“显示其他属性”下(在 Studio Web 中)下找到。

其他属性
  • Maximum tokens count - The maximum number of tokens to generate in the completion. The token count of your prompt plus those from the result/completion cannot exceed the value provided for this field. It's best to set this value to be less than the model's maximum count so as to have some room for the prompt token count. Default value is 1024. If not set, the activity defaults to the necessary tokens to accommodate the request or the maximum tokens allowed by the model. This field supports Int64 type input.
  • 温度- 要使用的创意因子或采样温度的值。 值越高意味着模型将承担更多的风险。 对于更具创意的响应或完成情况,请尝试 0.9,对于具有明确定义或更精确答案的响应或完成情况,尝试使用 0(也称为“参数最大采样”)。 一般建议更改此默认值或“Nucleus 样本”值,但不要同时更改这两个值。 默认值为 1。
  • 频率惩罚- 介于 -2.0 和 2.0 之间的数字。 正值根据新令牌在文本中的现有频率对新令牌进行惩罚,从而降低模型逐字重复同一行的可能性。 默认值为 0。
  • 存在惩罚- 介于 -2.0 和 2.0 之间的数字。 正值根据新令牌到目前为止是否出现在文本中来惩罚新令牌,从而增加模型谈论新主题的可能性。 默认值为 0。
  • 补全选项计数”- 为请求生成的补全选项数量。 此字段的值越大,要使用的令牌数量就越多。 这会导致更高的成本,因此您在设置此字段的值时需要注意这一点。 默认值为 1。
  • “停止序列” - 最多四个序列,API 将在其中停止生成更多令牌。 返回的文本不包含停止序列。 默认值为 null。
输出
  • Top generated text - The image analysis completion text. Automatically generated output variable.
  • Image analysis object - The response object contains the image analysis completion text, the model used, and other details. Automatically generated output variable.
  • 描述
  • 项目兼容性
  • 配置

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。