activities
latest
false
重要 :
请注意此内容已使用机器翻译进行了部分本地化。 Integration Service 中提供的连接器包采用的是机器翻译的译文。
UiPath logo, featuring letters U and I in white
Integration Service 活动
Last updated 2024年11月5日

图像分析

描述

使用自定义提示生成补全,其中可以包含静态文本、变量、参数以及图像文件或可公开访问的图像 URL。

项目兼容性

Windows | 跨平台

配置

  • 连接 ID - 在 Integration Service 中建立的连接。 访问下拉菜单以选择、添加或管理连接。

  • 模型名称- 用于完成的视觉模型或部署的名称或 ID。 此活动默认使用具有最高质量观察到的输出的模型。 但是,您可以根据所需的输出和测试选择不同的模型。 切换模型可能会影响输出。 所有可用的模型都具有 Vision 功能,这意味着它们还可以查看图像。 如果仅提交文本提示,您可以改用内容生成
  • 提示” - 会话补全请求的用户提示。 此字段支持String类型输入。
  • 图像类型- 需要进行图像分析时随消息发送的图像类型。 选择以下选项之一:文件公共 URL
    • 文件” - 用于完成请求的图像文件。 此字段支持IResource型输入。 如果将“图像类型”设置为 “文件”,则会显示此字段。
    • 公共 URL - 要与用户提示一起发送的可公开访问的图像 URL。 此字段支持String型输入。 如果将“图像类型”设置为“公共 URL ”,则会显示此字段。
  • 系统提示- 用于完成请求的系统提示或上下文说明。 此字段支持String型输入。
注意:支持的图像文件格式取决于所选模型。 随着新模型的发布,将提供更多的图像格式。
  • GPT-4o:PNG (.png)、JPEG(.jpeg 和 .jpg)、 WEBP (.webp) 和非动画 GIF (.gif)。
  • Gemini Flash:= PNG (.png)、JPEG(.jpeg 和 .jpg)。
  • Gemini Pro = PNG (.png)、JPEG(.jpeg 和 .jpg)。
管理属性

使用“管理属性”向导配置或使用对象的任何标准或自定义字段。 您可以选择字段以将其添加到活动画布中。 添加的标准或自定义字段可在“属性”面板(在 Studio Desktop 中)或在“显示其他属性”下(在 Studio Web 中)下找到。

其他属性
  • 最大令牌数- 完成时要生成的最大令牌数。 提示的令牌计数加上结果/完成中的令牌计数不能超过为此字段提供的值。 最好将此值设置为小于模型的最大计数的值,以便为提示令牌计数留出一些空间。 默认值为 1024。 如果未设置,则活动默认为满足请求的必要令牌或模型允许的最大令牌数。 此字段支持Int64型输入。
  • 温度- 要使用的创意因子或抽样温度的值。 值越高意味着模型将承担更大的风险。 对于更具创意的响应或完成情况,请尝试使用 0.9,对于具有明确定义或更精确答案的响应或完成情况,尝试使用 0(也称为参数最大抽样)。 一般建议是更改此值或“Nucleus Sample”值的默认值,但不要同时更改两个值。 默认值为 0。
  • 频率惩罚- 介于 -2.0 和 2.0 之间的数字。 正值根据新令牌在文本中的现有频率对新令牌进行惩罚,从而降低模型逐字重复同一行的可能性。 默认值为 0。
  • 存在惩罚- 介于 -2.0 和 2.0 之间的数字。 正值根据新令牌到目前为止是否出现在文本中来惩罚新令牌,从而增加模型谈论新主题的可能性。 默认值为 0。
  • 补全选项计数”- 为请求生成的补全选项数量。 此字段的值越大,要使用的令牌数量就越多。 这会导致更高的成本,因此您在设置此字段的值时需要注意这一点。 默认值为 1。
  • “停止序列” - 最多四个序列,API 将在其中停止生成更多令牌。 返回的文本不包含停止序列。 默认值为 null。
输出
  • 优先生成的文本- 图像分析完成文本。
  • 图像分析对象- 响应对象包含图像分析完成文本、使用的模型和其他详细信息。
  • 描述
  • 项目兼容性
  • 配置

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。