activities
latest
false
重要 :
请注意此内容已使用机器翻译进行了部分本地化。 Integration Service 中提供的连接器包采用的是机器翻译的译文。
UiPath logo, featuring letters U and I in white

Integration Service 活动

上次更新日期 2024年12月16日

图像分析

描述

使用自定义提示词生成补全,提示词中可以包含静态文本、变量、参数以及图像文件或可公开访问的图像 URL。

项目兼容性

Windows | 跨平台

配置

  • 连接 ID - 在 Integration Service 中建立的连接。 访问下拉菜单以选择、添加或管理连接。

  • 模型名称 - 用于补全的视觉模型或部署的名称或 ID。此活动默认使用的模型是具有最高质量观察到的输出的模型。但是,您可以根据所需的输出和测试选择不同的模型。切换模型可能会影响输出。所有可用的模型都具有视觉功能,这意味着它们还可以查看图像。如果仅提交文本提示词,您可以改用“内容生成”
  • 提示词 - 用户发出聊天补全请求的用户提示词。此字段支持 String 类型的输入。
  • 图像类型 - 需要进行图像分析时,要随消息一起发送的图像类型。选择以下选项之一:文件公共 URL
    • 文件 - 用于补全请求的图像文件。此字段支持 IResource 类型的输入。如果将“图像类型”设置为“文件”,则会显示此字段。
    • 公共 URL - 要随用户提示词一起发送的可公开访问的图像 URL。此字段支持 String 类型的输入。如果将“图像类型”设置为“公共 URL”,则会显示此字段。
  • 系统提示词 - 补全请求的系统提示词或上下文指令。此字段支持 String 类型的输入。
注意:支持的图像文件格式取决于所选模型。随着新模型的发布,将提供更多的图像格式。
  • GPT-4o:PNG (.png)、JPEG(.jpeg 和 .jpg)、WEBP (.webp) 和非动画 GIF (.gif)。
  • Gemini Flash:PNG (.png)、JPEG(.jpeg 和 .jpg)。
  • Gemini Pro = PNG (.png)、JPEG(.jpeg 和 .jpg)。
管理属性

使用“管理属性”向导配置或使用对象的任何标准或自定义字段。 您可以选择字段以将其添加到活动画布中。 添加的标准或自定义字段可在“属性”面板(在 Studio Desktop 中)或在“显示其他属性”下(在 Studio Web 中)下找到。

其他属性
  • 最大令牌数 - 补全时要生成的最大令牌数。提示的令牌计数加上来自结果/补全的令牌计数不能超过为此字段提供的值。最好将此值设置为小于模型最大计数的值,以便为提示令牌计数留出一些空间。默认值为 1024。如果未设置,则活动默认设置为满足请求的必要令牌或模型允许的最大令牌数。此字段支持 Int64 类型的输入。
  • 温度 - 要使用的创意因素或采样温度的值。值越高意味着模型将承担越大的风险。对于更具创意的响应或补全情况,请尝试使用 0.9,对于具有明确定义或更精确答案的响应或补全情况,尝试使用 0,这也称为贪婪 (argmax) 采样。一般建议是更改此值或“核心采样”值的默认值,但不要同时更改两个值。默认值为 0。
  • 频率罚分 - 介于 -2.0 和 2.0 之间的数字。正值根据文本中的现有频率对新标记给出罚分,从而降低模型逐字重复同一行的可能性。默认值为 0。
  • 存在罚分 - 介于 -2.0 和 2.0 之间的数字。正值根据新令牌到目前为止是否出现在文本中来对新令牌给出罚分,从而增加模型谈论新主题的可能性。默认值为 0。
  • 补全选择计数 - 要为请求生成的补全选项数量。此字段的值越大,使用的令牌数量就越多。这会导致更高的成本,因此您在设置此字段的值时需要注意这一点。默认值为 1。
  • 停止序列 - 最多四个序列,API 将停止在其中生成更多令牌。返回的文本不包含停止序列。默认值为 null。
输出
  • 热门生成文本 - 图像分析补全文本。
  • 图像分析对象 - 响应对象包含图像分析补全文本、使用的模型,以及其他详细信息。
  • 描述
  • 项目兼容性
  • 配置

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。