activities
latest
false
Importante :
A tradução automática foi aplicada parcialmente neste conteúdo. A tradução dos pacotes de Conetores disponíveis no Integration Service é efetuada automaticamente.
Atividades do Integration Service
Last updated 9 de set de 2024

Análise de Imagem

Description

Generate completion with a custom prompt that can contain static text, variables, arguments, and also an image file or a publicly accessible image URL.

Compatibilidade do projeto

Windows | Multiplataforma

Configuração

  • ID da conexão — a conexão estabelecida no Integration Service. Acesse o menu suspenso para escolher, adicionar ou gerenciar conexões.

  • Model name - The name or ID of the vision model or deployment to use for the completion. This activity defaults to the model with the highest quality observed output. However, you can select a different model based on desired outputs and testing. Switching models can impact the output. All available models are vision-equipped, meaning they can also review an image. If only submitting a text prompt, you can use Content GenerationContent Generation instead.
  • Solicitação - O aviso do usuário para a solicitação de conclusão do chat. Este campo é compatível com String entrada do tipo.
  • Image type - The type of image to send along with a message if image analysis is needed. Select one of the following options: File, Public URL.
    • File - The image file to be used for the completion request. This field supports IResource type input. This field is displayed if Image type is set to File.
    • Public URL - The publicly accessible URL of the image to send along with the user prompt. This field supports String type input. This field is displayed if Image type is set to Public URL.
  • System prompt - The system prompt or context instruction for the completion request. This field supports String type input.
Note: The supported image file format depends on the selected model. As new models are released, more image formats will be available.
  • GPT-4o: PNG (.png), JPEG (.jpeg and .jpg), WEBP (.webp), and non-animated GIF (.gif).
  • Gemini Flash: = PNG (.png), JPEG (.jpeg and .jpg).
  • Gemini Pro = PNG (.png), JPEG (.jpeg and .jpg).
Gerenciar propriedades

Use o assistente Gerenciar Propriedades para configurar ou usar qualquer um dos campos padrão ou personalizados do objeto. Você pode selecionar campos para adicioná-los à tela da atividade. Os campos padrão ou personalizados adicionados ficam disponíveis no painel Propriedades (no Studio Desktop) ou em Mostrar propriedades adicionais (no Studio Web).

Propriedades adicionais
  • Maximum tokens count - The maximum number of tokens to generate in the completion. The token count of your prompt plus those from the result/completion cannot exceed the value provided for this field. It's best to set this value to be less than the model's maximum count so as to have some room for the prompt token count. Default value is 1024. If not set, the activity defaults to the necessary tokens to accommodate the request or the maximum tokens allowed by the model. This field supports Int64 type input.
  • Temperatura — o valor do fator de criatividade ou a taxa de amostra a ser usada. Valores mais altos significam que o modelo assumirá mais riscos. Tente 0,9 para respostas ou conclusões mais criativas, ou 0 (também chamado de amostra de argmax) para aquelas com uma resposta bem definida ou mais exata. A recomendação geral é alterar, do valor padrão, este ou o valor de Nucleus Sample, mas não ambos. O valor padrão é 1.
  • Penalidade de frequência - Número entre -2.0 e 2.0. Valores positivos penalizam novos tokens com base em sua frequência existente no texto, diminuindo a probabilidade de o modelo repetir a mesma linha textual. O valor padrão é 0.
  • Penalidade de presença - Número entre -2.0 e 2.0. Os valores positivos penalizam novos tokens com base na possibilidade de eles aparecerem no texto até o momento, aumentando a probabilidade de o modelo falar sobre novos tópicos. O valor padrão é 0.
  • Contagem de opções de conclusão - O número de opções de conclusão a serem geradas para a solicitação. Quanto maior o valor desse campo, maior o número de tokens que serão usados. Isso resulta em um custo mais alto, portanto, você precisa estar ciente disso ao definir o valor deste campo. O valor padrão é 1.
  • Sequência parada - Até quatro sequências em que a API deixará de gerar mais tokens. O texto retornado não contém a sequência de parada. O valor padrão é nulo.
Saída
  • Top generated text - The image analysis completion text. Automatically generated output variable.
  • Image analysis object - The response object contains the image analysis completion text, the model used, and other details. Automatically generated output variable.
  • Description
  • Compatibilidade do projeto
  • Configuração

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.