activities
latest
false
Importante :
A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.
UiPath logo, featuring letters U and I in white

Atividades do Integration Service

Última atualização 15 de set de 2025

Análise de Imagem

Description

Gere conclusão com uma solicitação personalizada que pode conter texto estático, variáveis, argumentos e também um arquivo de imagem ou um URL de imagem acessível publicamente.

Compatibilidade do projeto

Windows | Multiplataforma

Configuração

  • Conexão — a conexão estabelecida no Integration Service. Acesse o menu suspenso para escolher, adicionar ou gerenciar conexões.

  • Nome do modelo – O nome ou identificação do modelo de visão ou implantação a ser usado para a conclusão. Essa atividade tem como padrão o modelo com a saída de maior qualidade observada. No entanto, você pode selecionar um modelo diferente com base nas saídas e testes desejados. A mudança de modelos pode afetar a saída. Todos os modelos disponíveis são equipados com visão, o que significa que também podem revisar uma imagem. Se estiver enviando apenas uma solicitação de texto, você pode usar a atividade Content Generation.
  • Prompt – O prompt do usuário para a solicitação de conclusão do chat. Esse campo é compatível com entrada do tipo String.
  • Tipo de imagem – O tipo de imagem a ser enviado junto com uma mensagem se a análise de imagem for necessária. Selecione uma das seguintes opções: Arquivo, URL pública.
    • Arquivo – O arquivo da imagem a ser usado para a solicitação de conclusão. Esse campo é compatível com entrada de tipo IResource. Esse campo é exibido se o tipo de imagem estiver definido como Arquivo.
    • URL pública – O URL acessível publicamente da imagem a ser enviada junto com o prompt do usuário. Esse campo é compatível com entrada de tipo String. Esse campo é exibido se o tipo de imagem for definido como URL Pública.
  • Prompt do sistema – O prompt do sistema ou instrução de contexto para a solicitação de completamento. Esse campo é compatível com entrada do tipo String.
Observação: o formato de arquivo de imagem compatível depende do modelo selecionado. À medida que novos modelos são lançados, mais formatos de imagem estarão disponíveis.
  • GPT-4o: PNG (.png), JPEG (.jpeg e .jpg), WEBP (.webp) e GIF não-animado (.gif).
  • Gemini Flash: = PNG (.png), JPEG (.jpeg e .jpg).
  • Gemini Pro = PNG (.png), JPEG (.jpeg e .jpg).
Gerenciar propriedades

Use o assistente Gerenciar Propriedades para configurar ou usar qualquer um dos campos padrão ou personalizados do objeto. Você pode selecionar campos para adicioná-los à tela da atividade. Os campos padrão ou personalizados adicionados ficam disponíveis no painel Propriedades (no Studio Desktop) ou em Mostrar propriedades adicionais (no Studio Web).

Propriedades adicionais
  • Número máximo de tokens – O número máximo de tokens a serem gerados na conclusão.A contagem de tokens da sua solicitação mais as do resultado/conclusão não podem exceder o valor fornecido para este campo. É melhor definir esse valor para que seja menor do que a contagem máxima do modelo para ter algum espaço para a contagem de tokens do prompt. O valor padrão é 1024. Se não definida, a atividade tem como padrão os tokens necessários para acomodar a solicitação ou o máximo de tokens permitidos pelo modelo. Esse campo é compatível com entrada do tipo Int64.
  • Temperatura – O valor do fator de criatividade ou temperatura de amostragem a ser usado. Valores mais altos significam que o modelo assumirá mais riscos. Tente 0,9 para respostas ou conclusões mais criativas ou 0 (também chamado de amostragem argmax) para aqueles com uma resposta bem definida ou mais exata. A recomendação geral é alterar, do valor padrão, esse ou o valor da Amostra de Nucleus, mas não ambos os valores. O valor padrão é 0.
  • Penalidade de frequência – Número entre -2.0 e 2.0. Os valores positivos penalizam novos tokens com base em sua frequência existente no texto, diminuindo a probabilidade do modelo repetir a mesma linha literalmente. O valor padrão é 0.
  • Penalidade de presença – Número entre -2.0 e 2.0. Os valores positivos penalizam novos tokens com base na possibilidade de eles aparecerem no texto até o momento, aumentando a probabilidade de o modelo falar sobre novos tópicos. O valor padrão é 0.
  • Número de opções de conclusão – O número de opções de conclusão a serem geradas para a solicitação. Quanto maior o valor desse campo, maior o número de tokens que serão usados. Isso resulta em um custo maior, então você precisa estar ciente disso ao definir o valor desse campo. O valor padrão é 1.
  • Sequência de interrupção – Até quatro sequências em que a API interromperá a geração de mais tokens. O texto retornado não contém a sequência de parada. O valor padrão é nulo.
Saída
  • Texto gerado no topo – O texto de conclusão da análise de imagem.
  • Objeto de análise de imagem – O objeto de resposta contém o texto de conclusão da análise de imagem, o modelo usado e outros detalhes.

Limitações

Os modelos GPT-4 têm certas limitações ao trabalhar com imagens. Consulte a documentação da Plataforma OpenAI para saber mais: Limitações.

  • Description
  • Compatibilidade do projeto
  • Configuração
  • Limitações

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo
Confiança e segurança
© 2005-2025 UiPath. Todos os direitos reservados.