activities

latest

false

Importante :

A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Atividades do Integration Service

Última atualização 15 de set de 2025

Análise de Imagem

Description

Gere conclusão com uma solicitação personalizada que pode conter texto estático, variáveis, argumentos e também um arquivo de imagem ou um URL de imagem acessível publicamente.

Compatibilidade do projeto

Windows | Multiplataforma

Configuração

Conexão — a conexão estabelecida no Integration Service. Acesse o menu suspenso para escolher, adicionar ou gerenciar conexões.

Nome do modelo – O nome ou identificação do modelo de visão ou implantação a ser usado para a conclusão. Essa atividade tem como padrão o modelo com a saída de maior qualidade observada. No entanto, você pode selecionar um modelo diferente com base nas saídas e testes desejados. A mudança de modelos pode afetar a saída. Todos os modelos disponíveis são equipados com visão, o que significa que também podem revisar uma imagem. Se estiver enviando apenas uma solicitação de texto, você pode usar a atividade Content Generation.
Prompt – O prompt do usuário para a solicitação de conclusão do chat. Esse campo é compatível com entrada do tipo String.
Tipo de imagem – O tipo de imagem a ser enviado junto com uma mensagem se a análise de imagem for necessária. Selecione uma das seguintes opções: Arquivo, URL pública.
- Arquivo – O arquivo da imagem a ser usado para a solicitação de conclusão. Esse campo é compatível com entrada de tipo IResource. Esse campo é exibido se o tipo de imagem estiver definido como Arquivo.
- URL pública – O URL acessível publicamente da imagem a ser enviada junto com o prompt do usuário. Esse campo é compatível com entrada de tipo String. Esse campo é exibido se o tipo de imagem for definido como URL Pública.
Prompt do sistema – O prompt do sistema ou instrução de contexto para a solicitação de completamento. Esse campo é compatível com entrada do tipo String.

Observação: o formato de arquivo de imagem compatível depende do modelo selecionado. À medida que novos modelos são lançados, mais formatos de imagem estarão disponíveis.

GPT-4o: PNG (.png), JPEG (.jpeg e .jpg), WEBP (.webp) e GIF não-animado (.gif).
Gemini Flash: = PNG (.png), JPEG (.jpeg e .jpg).
Gemini Pro = PNG (.png), JPEG (.jpeg e .jpg).

Gerenciar propriedades

Use o assistente Gerenciar Propriedades para configurar ou usar qualquer um dos campos padrão ou personalizados do objeto. Você pode selecionar campos para adicioná-los à tela da atividade. Os campos padrão ou personalizados adicionados ficam disponíveis no painel Propriedades (no Studio Desktop) ou em Mostrar propriedades adicionais (no Studio Web).

Propriedades adicionais

Número máximo de tokens – O número máximo de tokens a serem gerados na conclusão.A contagem de tokens da sua solicitação mais as do resultado/conclusão não podem exceder o valor fornecido para este campo. É melhor definir esse valor para que seja menor do que a contagem máxima do modelo para ter algum espaço para a contagem de tokens do prompt. O valor padrão é 1024. Se não definida, a atividade tem como padrão os tokens necessários para acomodar a solicitação ou o máximo de tokens permitidos pelo modelo. Esse campo é compatível com entrada do tipo Int64.
Temperatura – O valor do fator de criatividade ou temperatura de amostragem a ser usado. Valores mais altos significam que o modelo assumirá mais riscos. Tente 0,9 para respostas ou conclusões mais criativas ou 0 (também chamado de amostragem argmax) para aqueles com uma resposta bem definida ou mais exata. A recomendação geral é alterar, do valor padrão, esse ou o valor da Amostra de Nucleus, mas não ambos os valores. O valor padrão é 0.

Penalidade de frequência – Número entre -2.0 e 2.0. Os valores positivos penalizam novos tokens com base em sua frequência existente no texto, diminuindo a probabilidade do modelo repetir a mesma linha literalmente. O valor padrão é 0.
Penalidade de presença – Número entre -2.0 e 2.0. Os valores positivos penalizam novos tokens com base na possibilidade de eles aparecerem no texto até o momento, aumentando a probabilidade de o modelo falar sobre novos tópicos. O valor padrão é 0.
Número de opções de conclusão – O número de opções de conclusão a serem geradas para a solicitação. Quanto maior o valor desse campo, maior o número de tokens que serão usados. Isso resulta em um custo maior, então você precisa estar ciente disso ao definir o valor desse campo. O valor padrão é 1.
Sequência de interrupção – Até quatro sequências em que a API interromperá a geração de mais tokens. O texto retornado não contém a sequência de parada. O valor padrão é nulo.

Saída

Texto gerado no topo – O texto de conclusão da análise de imagem.
Objeto de análise de imagem – O objeto de resposta contém o texto de conclusão da análise de imagem, o modelo usado e outros detalhes.