activities
latest
false
Importante :
A tradução automática foi aplicada parcialmente neste conteúdo. A tradução dos pacotes de Conetores disponíveis no Integration Service é efetuada automaticamente.
UiPath logo, featuring letters U and I in white
Atividades do Integration Service
Last updated 5 de nov de 2024

Análise de Imagem

Description

Gere a conclusão com um prompt personalizado que pode conter texto estático, variáveis, argumentos e também um arquivo de imagem ou um URL de imagem acessível ao público.

Compatibilidade do projeto

Windows | Multiplataforma

Configuração

  • ID da conexão — a conexão estabelecida no Integration Service. Acesse o menu suspenso para escolher, adicionar ou gerenciar conexões.

  • Nome do modelo - O nome ou ID do modelo da visão ou implantação a ser usada para a conclusão. O padrão dessa atividade é o modelo com a saída observada da mais alta qualidade. No entanto, você pode selecionar um modelo diferente com base nas saídas e nos testes desejados. A troca de modelos pode afetar a saída. Todos os modelos disponíveis são equipadas com visão, o que significa que eles também podem revisar uma imagem. Se estiver enviando apenas um prompt de texto, em vez disso você pode usar a Geração de conteúdo .
  • Solicitação - O aviso do usuário para a solicitação de conclusão do chat. Este campo é compatível com String entrada do tipo.
  • Tipo de imagem - O tipo de imagem a ser enviada com uma mensagem se a análise de imagem for necessária. Selecione uma das seguintes opções: Arquivo, URL pública.
    • Arquivo — o arquivo de imagem a ser usado para a solicitação de conclusão. Esse campo é compatível com entrada do tipo IResource . Esse campo é exibido se Tipo de imagem for definido como Arquivo.
    • URL público - O URL acessível publicamente da imagem a ser enviada junto com o prompt do usuário. Esse campo é compatível com entrada do tipo String . Esse campo é exibido se Tipo de imagem for definido como URL pública.
  • Prompt do sistema - O prompt do sistema ou instrução de contexto para a solicitação de conclusão. Esse campo é compatível com entrada do tipo String .
Observação: o formato de arquivo de imagem suportado depende do modelo selecionado. À medida que novos modelos são lançados, mais formatos de imagem estarão disponíveis.
  • GPT-4o: PNG (.png), JPEG (.jpeg e .jpg), WEBP (.webp) e GIF não animado (.gif).
  • Gemini Flash: = PNG (.png), JPEG (.jpeg e .jpg).
  • Gemini Pro = PNG (.png), JPEG (.jpeg e .jpg).
Gerenciar propriedades

Use o assistente Gerenciar Propriedades para configurar ou usar qualquer um dos campos padrão ou personalizados do objeto. Você pode selecionar campos para adicioná-los à tela da atividade. Os campos padrão ou personalizados adicionados ficam disponíveis no painel Propriedades (no Studio Desktop) ou em Mostrar propriedades adicionais (no Studio Web).

Propriedades adicionais
  • Contagem máxima de tokens — o número máximo de tokens a serem gerados na conclusão. A contagem de tokens da sua solicitação mais as do resultado/conclusão não podem exceder o valor fornecido para este campo. É melhor definir esse valor como menor do que a contagem máxima do modelo para ter espaço para a contagem de tokens da solicitação. O valor padrão é 1024. Caso não seja definido, a atividade usará os tokens necessários para acomodar a solicitação ou o máximo de tokens permitido pelo modelo. Esse campo é compatível com entrada do tipo Int64 .
  • Temperatura - O valor do fator criatividade ou temperatura de amostra a ser usada. Valores mais altos significam que o modelo assumirá mais riscos. Experimente 0,9 para respostas mais criativas ou conclusões ou 0 (também chamado de amostra de argmax) para aquelas com uma resposta bem definida ou mais exata. A recomendação geral é alterar, do valor padrão, este ou o valor de Exemplo de núcleo, mas não ambos os valores. O valor padrão é 0.
  • Penalidade de frequência - Número entre -2.0 e 2.0. Valores positivos penalizam novos tokens com base em sua frequência existente no texto, diminuindo a probabilidade de o modelo repetir a mesma linha textual. O valor padrão é 0.
  • Penalidade de presença - Número entre -2.0 e 2.0. Os valores positivos penalizam novos tokens com base na possibilidade de eles aparecerem no texto até o momento, aumentando a probabilidade de o modelo falar sobre novos tópicos. O valor padrão é 0.
  • Contagem de opções de conclusão - O número de opções de conclusão a serem geradas para a solicitação. Quanto maior o valor desse campo, maior o número de tokens que serão usados. Isso resulta em um custo mais alto, portanto, você precisa estar ciente disso ao definir o valor deste campo. O valor padrão é 1.
  • Sequência parada - Até quatro sequências em que a API deixará de gerar mais tokens. O texto retornado não contém a sequência de parada. O valor padrão é nulo.
Saída
  • Texto gerado principal - O texto de conclusão da análise de imagem.
  • Objeto de análise de imagem - O objeto de resposta contém o texto de conclusão da análise de imagem, o modelo usado e outros detalhes.
  • Description
  • Compatibilidade do projeto
  • Configuração

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.