activities
latest
false
Importante :
Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. Los paquetes de conectores disponibles en Integration Service están traducidos con traducción automática.
Actividades de Integration Service
Last updated 9 de sep. de 2024

Image Analysis

Descripción

Generate completion with a custom prompt that can contain static text, variables, arguments, and also an image file or a publicly accessible image URL.

Compatibilidad de proyectos

Windows | Multiplataforma

Configuración

  • ID de conexión : la conexión establecida en Integration Service. Accede al menú desplegable para elegir, añadir o gestionar conexiones.

  • Model name - The name or ID of the vision model or deployment to use for the completion. This activity defaults to the model with the highest quality observed output. However, you can select a different model based on desired outputs and testing. Switching models can impact the output. All available models are vision-equipped, meaning they can also review an image. If only submitting a text prompt, you can use Content GenerationContent Generation instead.
  • Solicitud : la solicitud del usuario para la solicitud de finalización del chat. Este campo admite entrada de tipo String .
  • Image type - The type of image to send along with a message if image analysis is needed. Select one of the following options: File, Public URL.
    • File - The image file to be used for the completion request. This field supports IResource type input. This field is displayed if Image type is set to File.
    • Public URL - The publicly accessible URL of the image to send along with the user prompt. This field supports String type input. This field is displayed if Image type is set to Public URL.
  • System prompt - The system prompt or context instruction for the completion request. This field supports String type input.
Note: The supported image file format depends on the selected model. As new models are released, more image formats will be available.
  • GPT-4o: PNG (.png), JPEG (.jpeg and .jpg), WEBP (.webp), and non-animated GIF (.gif).
  • Gemini Flash: = PNG (.png), JPEG (.jpeg and .jpg).
  • Gemini Pro = PNG (.png), JPEG (.jpeg and .jpg).
Administrar propiedades

Utiliza el asistente Administrar propiedades para configurar o utilizar cualquiera de los campos estándar o personalizados del objeto. Puedes seleccionar campos para añadirlos al lienzo de actividad. Los campos estándar o personalizados añadidos están disponibles en el panel Propiedades (en Studio Desktop) o en Mostrar propiedades adicionales (en Studio Web).

Propiedades adicionales
  • Maximum tokens count - The maximum number of tokens to generate in the completion. The token count of your prompt plus those from the result/completion cannot exceed the value provided for this field. It's best to set this value to be less than the model's maximum count so as to have some room for the prompt token count. Default value is 1024. If not set, the activity defaults to the necessary tokens to accommodate the request or the maximum tokens allowed by the model. This field supports Int64 type input.
  • Temperatura : el valor del factor de creatividad o la temperatura de muestreo que se va a utilizar. Los valores más altos significan que el modelo asumirá más riesgos. Prueba 0.9 para respuestas o finalizaciones más creativas, o 0 (también llamado muestreo argmax) para las que tienen una respuesta bien definida o más exacta. La recomendación general es modificar, desde el valor predeterminado, este o el valor de Muestra de núcleo, pero no ambos valores. El valor predeterminado es 1.
  • Penalización de frecuencia : número entre -2.0 y 2.0. Los valores positivos penalizan los nuevos tokens en función de su frecuencia existente en el texto, lo que reduce la probabilidad del modelo de repetir la misma línea palabra por palabra. El valor predeterminado es 0.
  • Penalización de presencia : número entre -2.0 y 2.0. Los valores positivos penalizan los nuevos tokens en función de si aparecen en el texto hasta el momento, lo que aumenta la probabilidad del modelo de hablar sobre nuevos temas. El valor predeterminado es 0.
  • Recuento de opciones de finalización : el número de opciones de finalización que se generarán para la solicitud. Cuanto mayor sea el valor de este campo, mayor será el número de tokens que se utilizarán. Esto da como resultado un coste mayor, por lo que debes tenerlo en cuenta al establecer el valor de este campo. El valor predeterminado es 1.
  • Detener secuencia : hasta cuatro secuencias en las que la API dejará de generar más tokens. El texto devuelto no contiene la secuencia de detención. El valor predeterminado es nulo.
Salida
  • Top generated text - The image analysis completion text. Automatically generated output variable.
  • Image analysis object - The response object contains the image analysis completion text, the model used, and other details. Automatically generated output variable.
  • Descripción
  • Compatibilidad de proyectos
  • Configuración

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.