activities
latest
false
Importante :
Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.
UiPath logo, featuring letters U and I in white

Actividades de Integration Service

Última actualización 22 de may. de 2025

Image Analysis

Descripción

Genera finalización con una solicitud personalizada que puede contener texto estático, variables, argumentos y también un archivo de imagen o una URL de imagen accesible públicamente.

Compatibilidad de proyectos

Windows | Multiplataforma

Configuración

  • ID de conexión : la conexión establecida en Integration Service. Accede al menú desplegable para elegir, añadir o gestionar conexiones.

  • Nombre del modelo: el nombre o ID del modelo de visión o implementación que se utilizará para la finalización. Esta actividad se predetermina con el modelo con la salida de la más alta calidad observada. Sin embargo, puedes seleccionar un modelo diferente basado en las salidas y pruebas deseadas.Cambiar modelos puede afectar a la salida. Todos los modelos disponibles están equipados con visión, lo que significa que también pueden analizar una imagen. Si solo envías una entrada de texto, puedes utilizar Generación de contenido.
  • Solicitud: la solicitud del usuario para la finalización del chat. Este campo admite entrada de tipo String.
  • Tipo de imagen: el tipo de imagen que se enviará junto con un mensaje si se necesita análisis de imagen.Selecciona una de las siguientes opciones: Archivo, URL Pública.
    • Archivo: el archivo de imagen que se utilizará para la solicitud de finalización. Este campo admite entrada de tipo IResource. Este campo se muestra si el tipo de imagen se establece en Archivo.
    • URL pública: la URL accesible públicamente de la imagen que se enviará junto con la solicitud del usuario. Este campo admite entrada de tipo String. Este campo se muestra si Tipo de imagen se establece en URL Pública.
  • Solicitud del sistema: la solicitud del sistema o instrucción de contexto para la solicitud de finalización. Este campo admite entrada de tipo String.
Nota: el formato de archivo de imagen compatible depende del modelo seleccionado. A medida que se lanzan nuevos modelos, habrá más formatos de imagen disponibles.
  • GPT-4o: PNG (.png), JPEG (.jpeg y .jpg), WEBP (.webp) y GIF no animado (.gif).
  • Gemini Flash: = PNG (.png), JPEG (.jpeg y .jpg).
  • Gemini Pro = PNG (.png), JPEG (.jpeg y .jpg).
Administrar propiedades

Utiliza el asistente Administrar propiedades para configurar o utilizar cualquiera de los campos estándar o personalizados del objeto. Puedes seleccionar campos para añadirlos al lienzo de actividad. Los campos estándar o personalizados añadidos están disponibles en el panel Propiedades (en Studio Desktop) o en Mostrar propiedades adicionales (en Studio Web).

Propiedades adicionales
  • Recuento máximo de tokens: el número máximo de tokens que se generarán en la finalización. El recuento de tokens de tu solicitud más los del resultado/finalización no pueden superar el valor proporcionado para este campo. Es mejor establecer este valor en un valor menor que el recuento máximo del modelo para tener algo de espacio para el recuento de tokens de solicitud. El valor predeterminado es 1024. Si no se establece, la actividad utiliza por defecto los tokens necesarios para dar cabida a la solicitud o los tokens máximos permitidos por el modelo. Este campo admite entrada de tipo Int64.
  • Temperatura: el valor del factor de creatividad o temperatura de muestreo que se utilizará. Los valores más altos significan que el modelo tomará más riesgos. Intenta 0,9 para respuestas o finalizaciones más creativas, o 0 (también llamado muestreo argmax) para aquellos con una respuesta bien definida o más exacta. La recomendación general es alterar, del valor predeterminado, este o el valor de la muestra de nucleus, pero no ambos valores. El valor predeterminado es 0.
  • Penalización de frecuencia: número entre -2.0 y 2.0. Los valores positivos sancionan los nuevos tokens en función de su frecuencia existente en el texto, disminuyendo la probabilidad del modelo de repetir la misma línea palabra por palabra. El valor predeterminado es 0.
  • Penalización de presencia: número entre -2.0 y 2.0. Los valores positivos sancionan los nuevos tokens en función de si aparecen en el texto hasta el momento, lo que aumenta la probabilidad del modelo de hablar sobre nuevos temas. El valor predeterminado es 0.
  • Recuento de opciones de finalización: el número de opciones de finalización que se generarán para la solicitud. Cuanto mayor sea el valor de este campo, mayor será el número de tokens que se utilizarán. Esto da como resultado un coste más alto, por lo que debes tener esto en cuenta al establecer el valor de este campo.El valor predeterminado es 1.
  • Secuencia de parada: hasta cuatro secuencias donde la API dejará de generar más tokens. El texto devuelto no contiene la secuencia de parada. El valor predeterminado es nulo.
Salida
  • Texto generado superior: el texto de finalización del análisis de imagen.
  • Objeto de análisis de imagen: el objeto de respuesta contiene el texto de finalización del análisis de imagen, el modelo utilizado y otros detalles.

Limitaciones

Los modelos GPT-4 tienen ciertas limitaciones al trabajar con imágenes. Consulta la documentación de la plataforma OpenAI para obtener más información: limitaciones.

  • Descripción
  • Compatibilidad de proyectos
  • Configuración
  • Limitaciones

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2025 UiPath. Todos los derechos reservados.