activities
latest
false
Importante :
Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. Los paquetes de conectores disponibles en Integration Service están traducidos con traducción automática.
UiPath logo, featuring letters U and I in white
Actividades de Integration Service
Last updated 19 de nov. de 2024

Image Analysis

Descripción

Genera la finalización con una solicitud personalizada que puede contener texto estático, variables, argumentos y también un archivo de imagen o una URL de imagen de acceso público.

Compatibilidad de proyectos

Windows | Multiplataforma

Configuración

  • ID de conexión : la conexión establecida en Integration Service. Accede al menú desplegable para elegir, añadir o gestionar conexiones.

  • Nombre del modelo : el nombre o ID del modelo de visión o implementación que se utilizará para la finalización. Esta actividad utiliza de forma predeterminada el modelo con la salida observada de mayor calidad. Sin embargo, puedes seleccionar un modelo diferente en función de los resultados y las pruebas deseados. Cambiar de modelo puede afectar a la salida. Todos los modelos disponibles están equipados con visión, lo que significa que también pueden revisar una imagen. Si solo envías una solicitud de texto, puedes utilizar la generación de contenido en su lugar.
  • Solicitud : la solicitud del usuario para la solicitud de finalización del chat. Este campo admite entrada de tipo String .
  • Tipo de imagen: el tipo de imagen que se enviará junto con un mensaje si se necesita un análisis de imagen. Selecciona una de las siguientes opciones: Archivo, URL pública.
    • Archivo : el archivo de imagen que se utilizará para la solicitud de finalización. Este campo admite entrada de tipo IResource . Este campo se muestra si Tipo de imagen está establecido en Archivo.
    • URL pública : la URL de acceso público de la imagen que se enviará junto con la solicitud del usuario. Este campo admite entrada de tipo String . Este campo se muestra si Tipo de imagen está establecido en URL pública.
  • Solicitud del sistema : la solicitud del sistema o la instrucción de contexto para la solicitud de finalización. Este campo admite entrada de tipo String .
Nota: El formato de archivo de imagen compatible depende del modelo seleccionado. A medida que se lancen nuevos modelos, habrá más formatos de imagen disponibles.
  • GPT-4o: PNG (.png), JPEG (.jpeg y .jpg), WEBP (.webp) y GIF no animado (.gif).
  • Gemini Flash: = PNG (.png), JPEG (.jpeg y .jpg).
  • Gemini Pro = PNG (.png), JPEG (.jpeg y .jpg).
Administrar propiedades

Utiliza el asistente Administrar propiedades para configurar o utilizar cualquiera de los campos estándar o personalizados del objeto. Puedes seleccionar campos para añadirlos al lienzo de actividad. Los campos estándar o personalizados añadidos están disponibles en el panel Propiedades (en Studio Desktop) o en Mostrar propiedades adicionales (en Studio Web).

Propiedades adicionales
  • Recuento máximo de tokens : el número máximo de tokens que se generarán en la finalización. El recuento de tokens de tu solicitud más los del resultado/finalización no pueden superar el valor proporcionado para este campo. Es mejor establecer este valor para que sea menor que el recuento máximo del modelo para tener algo de espacio para el recuento de tokens de solicitud. El valor predeterminado es 1024. Si no se establece, la actividad utiliza de forma predeterminada los tokens necesarios para acomodar la solicitud o el máximo de tokens permitidos por el modelo. Este campo admite entrada de tipo Int64 .
  • Temperatura : el valor del factor de creatividad o la temperatura de muestreo que se va a utilizar. Los valores más altos significan que el modelo asumirá más riesgos. Prueba 0.9 para respuestas o finalizaciones más creativas, o 0 (también llamado muestreo argmax) para las que tienen una respuesta bien definida o más exacta. La recomendación general es modificar, desde el valor predeterminado, este o el valor de Muestra de núcleo, pero no ambos valores. El valor predeterminado es 0.
  • Penalización de frecuencia : número entre -2.0 y 2.0. Los valores positivos penalizan los nuevos tokens en función de su frecuencia existente en el texto, lo que reduce la probabilidad del modelo de repetir la misma línea palabra por palabra. El valor predeterminado es 0.
  • Penalización de presencia : número entre -2.0 y 2.0. Los valores positivos penalizan los nuevos tokens en función de si aparecen en el texto hasta el momento, lo que aumenta la probabilidad del modelo de hablar sobre nuevos temas. El valor predeterminado es 0.
  • Recuento de opciones de finalización : el número de opciones de finalización que se generarán para la solicitud. Cuanto mayor sea el valor de este campo, mayor será el número de tokens que se utilizarán. Esto da como resultado un coste mayor, por lo que debes tenerlo en cuenta al establecer el valor de este campo. El valor predeterminado es 1.
  • Detener secuencia : hasta cuatro secuencias en las que la API dejará de generar más tokens. El texto devuelto no contiene la secuencia de detención. El valor predeterminado es nulo.
Salida
  • Texto generado superior: el texto de finalización del análisis de imagen.
  • Objeto de análisis de imagen: el objeto de respuesta contiene el texto de finalización del análisis de imagen, el modelo utilizado y otros detalles.
  • Descripción
  • Compatibilidad de proyectos
  • Configuración

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.