- Primeros pasos
- Agentes de UiPath en Studio Web
- Agentes de UiPath codificados

Guía del usuario de agentes
Agents de UiPath viene con herramientas integradas, componentes predefinidos y listos para usar que no requieren desarrollo personalizado ni configuración externa.
La herramienta Analizar archivos adjuntos permite a los agentes procesar y razonar sobre el contenido de archivo utilizando LLM.
Actualmente se admiten los siguientes tipos de archivo: GIF, JPE, JPEG, PDF, PNG, WEBP.
Para añadir esta herramienta a tu agente, sigue estos pasos:
-
Definir entradas de archivo. En el panel Gestor de datos, añade argumentos a tu esquema de agente para entradas de archivo. Estos deben ser de tipo
File.Figura 1. Crear argumentos de entrada de archivo
- Añade la herramienta Analizar archivos adjuntos:
- Selecciona Añadir herramienta en el panel Herramientas.
- En la categoría Herramientas integradas, elige Analizar archivos adjuntos.
- Opcionalmente, actualiza el nombre y la descripción de la herramienta para ayudar al agente a razonar mejor sobre cuándo utilizarla.
-
Comprender las entradas de la herramienta. La herramienta viene preconfigurada con dos entradas principales:
-
attachments(array): lista de uno o más archivos para analizar. -
analysisTask(string): Una Solicitud o instrucción que describe la tarea. Si tu caso de uso implica solo un archivo, puedes actualizar la descripción de entrada para reflejar que es un archivo adjunto único.
-
- Ejecuta el agente con archivos de entrada.
- Abre la ventana Configuración de depuración:
- Navega a la pestaña Argumentos del proyecto.
- Proporciona un valor para
analysisTask, por ejemplo, "Comparar las dos imágenes". - Carga tus archivos de entrada en los campos vinculados a tu
attachmentsargumento.
- Haz clic en Guardar y ejecuta la sesión de depuración.
- Abre la ventana Configuración de depuración:
- Después de ejecutar el agente, inspecciona el seguimiento de ejecución a través del panel inferior.
Figura 2. El análisis en el seguimiento de ejecución
Seguimientos de archivo adjunto
Al utilizar la herramienta Analizar archivos adjuntos, todas las entradas y salidas de archivos se capturan en el panel Seguimiento de ejecución, en la pestaña Historial. El seguimiento proporciona una visibilidad detallada de cómo se gestionaron los archivos adjuntos durante la ejecución del agente.
Para cada archivo, el seguimiento muestra:
- ID: un identificador exclusivo para el archivo adjunto.
-
Nombre: nombre del archivo original (por ejemplo,
1.jpg). -
Tipo MIME: tipo de archivo detectado (por ejemplo,
image/jpeg). - URL de descarga: un enlace directo para descargar el archivo para inspección o reutilización. Los enlaces de descarga que se muestran en el seguimiento tienen actualmente un tiempo de vida de 30 minutos.
Mejores prácticas y preguntas frecuentes
La herramienta Analizar archivos adjuntos permite a los agentes procesar documentos e imágenes utilizando LLM. Aunque es potente, hay algunas limitaciones y comportamientos importantes a tener en cuenta al diseñar agentes impulsados por archivos.
Los archivos grandes pueden superar los límites de token.
Los agentes procesan los archivos incrustando sus contenidos en solicitudes de LLM, que están restringidas por el límite de tokens del modelo. Los PDF grandes o documentos de imagen escaneados pueden fallar en silencio o devolver errores vagos como "Se ha producido un error", especialmente cuando superan el presupuesto de tokens del modelo.
-
Usa modelos con mayor capacidad de tokens.
-
Usa Contextualización en lugar de la incrustación de archivo completo, especialmente para archivos grandes o de varias páginas.
-
Preindexa documentos y sincronízalos antes o durante la ejecución del agente a través de herramientas personalizadas.
Los LLM cambian el tamaño de las imágenes
.jpg, .png) como parte de la solicitud de LLM, la mayoría de los modelos cambian automáticamente su tamaño. Esto puede distorsionar las relaciones de aspecto o perder datos precisos de píxeles.
Evita solicitudes que se basen en coordenadas exactas, cuadros de límite o comparaciones alineadas de píxeles (por ejemplo, diferencias de imagen que requieren un posicionamiento x/y específico). Para obtener más información, consulta la guía de visión de imagen de OpenAI para el comportamiento de cambio de tamaño específico del modelo.
Tipos de archivo compatibles
Se admiten las siguientes extensiones de archivo: GIF, JPE, JPEG, PDF, PNG, WEBP.
La compatibilidad con tipos de archivo varía según el proveedor de LLM. Por ejemplo, la compatibilidad con PDF puede fallar en algunos modelos de Anthropic dependiendo del nombre del archivo o la codificación.
Consejos para mejores resultados
- Si trabajas con archivos PDF largos, considera dividirlos en fragmentos o páginas más pequeños antes de pasarlos al agente.
- Los nombres de archivo deben estar limpios: los modelos antrópicos, en particular, rechazan nombres de archivo con caracteres especiales o espacios en blanco repetidos.
- Mantén bajo el recuento de imágenes: algunos modelos como GPT-4o admiten un máximo de 10-50 imágenes por solicitud.