- Información general
- Automatización de IU
- Acerca del paquete de actividades de automatización de IU
- Aplicaciones y tecnologías automatizadas con UI Automation
- Compatibilidad de proyectos
- UI-ANA-016: Introducir URL para abrir el navegador
- UI-ANA-017: ContinueOnError verdadero
- UI-ANA-018: enumerar actividades de OCR / imagen
- UI-DBP-006: uso del contenedor
- UI-DBP-013: uso incorrecto de la automatización de Excel
- UI-DBP-030: uso de variables prohibidas en selectores
- UI-DBP-031: verificación de actividad
- UI-PRR-001: Simular clic
- UI-PRR-002: Simular tipo
- UI-PRR-003: uso incorrecto de aplicación abierta
- UI-PRR-004: retrasos codificados
- UI-REL-001: Idx grande en selectores
- UI-SEC-004: datos de correo electrónico del selector
- UI-SEC-010: Restricciones de aplicaciones / URL
- UI-USG-011: atributos no permitidos
- UX-SEC-010: restricciones de aplicaciones / URL
- UX-DBP-029: uso no seguro de contraseña
- UI-PST-001: nivel de registro de auditoría en la configuración del proyecto
- Herramienta de migración del navegador de UiPath
- Recorte de región
- Grabadora de Computer Vision
- Acerca de la automatización de imágenes y texto
- Actividades con el ratón y el teclado
- Ejemplo de uso de la automatización de ratón y teclado
- Actividades de texto
- Ejemplo de uso de la automatización de texto
- Actividades de OCR
- Actividades de imagen
- Ejemplo de uso de la automatización de OCR y la automatización de imágenes
- Índice de actividades
- Activar
- Base de anclaje
- Asociar navegador
- Asociar ventana
- Bloquear entrada de usuario
- Aviso
- Comprobar
- Clic
- Clic en imagen
- Desencadenador de clic de imagen
- Clic en texto OCR
- Clic en el texto
- Desencadenador de clic
- Cerrar aplicación
- Cerrar pestaña
- Cerrar ventana
- Anclaje consciente de contexto
- Copiar texto seleccionado
- Desencadenador de cambio del atributo del elemento
- Elemento existente
- Ámbito del elemento
- Desencadenador de cambio de estado de elemento
- Exportar el árbol de la IU
- Extraer datos estructurados
- Buscar elementos secundarios
- Buscar elemento
- Buscar imagen
- Buscar coincidencias de imágenes
- Buscar texto OCR
- Buscar elemento relativo
- Buscar posición de texto
- Obtener ventana activa
- Obtener antecesor
- Obtener atributo
- Obtener información de atributo
- Obtener a partir del portapapeles
- Obtener texto completo
- Obtener texto OCR
- Obtener contraseña
- Obtener posición
- Obtener elemento de origen
- Obtener texto
- Obtener texto visible
- Volver
- Avanzar
- Ir a inicio
- Google Cloud Vision OCR
- Ocultar ventana
- Resaltar
- Desencadenador de tecla de acceso rápido
- Mantener el puntero
- Mantener el puntero en imagen
- Mantener el puntero sobre texto OCR
- Mantener el puntero en el texto
- Imagen existente
- Indicar en pantalla
- Insertar código .NET
- Inject Js Script
- Invocar método de ActiveX
- Desencadenador de pulsación de tecla
- Cargar imagen
- Maximizar ventana
- Microsoft Azure Computer Vision OCR
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- Minimizar ventana
- Supervisar eventos
- Desencadenador del ratón
- Mover ventana
- Ir a
- Texto OCR existente
- Apariencia en elemento
- Fuga en elemento
- Apariencia en imagen
- Fuga en imagen
- Abrir aplicación
- Abrir navegador
- Actualizar navegador
- Reproducir evento de usuario
- Restaurar ventana
- Guardar imagen
- Seleccionar elemento
- Seleccionar varios elementos
- Enviar tecla de acceso rápido
- Establecer región de recorte
- Establecer foco
- Establecer texto
- Establecer en portapapeles
- Establecer atributo web
- Mostrar ventana
- Iniciar proceso
- Desencadenador del sistema
- Realizar captura
- Tesseract OCR
- Texto existente
- Información sobre herramientas
- Escribir en
- Escribir Texto Seguro
- Utilizar primer plano
- Esperar a atributo
- Esperar a fuga de elemento
- Esperar a fuga de imagen
- Comprobación de accesibilidad
- Desencadenador de eventos de aplicación
- Bloquear entrada de usuario
- Marcar/Desmarcar
- Comprobar estado de aplicación
- Comprobar elemento
- Clic
- Clic desencadenador de eventos
- Arrastrar y soltar
- Extraer datos de tabla
- Buscar elementos
- Para cada elemento de interfaz de usuario
- Obtener datos del navegador
- Obtener Portapapeles
- Obtener texto
- Obtener URL
- Ir a URL
- Resaltar
- Mantener el puntero
- Inject Js Script
- Atajos del teclado
- Desencadenador de eventos de pulsación de tecla
- Desplazamiento del ratón
- Navegar por el navegador
- Seleccionar elemento
- Establecer datos del navegador
- Configurar el portapapeles
- Establecer navegador de Runtime
- Establecer foco
- Establecer texto
- Realizar captura
- Escribir en
- Desbloquear entrada de usuario
- Utilizar Aplicación/Navegador
- Operación de ventana
- Transacción de llamada
- Clic en imagen en pantalla
- Hacer clic en botón de barra de herramientas
- Expandir tabla jerárquica ALV
- Expandir árbol ALV
- Expandir árbol
- Lectura de barra de estado
- Inicio de sesión en SAP
- Inicio de sesión en SAP
- Desencadenador de cambio de atributos de sesión de SAP
- Seleccionar fechas en el calendario
- Seleccionar elemento de menú
- Ámbito de la celda de la tabla
- Transacción de llamada
- Clic en imagen en pantalla
- Hacer clic en botón de barra de herramientas
- Expandir tabla jerárquica ALV
- Expandir árbol ALV
- Expandir árbol
- Lectura de barra de estado
- Inicio de sesión en SAP
- Inicio de sesión en SAP
- Seleccionar fechas en el calendario
- Seleccionar elemento de menú
- Ámbito de la celda de la tabla
- Realizar búsquedas en el navegador y recuperar resultados mediante las API de automatización de IU
- Exploración web
- Buscar imágenes
- Hacer clic en imágenes
- Eventos de desencadenador y supervisor
- Crear y anular archivos
- Páginas HTML: extraer y manipular información
- Manipulación de ventana
- Selección de lista automatizada
- Buscar y manipular elementos de ventana
- Gestionar automatización de texto
- Cargar y procesar imágenes
- Gestionar acciones activadas por el ratón
- Automatizar tiempo de ejecución de aplicación
- Ejecución automática de una aplicación local
- Navegación de explorador
- Automatización web
- Ejemplo de ámbito de desencadenador
- Habilitar soporte de automatización de IU en DevExpress
- Computer Vision Local Server
- Automatización móvil
- Notas relacionadas
- Acerca de la arquitectura de automatización de dispositivos móviles
- Compatibilidad de proyectos
- Obtener tipos de registro
- Obtener registros
- Obtener origen de la página
- Obtener la orientación del dispositivo
- Obtener identificador de sesión
- Instalar aplicación
- Administrar aplicación actual
- Administrar otras aplicaciones
- Abrir enlace profundo
- Abrir URL
- Conexión de dispositivo móvil
- Deslizamiento direccional
- Patrón de dibujo
- Pase de dedo posicional
- Pulse un botón del hardware
- Establecer orientación del dispositivo
- Realizar captura
- Tomar parte de la captura de pantalla
- Elemento existente
- Ejecutar comando
- Obtener atributo
- Obtener elemento seleccionado
- Obtener texto
- Establecer elemento seleccionado
- Establecer texto
- Deslizamiento
- Pulsar
- Escribir Texto
- Primeros pasos con las API de automatización móvil
- Gestionar cuadros de diálogo emergentes en automatizaciones móviles
- Creating variables from selector attributes
- Creación de flujos de trabajo de automatización móvil
- Utilizar automatización móvil para una aplicación de banca móvil
- Automatización para aplicaciones React Native
- Terminal
- Notas relacionadas
- Acerca del paquete de actividades de Terminal
- Compatibilidad de proyectos
- Mejores prácticas
- Buscar texto
- Obtener color de la posición
- Obtener la posición del cursor
- Obtener campo
- Obtener campo en posición
- Obtener área de pantalla
- Obtener texto
- Obtener texto en posición
- Mover cursor
- Mover cursor al texto
- Enviar tecla de control
- Teclas de envío
- Teclas de envío seguras
- Establecer campo
- Configurar campo en posición
- Sesión del terminal
- Esperar texto de campo
- Esperar a que la pantalla esté lista
- Esperar texto en pantalla
- Esperar texto en posición

Actividades UIAutomation
ScreenPlay
UiPath.Semantic.Activities.NUITask
Descripción
ScreenPlay es el agente de automatización de próxima generación de UiPath®, diseñado para llevar el comportamiento agéntico y las capacidades cognitivas al escritorio. ScreenPlay interactúa con las aplicaciones de forma muy similar a como lo haría un humano: navegando por las interfaces, adaptándose a los cambios y gestionando tareas complejas que antes eran inviables con los métodos de automatización tradicionales.
Para obtener más información, consulta ScreenPlay.
Esta actividad debe añadirse dentro de una actividad Usar aplicación/navegador.
Compatibilidad de proyectos
Windows | Multiplataforma
Configuración
-
Tarea : solicitud que describe la tarea de IU que se va a realizar, con la capacidad de:
- Utilizar variables.
- Añadir imagen desde la pantalla (en línea con el texto).
- Ver el último seguimiento de ejecución. Para obtener más información, consulta Ejecutar e inspeccionar los resultados de la ejecución.
-
Modelo : indica el LLM subyacente utilizado por ScreenPlay para la planificación y el razonamiento de la ejecución de tareas. Las siguientes opciones están disponibles: UiPath Screen Agent (con Gemini 2.5 Flash)
- Modelo básico
- Funciona mejor en navegadores
- Utiliza una implementación patentada basada en el DOM de la página, utilizando Gemini Flash para el razonamiento y la comprensión de imágenes
- Moderadamente rápido
Agente de pantalla de UiPath (con GPT - 4.1)
- Modelo estándar: para tareas complejas
- Funciona mejor en navegadores
- Utiliza una implementación patentada basada en el DOM de la página y la comprensión de imágenes, utilizando GPT-4.1 para el razonamiento
- No muy rápido
Agente de pantalla de UiPath (con GPT - 4.1 mini)
- Modelo básico: más rápido, más barato
- Funciona mejor en navegadores
- Utiliza una implementación patentada basada en el DOM de la página y la comprensión de imágenes, utilizando GPT-4.1 mini para el razonamiento
- Moderadamente rápido
Agente de pantalla de UiPath (con GPT - 5)
- Modelo estándar: para tareas complejas
- Funciona mejor en navegadores
- Utiliza una implementación patentada basada en el DOM de la página y la comprensión de la imagen, utilizando GPT-5 para el razonamiento
- Lenta
Agente de pantalla de UiPath (con GPT - 5 mini)
- Modelo básico: más rápido, más barato
- Funciona mejor en navegadores
- Utiliza una implementación patentada basada en el DOM de la página y la comprensión de imágenes, utilizando GPT-5 mini para el razonamiento
- Moderadamente rápido
OpenAI: operador
- Modelo estándar: para tareas complejas
- Funciona en cualquier tipo de aplicación, incluidas las interfaces basadas en imágenes
- Utiliza el operador OpenAI, un modelo de razonamiento basado en imágenes
- Lenta
Anthropic: uso del ordenador
- Modelo estándar: para tareas complejas
- Funciona en cualquier tipo de aplicación, incluidas las interfaces basadas en imágenes
- Utiliza Anthropic Computer Use, un modelo de razonamiento basado en imágenes
- Lenta
-
Calificar esta actividad : buena o mala
Opciones adicionales
Opciones
-
Número máximo de pasos : este es el número máximo de pasos que ScreenPlay puede realizar para lograr su objetivo. La propiedad se puede utilizar como barrera básica para evitar bucles de agente infinitos.
-
Escribir por portapapeles : indica si el portapapeles se utiliza para escribir el texto dado. Las siguientes opciones están disponibles:
- Nunca : no usar nunca el portapapeles
- Siempre : utiliza siempre el portapapeles
- Siempre que sea posible : utiliza el portapapeles cuando sea posible. Esto depende del sistema operativo y del texto que se va a escribir (p. ej. Si se utiliza cualquier tecla especial, no se utilizará el portapapeles)
-
Usar DOM cuando esté disponible : indica si los datos DOM se utilizarán/enviarán al modelo LLM para aplicaciones en las que se pueda extraer DOM. DOM solo puede ser utilizado por las implementaciones de LAM de UiPath.
Deshabilitar si la orientación basada en DOM provoca coordenadas incorrectas de elemento.
El valor predeterminado es Verdadero.
-
Deshabilitar seguridad variable : indica si la seguridad variable debe deshabilitarse. La seguridad variable garantiza que las instrucciones de solicitud no se puedan pasar a través de valores variables.
El propósito de esta característica es evitar ataques de inyección de solicitudes y se basa en LLM, por lo que si se produce un "falso positivo", el usuario puede deshabilitarlo para cada actividad de ScreenPlay. Para concluir si se trata de un "falso positivo", el usuario puede inspeccionar el seguimiento de ejecución, la solicitud del sistema, el razonamiento y las acciones.
Habilite esta opción solo si necesita pasar instrucciones de solicitud a través de valores variables o si se produjo un resultado "falso positivo".
El valor predeterminado es Falso.
-
Modo de entrada : selecciona qué método debe utilizarse para generar entradas de teclado y ratón:
- Igual que la aplicación/navegador : utiliza la configuración del modo de entrada de la actividad principal Usar aplicación/navegador .
- Eventos de hardware : actúa como un usuario real utilizando entradas de "hardware" como los movimientos del ratón o las pulsaciones del teclado para interactuar con las aplicaciones. Estos son eventos desencadenados por hardware enviados directamente al sistema operativo. Aunque este método ofrece una emulación de comportamiento del 100 %, algunos eventos pueden perderse ocasionalmente. Como desarrollador, es tu responsabilidad garantizar que todos los eventos lleguen de forma fiable a la aplicación de destino.
- API de Chromium : realiza acciones utilizando las API de depuración. Solo funciona para elementos de Chromium. Envía todo el texto de una vez. Funciona incluso si la aplicación de destino no está enfocada. Para obtener más información, consulta API de Chromium.
- Simular : simula el uso de las API de accesibilidad. Recomendado para navegadores, aplicaciones basadas en Java, SAP. Suele ser más fiable que los eventos de hardware. Envía todo el texto en una sola acción. Funciona incluso si la aplicación de destino no está enfocada.
Nota:Asegúrate de probar si el elemento de IU de tu aplicación de destino lo admite.
- Mensajes de ventana : simula el uso de mensajes Win32. Recomendado para aplicaciones de escritorio. Suele ser más fiable que los eventos de hardware. Envía todo el texto de una vez. Funciona incluso si la aplicación de destino no está enfocada.
Nota:Asegúrate de probar si el elemento de IU de tu aplicación de destino lo admite.
-
Continuar en caso de error : especifica si la automatización debe continuar incluso cuando la actividad arroja un error. Este campo solo admite valores booleanos (Verdadero, Falso). El valor predeterminado es Falso. Como resultado, si el campo está vacío y se produce un error, la ejecución del proyecto se detiene. Si el valor se establece en Verdadero, la ejecución del proyecto continúa independientemente de cualquier error.
Plazos
- Delay before - Delay (in seconds) between the time the previous activity is completed and the time this activity begins performing any operations. The default value is 0.2 seconds. Adding a delay between activities ensures that one activity has enough time to complete before the next activity begins.
- Delay after - Delay (in seconds) between the time this activity is completed and the time the next activity begins any operations. The default value is 0.3 seconds. Adding a delay between activities ensures that one activity has enough time to complete before the next activity begins.
- Tiempo de espera : especifica la cantidad de tiempo (en segundos) que se debe esperar a que se ejecute la actividad antes de arrojar un error. El valor predeterminado es 30 segundos.
Salida
- Resultado : el resultado de la tarea, si lo hubiera. Por ahora solo admitimos la salida
String.