- Überblick
- UI-Automatisierung (UI Automation)
- Über das UIAutomation-Aktivitätspaket
- Mit UI-Automatisierung automatisierte Anwendungen und Technologien
- Projektkompatibilität
- UI-ANA-016 – URL zum Öffnen eines Browsers abrufen
- UI-ANA-017 – ContinueOnError True
- UI-ANA-018 – OCR-/Bildaktivitäten auflisten
- UI-DBP-006 – Containernutzung
- UI-DBP-013 – Falscher Gebrauch von Excel-Automatisierung
- UI-DBP-030 – Verwendung unzulässiger Variablen in Selektoren
- UI-DBP-031 – Aktivitätsverifizierung
- UI-PRR-001 – Klick simulieren
- UI-PRR-002 – Typ simulieren
- UI-PRR-003 – Offener Anwendungsmissbrauch
- UI-PRR-004 – Hartcodierte Verzögerungen
- UI-REL-001 – Große IDX in Selektoren
- UI-SEC-004 – Selektor-E-Mail-Daten
- UI-SEC-010 – App-/URL-Einschränkungen
- UI-USG-011 – Nicht zulässige Attribute
- UX-SEC-010 – App-/URL-Einschränkungen
- UX-DBP-029 – Unsichere Kennwortnutzung
- UI-PST-001 – Prüfungsprotokollebene in Projekteinstellungen
- UiPath-Browsermigrationstool
- Clippingbereich
- Computer Vision Recorder
- Aktivitätenindex
- Aktivieren (Activate)
- Ankerbasis (Anchor Base)
- Browser anhängen (Attach Browser)
- Fenster anhängen (Attach Window)
- Benutzeingabe blockieren (Block User Input)
- Textfeld (Callout)
- Prüfen (Check)
- Klicken (Click)
- Bild anklicken (Click Image)
- Bild-Trigger anklicken (Click Image Trigger)
- OCR-Text anklicken (Click OCR Text)
- Text anklicken (Click Text)
- Trigger anklicken (Click Trigger)
- Anwendung schließen (Close Application)
- Registerkarte schließen (Close Tab)
- Fenster schließen (Close Window)
- Kontextbewusster Anker
- Ausgewählten Text kopieren (Copy Selected Text)
- Element Attribute Change Trigger
- Element vorhanden (Element Exists)
- Elementumfang (Element Scope)
- Element State Change Trigger
- Export UI Tree
- Strukturierte Daten extrahieren (Extract Structured Data)
- Untergeordnete Elemente finden (Find Children)
- Element finden (Find Element)
- Bild finden (Find Image)
- Bildübereinstimmung finden (Find Image Matches)
- OCR-Textposition finden (Find OCR Text Position)
- Relatives Element finden (Find Relative Element)
- Textposition finden (Find Text Position)
- Aktives Fenster abrufen (Get Active Window)
- Vorgänger-Element erhalten (Get Ancestor)
- Attribut erhalten (Get Attribute)
- Ereignisinfo erhalten (Get Event Info)
- Aus Zwischenablage erhalten (Get From Clipboard)
- Volltext erhalten (Get Full Text)
- OCR-Text erhalten (Get OCR Text)
- Passwort erhalten (Get Password)
- Position erhalten (Get Position)
- Quellelement erhalten (Get Source Element)
- Text erhalten (Get Text)
- Sichtbaren Text erhalten (Get Visible Text)
- Zurück (Go Back)
- Weiter (Go Forward)
- Zur Startseite (Go Home)
- Google Cloud Vision OCR
- Fenster ausblenden (Hide Window)
- Markieren (Highlight)
- Hotkey-Trigger (Hotkey Trigger)
- Darauf zeigen (Hover)
- Auf Bild zeigen (Hover Image)
- Auf OCR-Text zeigen (Hover OCR Text)
- Text beim Darauf zeigen (Hover Text)
- Bild vorhanden (Image Exists)
- Auf Bildschirm anzeigen (Indicate On Screen)
- .NET-Code einfügen
- Inject Js Script
- ActiveX-Methode aufrufen
- Tastendruck-Trigger (Key Press Trigger)
- Bild laden (Load Image)
- Fenster maximieren (Maximize Window)
- Microsoft Azure ComputerVision OCR
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- Fenster minimieren (Minimize Window)
- Ereignisse überwachen (Monitor Events)
- Maus-Trigger (Mouse Trigger)
- Fenster verschieben (Move Window)
- Navigieren zu (Navigate To)
- OCR-Text vorhanden (OCR Text Exists)
- Auf Element erscheinen (On Element Appear)
- Auf Element verschwinden (On Element Vanish)
- Auf Bild erscheinen (On Image Appear)
- Auf Bild verschwinden (On Image Vanish)
- Anwendung öffnen (Open Application)
- Browser öffnen (Open Browser)
- Browser aktualisieren (Refresh Browser)
- Benutzerereignis wiedergeben (Replay User Event)
- Fenster wiederherstellen (Restore Window)
- Bild speichern (Save Image)
- Objekt auswählen (Select Item)
- Mehrere Objekte auswählen (Select Multiple Items)
- Hotkey senden (Send Hotkey)
- Ausschneidebereich einstellen (Set Clipping Region)
- Fokus legen auf (Set Focus)
- Text einstellen (Set Text)
- Auf Zwischenablage setzen (Set To Clipboard)
- Web-Attribut setzen (Set Web Attribute)
- Fenster anzeigen (Show Window)
- Prozess starten (Start Process)
- System-Trigger (System Trigger)
- Screenshot anfertigen (Take Screenshot)
- Tesseract OCR
- Text vorhanden (Text Exists)
- Tooltip
- Eingeben in (Type Into)
- Sicheren Text eingeben (Type Secure Text)
- Vordergrund verwenden
- Attribut abwarten (Wait Attribute)
- Warten, bis Element verschwindet (Wait Element Vanish)
- Warten, bis Bild verschwindet (Wait Image Vanish)
- Application event trigger
- Benutzeingabe blockieren (Block User Input)
- Check/Uncheck
- Check App State
- Check Element
- Klicken (Click)
- Click Event Trigger
- Ziehen und Ablegen
- Extract Table Data
- Find Elements
- For Each UI Element
- Get Browser Data
- Clipboard abrufen
- Text erhalten (Get Text)
- Get URL
- Zu URL wechseln
- Markieren (Highlight)
- Darauf zeigen (Hover)
- Inject Js Script
- Tastenkombinationen
- Keypress Event Trigger
- Mouse Scroll
- Navigate Browser
- Objekt auswählen (Select Item)
- Set Browser Data
- Clipboard festlegen
- Set Runtime Browser
- Fokus legen auf (Set Focus)
- Text einstellen (Set Text)
- Screenshot anfertigen (Take Screenshot)
- Eingeben in (Type Into)
- Unblock User Input
- Use Application/Browser
- Window operation
- Anhängen
- Prüfen (Check)
- Klicken (Click)
- Ziehen und Ablegen
- Daten extrahieren
- Attribut erhalten (Get Attribute)
- GetChildren
- GetRuntimeTarget
- GetText
- Get URL
- GoToUrl
- Markieren (Highlight)
- Darauf zeigen (Hover)
- IsEnabled
- Tastaturkürzel (Keyboard Shortcut)
- Mouse Scroll
- Offen
- Objekt auswählen (Select Item)
- Screenshot anfertigen (Take Screenshot)
- Eingeben in (Type Into)
- Wartestatus
- Führen Sie eine Browsersuche durch und rufen Sie Ergebnisse mithilfe von UIAutomation-APIs ab
- Web-Browsing
- Finden von Bildern
- Klicken auf Bilder
- Auslösen und Überwachen von Ereignissen
- Erstellen und Überschreiben von Dateien
- HTML-Seiten: Extrahieren und Bearbeiten von Informationen
- Bearbeiten von Fenstern
- Automatisierte Listenauswahl
- Finden und Bearbeiten von Fensterelementen
- Verwalten der Textautomatisierung
- Laden und Verarbeiten von Bildern
- Verwalten von mausaktivierten Aktionen
- Automatisieren der Anwendungslaufzeit
- Automatisierte Ausführung einer lokalen Anwendung
- Browsernavigation
- Web-Automatisierung
- Beispiel für Trigger Scope
- Aktivieren der Unterstützung für die UI-Automatisierung in DevExpress
- Computer Vision Local Server
- Mobile Automation
- Versionshinweise
- Über die Architektur der Automatisierung von Mobilgeräten
- Projektkompatibilität
- Get Log Types
- Get Logs
- Get Page Source
- Get Device Orientation
- Get Session Identifier
- Install App
- Manage Current App
- Manage Other App
- DeepLink öffnen
- Open URL
- Mobile Device Connection
- Richtungswechsel
- Muster zeichnen
- Positional Swipe
- Press Hardware Button
- Set Device Orientation
- Screenshot anfertigen (Take Screenshot)
- Take Screenshot Part
- Element vorhanden (Element Exists)
- Execute Command
- Attribut erhalten (Get Attribute)
- Get Selected Item
- Text erhalten (Get Text)
- Set Selected Item
- Text einstellen (Set Text)
- Wischen
- Tap
- Type Text
- Terminal
- Versionshinweise
- Über das Terminal-Aktivitätspaket
- Projektkompatibilität
- Best Practices
- Find Text
- Get Color At Position
- Get Cursor Position
- Feld erhalten (Get Field)
- Feld an Position erhalten (Get Field at Position)
- Bildschirmbereich erhalten (Get Screen Area)
- Text erhalten (Get Text)
- Text an Position erhalten (Get Text at Position)
- Cursor bewegen (Move Cursor)
- Move Cursor to Text
- Strg-Taste senden (Send Control Key)
- Tasten senden (Send Keys)
- Sichere Tasten senden (Send Keys Secure)
- Feld setzen (Set Field)
- Feld an Position setzen (Set Field at Position)
- Terminalsitzung (Terminal Session)
- Warte auf Feldtext (Wait Field Text)
- Wait Screen Ready
- Warte auf Bildschirmtext (Wait Screen Text)
- Warte auf Text an Position (Wait Text at Position)

UIAutomation-Aktivitäten
UiPath.Semantic.Activities.NUITask
ScreenPlay ist der Automatisierungsagent der nächsten Generation von UiPath®, der entwickelt wurde, um agentenbasiertes Verhalten und kognitive Fähigkeiten auf den Desktop zu bringen. ScreenPlay interagiert mit Anwendungen, ähnlich wie ein Mensch es tun würde – das Navigieren durch Benutzeroberflächen, das sich an Veränderungen anpassen und komplexe Aufgaben bewältigen, die zuvor mit herkömmlichen Automatisierungsmethoden nicht zu bewältigen waren.
Weitere Informationen finden Sie unter ScreenPlay.
Diese Aktivität muss innerhalb einer Use Application/Browser-Aktivität hinzugefügt werden.
- Task - Prompt describing the UI task to be performed, with the ability to:
- Use Variables
- Add image from screen (inline with the text)
- View last execution trace. For more details, see the Running and inspecting the execution results page.
-
Model - Indicates the underlying LLM used by ScreenPlay for task execution planning and reasoning. The following options are available:
UiPath (mit Gemini 2.5 Flash)
- Basismodell
- Funktioniert am besten in Browsern
- Verwendet eine proprietäre Implementierung, die auf dem DOM der Seite basiert, und verwendet Gemini Flash für Argumentation und Bildverständnis
- Mäßig schnell
- Standardmodell – für komplexe Aufgaben
- Funktioniert am besten in Browsern
- Verwendet eine proprietäre Implementierung, die auf dem DOM und dem Bildverständnis der Seite basiert, und verwendet GPT-4.1 für die Argumentation
- Nicht sehr schnell
- Basismodell – schneller, kostengünstiger
- Funktioniert am besten in Browsern
- Verwendet eine proprietäre Implementierung, die auf dem DOM und dem Bildverständnis der Seite basiert, und verwendet GPT-4.1 mini für die Argumentation
- Mäßig schnell
- Standardmodell – für komplexe Aufgaben
- Funktioniert am besten in Browsern
- Verwendet eine proprietäre Implementierung, die auf dem DOM und dem Bildverständnis der Seite basiert, und verwendet GPT-5 für die Argumentation
- Langsam
- Basismodell – schneller, kostengünstiger
- Funktioniert am besten in Browsern
- Verwendet eine proprietäre Implementierung, die auf dem DOM und dem Bildverständnis der Seite basiert, und verwendet GPT-5 mini für die Argumentation
- Mäßig schnell
- Standardmodell – für komplexe Aufgaben
- Funktioniert für jeden Anwendungstyp, einschließlich bildbasierter Schnittstellen
- Verwendet den OpenAI-Operator, ein bildbasiertes Argumentationsmodell. Wahrscheinlich die beste von allen
- Langsam
- Standardmodell – für komplexe Aufgaben
- Funktioniert für jeden Anwendungstyp, einschließlich bildbasierter Schnittstellen
- Verwendet Anthropic Computer Use, ein bildbasiertes Argumentationsmodell
- Langsam
- Rate this activity - Good or Poor
Zusätzliche Optionen
Optionen
- Max number of steps - This is the maximum number of steps that ScreenPlay can take to achieve its goal. The property can be used as a basic guardrail to prevent infinite agentic loops.
- Type by clipboard - Indicates whether the clipboard is used to type the given text. The following options are available:
- Niemals – Zwischenablage niemals verwenden
- Immer – Zwischenablage immer verwenden
- Immer wenn möglich – Verwenden Sie nach Möglichkeit die Zwischenablage. Dies hängt vom Betriebssystem und dem einzugebenden Text ab (z. B Wenn eine Sondertaste verwendet wird, wird die Zwischenablage nicht verwendet.)
-
Use DOM when available - Indicates whether DOM data will be used/sent to the LLM Model for applications where DOM can be extracted.
DOM kann nur von UiPath LAM-Implementierungen verwendet werden.
Deaktivieren Sie diese Option, wenn die DOM-basierte Zielausrichtung zu falschen Elementkoordinaten führt.
Default value is True.
-
Disable variable security - Indicates whether the variable security should be disabled.
Variable security ensures that prompt instructions can not be passed via variable values.
The purpose of this feature is to prevent prompt injection attacks and is based on LLM, so if a "false positive" occurs, the user can disable it for each ScreenPlay activity. To conclude if it is a "false positive", the user can inspect the execution trace, system prompt, reasoning, and actions.
Enable this option only if you need to pass prompt instructions via variable values or if a "false positive" result occurred.
Default value is False.
- Input mode - Select which method should be used to generate keyboard and mouse input:
- Same as App/Browser - Uses the Input mode settings from the parent Use Application/Browser activity.
- Hardware-Ereignisse – Fungiert als echten Benutzer, indem „Hardware“-Eingaben wie Mausbewegungen oder Tastaturanschläge zur Interaktion mit Anwendungen verwendet werden. Dies sind durch Hardware ausgelöste Ereignisse, die direkt an das Betriebssystem gesendet werden. Obwohl diese Methode eine 100%ige Verhaltensemulation bietet, können einige Ereignisse gelegentlich verloren gehen. Als Entwickler sind Sie dafür verantwortlich, sicherzustellen, dass alle Ereignisse die Zielanwendung zuverlässig erreichen.
- Chromium-API – Führt Aktionen mithilfe von Debugger-APIs aus. Funktioniert nur für Chromium-Elemente. Sendet den gesamten Text auf einmal. Funktioniert auch dann, wenn die Ziel-App nicht im Fokus steht. Weitere Informationen finden Sie unter Chromium-API.
- Simulieren – Simuliert die Verwendung von Barrierefreiheits-APIs. Empfohlen für Browser, Java-basierte Anwendungen, SAP. In der Regel zuverlässiger als Hardware-Ereignisse. Sendet den gesamten Text in einer einzigen Actions. Funktioniert auch dann, wenn die Ziel-App nicht im Fokus steht. Testen Sie, ob das UI-Element der Zielanwendung dies unterstützt.
- Window messages - Simulates using Win32 messages. Recommended for desktop apps. Usually more reliable than Hardware Events. Sends all text in one go. Works even if target app is not in focus. Please test if your target application UI element supports this.
-
BeiFehler fortfahren – Gibt an, ob die Automatisierung auch dann fortgesetzt werden soll, wenn die Aktivität einen Fehler ausgibt. Dieses Feld unterstützt nur
Boolean-Werte (True, False). Der Standardwert ist False. Wenn das Feld leer ist und ein Fehler ausgegeben wird, wird die Ausführung des Projekts angehalten. Wenn der Wert auf Truefestgelegt ist, wird die Ausführung des Projekts unabhängig von einem Fehler fortgesetzt.
Zeitliche Abläufe
-
Verzögerung vor – Verzögerung (in Sekunden) zwischen dem Zeitpunkt, zu dem die vorherige Aktivität abgeschlossen ist, und dem Zeitpunkt, zu dem diese Aktivität mit der Ausführung von Vorgängen beginnt. Der Standardwert beträgt 0,2 Sekunden. Durch Hinzufügen einer Verzögerung zwischen Aktivitäten wird sichergestellt, dass eine Aktivität genügend Zeit hat, um abgeschlossen zu werden, bevor die nächste Aktivität beginnt.
-
Verzögerung nach – Verzögerung (in Sekunden) zwischen dem Zeitpunkt, an dem diese Aktivität abgeschlossen ist, und dem Zeitpunkt, zu dem die nächste Aktivität Vorgänge beginnt. Der Standardwert ist 0,3 Sekunden. Durch Hinzufügen einer Verzögerung zwischen Aktivitäten wird sichergestellt, dass eine Aktivität genügend Zeit hat, um abgeschlossen zu werden, bevor die nächste Aktivität beginnt.
-
Zeitüberschreitung – Geben Sie die Zeitspanne (in Sekunden) an, die auf die Ausführung der Aktivität gewartet werden soll, bevor ein Fehler ausgegeben wird. Der Standardwert beträgt 30 Sekunden.
Ausgabe
- Result - The result of the task, if any. For now we only support
Stringoutput.