- Überblick
- UI-Automatisierung (UI Automation)
- Mit UI-Automatisierung automatisierte Anwendungen und Technologien
- Projektkompatibilität
- UI-ANA-016 – URL zum Öffnen eines Browsers abrufen
- UI-ANA-017 – ContinueOnError True
- UI-ANA-018 – OCR-/Bildaktivitäten auflisten
- UI-DBP-006 – Containernutzung
- UI-DBP-013 – Falscher Gebrauch von Excel-Automatisierung
- UI-DBP-030 – Verwendung unzulässiger Variablen in Selektoren
- UI-PRR-001 – Klick simulieren
- UI-PRR-002 – Typ simulieren
- UI-PRR-003 – Offener Anwendungsmissbrauch
- UI-PRR-004 – Hartcodierte Verzögerungen
- UI-REL-001 – Große IDX in Selektoren
- UI-SEC-004 – Selektor-E-Mail-Daten
- UI-SEC-010 – App-/URL-Einschränkungen
- UI-USG-011 – Nicht zulässige Attribute
- UX-SEC-010 – App-/URL-Einschränkungen
- UX-DBP-029 – Unsichere Kennwortnutzung
- UI-PST-001 – Prüfungsprotokollebene in Projekteinstellungen
- UiPath-Browsermigrationstool
- Clippingbereich
- Computer Vision Recorder
- Aktivieren (Activate)
- Ankerbasis (Anchor Base)
- Browser anhängen (Attach Browser)
- Fenster anhängen (Attach Window)
- Benutzeingabe blockieren (Block User Input)
- Textfeld (Callout)
- Prüfen (Check)
- Klicken (Click)
- Bild anklicken (Click Image)
- Bild-Trigger anklicken (Click Image Trigger)
- OCR-Text anklicken (Click OCR Text)
- Text anklicken (Click Text)
- Trigger anklicken (Click Trigger)
- Anwendung schließen (Close Application)
- Registerkarte schließen (Close Tab)
- Fenster schließen (Close Window)
- Kontextbewusster Anker
- Ausgewählten Text kopieren (Copy Selected Text)
- Element Attribute Change Trigger
- Element vorhanden (Element Exists)
- Elementumfang (Element Scope)
- Element State Change Trigger
- Export UI Tree
- Strukturierte Daten extrahieren (Extract Structured Data)
- Untergeordnete Elemente finden (Find Children)
- Element finden (Find Element)
- Bild finden (Find Image)
- Bildübereinstimmung finden (Find Image Matches)
- OCR-Textposition finden (Find OCR Text Position)
- Relatives Element finden (Find Relative Element)
- Textposition finden (Find Text Position)
- Aktives Fenster abrufen (Get Active Window)
- Vorgänger-Element erhalten (Get Ancestor)
- Attribut erhalten (Get Attribute)
- Ereignisinfo erhalten (Get Event Info)
- Aus Zwischenablage erhalten (Get From Clipboard)
- Volltext erhalten (Get Full Text)
- OCR-Text erhalten (Get OCR Text)
- Passwort erhalten (Get Password)
- Position erhalten (Get Position)
- Quellelement erhalten (Get Source Element)
- Text erhalten (Get Text)
- Sichtbaren Text erhalten (Get Visible Text)
- Zurück (Go Back)
- Weiter (Go Forward)
- Zur Startseite (Go Home)
- Google Cloud Vision OCR
- Fenster ausblenden (Hide Window)
- Markieren (Highlight)
- Hotkey-Trigger (Hotkey Trigger)
- Darauf zeigen (Hover)
- Auf Bild zeigen (Hover Image)
- Auf OCR-Text zeigen (Hover OCR Text)
- Text beim Darauf zeigen (Hover Text)
- Bild vorhanden (Image Exists)
- Auf Bildschirm anzeigen (Indicate On Screen)
- .NET-Code einfügen
- Inject Js Script
- ActiveX-Methode aufrufen
- Tastendruck-Trigger (Key Press Trigger)
- Bild laden (Load Image)
- Fenster maximieren (Maximize Window)
- Microsoft Azure ComputerVision OCR
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- Fenster minimieren (Minimize Window)
- Ereignisse überwachen (Monitor Events)
- Maus-Trigger (Mouse Trigger)
- Fenster verschieben (Move Window)
- Navigieren zu (Navigate To)
- OCR-Text vorhanden (OCR Text Exists)
- Auf Element erscheinen (On Element Appear)
- Auf Element verschwinden (On Element Vanish)
- Auf Bild erscheinen (On Image Appear)
- Auf Bild verschwinden (On Image Vanish)
- Anwendung öffnen (Open Application)
- Browser öffnen (Open Browser)
- Browser aktualisieren (Refresh Browser)
- Benutzerereignis wiedergeben (Replay User Event)
- Fenster wiederherstellen (Restore Window)
- Bild speichern (Save Image)
- Objekt auswählen (Select Item)
- Mehrere Objekte auswählen (Select Multiple Items)
- Hotkey senden (Send Hotkey)
- Ausschneidebereich einstellen (Set Clipping Region)
- Fokus legen auf (Set Focus)
- Text einstellen (Set Text)
- Auf Zwischenablage setzen (Set To Clipboard)
- Web-Attribut setzen (Set Web Attribute)
- Fenster anzeigen (Show Window)
- Prozess starten (Start Process)
- System-Trigger (System Trigger)
- Screenshot anfertigen (Take Screenshot)
- Tesseract OCR
- Text vorhanden (Text Exists)
- Tooltip
- Eingeben in (Type Into)
- Sicheren Text eingeben (Type Secure Text)
- Vordergrund verwenden
- Attribut abwarten (Wait Attribute)
- Warten, bis Element verschwindet (Wait Element Vanish)
- Warten, bis Bild verschwindet (Wait Image Vanish)
- Application event trigger
- Check/Uncheck
- Check App State
- Check Element
- Klicken (Click)
- Click Event Trigger
- Ziehen und Ablegen
- Extract Table Data
- For Each UI Element
- Attribut erhalten (Get Attribute)
- Get Browser Data
- Text erhalten (Get Text)
- Get URL
- Zu URL wechseln
- Markieren (Highlight)
- Darauf zeigen (Hover)
- Inject Js Script
- Tastenkombinationen
- Keypress Event Trigger
- Mouse Scroll
- Navigate Browser
- Objekt auswählen (Select Item)
- Set Browser Data
- Set Runtime Browser
- Text einstellen (Set Text)
- Screenshot anfertigen (Take Screenshot)
- Eingeben in (Type Into)
- Use Application/Browser
- Anhängen
- Prüfen (Check)
- Klicken (Click)
- Ziehen und Ablegen
- Daten extrahieren
- Attribut erhalten (Get Attribute)
- GetChildren
- GetRuntimeTarget
- GetText
- Get URL
- GoToUrl
- Markieren (Highlight)
- Darauf zeigen (Hover)
- IsEnabled
- Tastaturkürzel (Keyboard Shortcut)
- Mouse Scroll
- Offen
- Objekt auswählen (Select Item)
- Screenshot anfertigen (Take Screenshot)
- Eingeben in (Type Into)
- Wartestatus
- Führen Sie eine Browsersuche durch und rufen Sie Ergebnisse mithilfe von UIAutomation-APIs ab
- Web-Browsing
- Finden von Bildern
- Klicken auf Bilder
- Auslösen und Überwachen von Ereignissen
- Erstellen und Überschreiben von Dateien
- HTML-Seiten: Extrahieren und Bearbeiten von Informationen
- Bearbeiten von Fenstern
- Automatisierte Listenauswahl
- Finden und Bearbeiten von Fensterelementen
- Verwalten der Textautomatisierung
- Laden und Verarbeiten von Bildern
- Verwalten von mausaktivierten Aktionen
- Automatisieren der Anwendungslaufzeit
- Automatisierte Ausführung einer lokalen Anwendung
- Browsernavigation
- Web-Automatisierung
- Beispiel für Trigger Scope
- Aktivieren der Unterstützung für die UI-Automatisierung in DevExpress
- Computer Vision Local Server
- Mobile Automation
- Versionshinweise
- Projektkompatibilität
- Get Log Types
- Get Logs
- Get Page Source
- Get Device Orientation
- Get Session Identifier
- Install App
- Manage Current App
- Manage Other App
- DeepLink öffnen
- Open URL
- Mobile Device Connection
- Richtungswechsel
- Muster zeichnen
- Positional Swipe
- Press Hardware Button
- Set Device Orientation
- Screenshot anfertigen (Take Screenshot)
- Take Screenshot Part
- Element vorhanden (Element Exists)
- Execute Command
- Attribut erhalten (Get Attribute)
- Get Selected Item
- Text erhalten (Get Text)
- Set Selected Item
- Text einstellen (Set Text)
- Wischen
- Tap
- Type Text
- Terminal
- Versionshinweise
- Über das Terminal-Aktivitätspaket
- Projektkompatibilität
- Best Practices
- Find Text
- Get Color At Position
- Get Cursor Position
- Feld erhalten (Get Field)
- Feld an Position erhalten (Get Field at Position)
- Bildschirmbereich erhalten (Get Screen Area)
- Text erhalten (Get Text)
- Text an Position erhalten (Get Text at Position)
- Cursor bewegen (Move Cursor)
- Move Cursor to Text
- Strg-Taste senden (Send Control Key)
- Tasten senden (Send Keys)
- Sichere Tasten senden (Send Keys Secure)
- Feld setzen (Set Field)
- Feld an Position setzen (Set Field at Position)
- Terminalsitzung (Terminal Session)
- Warte auf Feldtext (Wait Field Text)
- Warte auf Bildschirmtext (Wait Screen Text)
- Warte auf Text an Position (Wait Text at Position)
UIAutomation-Aktivitäten
Computer Vision-Aktivitäten
Dieser Abschnitt enthält mit Computer Vision verwandte Aktivitäten im Paket UiPath.UIAutomation.Activities.
- CV Check
- CV Click
- CV Dropdown Select
- CV Element Exists
- CV Extract Table
- CV Get Text
- CV Highlight
- CV Hover
- CV aktualisieren
- CV Screen Scope
- CV Type Into
Die Computer Vision-Aktivitäten enthalten veränderte grundlegende UIAutomation-Aktivitäten wie Click, Type Intooder Get Text. Der Hauptunterschied zwischen den Computer Vision-Aktivitäten und ihren klassischen Pendants besteht in der Verwendung des neuronalen Netzwerks für Computer Vision, das von unserer hauseigenen Abteilung für Machine Learning entwickelt wurde. Das neuronale Netzwerk kann UI-Elemente wie Schaltflächen, Texteingabefelder oder Kontrollkästchen identifizieren, ohne Selektoren zu verwenden.
Diese Aktivitäten werden hauptsächlich für die Automatisierung in virtuellen Desktopumgebungen wie Citrix-Maschinen entwickelt. Sie umgehen das Problem von nicht vorhandenen oder unzuverlässigen Selektoren, da sie Bilder des Fensters, das Sie automatisieren, an das Neuralnetzwerk senden, wo es analysiert wird und alle UI-Elemente identifiziert und beschriftet werden. Intelligente Anker werden verwendet, um die genaue Position des UI-Elements zu bestimmen, mit dem Sie interagieren, um sicherzustellen, dass die Aktion, die Sie ausführen möchten, erfolgreich ist.
Alle Computer Vision-Aktivitäten funktionieren nur innerhalb einer CV Screen Scope -Aktivität, die die eigentliche Verbindung zum neuronalen Netzwerkserver herstellt, sodass Sie die UI der Anwendungen analysieren können, die Sie automatisieren möchten.
So muss jeder Workflow, der die Computer Vision-Aktivitäten verwendet, damit beginnen, dass eine Computer Vision Screen Scope-Aktivität in den Bereich Designer gezogen wird.
Anschließend können Sie mit der Schaltfläche Auf Bildschirm anzeigen (Indicate on screen) im Hauptteil der Scope-Aktivität den Bildschirmbereich auswählen, in dem Sie arbeiten möchten.
Sobald eine CV Screen Scope- Aktivität ordnungsgemäß konfiguriert ist, können Sie alle anderen Aktivitäten im Paket verwenden, um Ihre Automatisierung zu erstellen.
Die Aktivitäten, die Aktionen für UI-Elemente ausführen, können zur Entwurfszeit mithilfe der Schaltfläche Auf Bildschirm anzeigen (Indicate On Screen) auf der Aktivitätskarte konfiguriert werden. Die Aktivitäten mit dieser Funktion sind:
- CV Check
- CV Click
- CV Dropdown Select
- CV Element Exists
- CV Extract Table
- CV Get Text
- CV Highlight
- CV Hover
- CV Screen Scope
- CV Type Into
Durch Klicken auf die Schaltfläche Auf Bildschirm anzeigen (Indicate On Screen) (Hotkey: I) wird der Hilfeassistent geöffnet.
Das Feld Angeben gibt an, was Sie gerade angeben. Wenn der Helper zum ersten Mal geöffnet wird, muss das Ziel angegeben werden. Für jedes mögliche Ziel wählt der Assistent automatisch einen Anker aus, falls einer verfügbar ist.
Die Schaltfläche Elemente anzeigen (Hotkey: s) im Assistenten hebt alle UI-Elemente hervor, die von der Computer Vision-Analyse identifiziert wurden, sodass Sie leichter auswählen können, mit was Sie interagieren möchten.
Die Schaltfläche Bildschirmaktualisierung (Hotkey: F5) kann zur Entwurfszeit verwendet werden, falls sich etwas in der Ziel-App ändert, sodass Sie ein neues Bild zur erneuten Analyse an den Computer Vision-Server senden können.
Die Schaltfläche Verzögerte Bildschirmaktualisierung (Hotkey: F2) führt nach 3 Sekunden Wartezeit eine Aktualisierung der Ziel-App durch. Die automatische Bildlaufrichtung zur Laufzeit wird ebenfalls erfasst (ScrollDirection-Eigenschaft).
Die Aktivitäten mit dem Markierungsassistenten enthalten auch eine Funktion Relativ zu, bei der das Ziel ein stabiles Element ist und Sie eine Entfernung relativ dazu ziehen. Das Hauptziel, das stabile Ziel, dient als Proxy-Ziel für das zweite, das relative Ziel.
Dies ist nützlich, wenn Sie einen Bereich auswählen möchten, der nicht den von dem Computer Vision-Modul identifizierten UI-Elementen entspricht, oder wenn Sie einen allgemeinen Bereich in der Benutzeroberfläche auswählen möchten, ohne ein bestimmtes UI-Element anzugeben.
Das relative Ziel kann entweder ein einzelner Punkt oder eine Bereichsauswahl in der Anwendung sein, die Sie automatisieren.
Die Einzelpunktauswahl wird normalerweise an einer Stelle platziert, an der die Computer Vision-Erkennung nicht genau ist und bestimmte Elemente möglicherweise nicht findet. Die Aktivitäten, die die Einzelpunktauswahl verwenden, sind CV Click, CV Hover und CV Type Into.
Die Bereichsauswahl wird von CV Get Text verwendet und für diese Aktivität automatisch aktiviert.
Generell muss jeder hinzugefügte Anker zur Runtime gefunden werden. Das heißt, wenn nicht mindestens ein Anker gefunden wird, kann die gesamte Auswahl nicht gefunden werden. Anker müssen also stabile Elemente sein, von denen Sie mit Sicherheit wissen, dass sie von Computer Vision jedes Mal erkannt werden können und die sich in der Benutzeroberfläche zur Runtime nicht erheblich verändern.
Angenommen, Sie möchten auf die Schaltfläche „X“ in der Abbildung unten klicken. Sie sehen, dass sich das Ziel auf der Schaltfläche „X“ befindet, aber der Klick erfolgt im grünen Kreis. Dies liegt daran, dass Sie sich dafür entschieden haben, relativ zur Schaltfläche „X“ zu klicken. Wenn Computer Vision also ein bestimmtes UI-Element nicht erkennen kann, sollte die Funktion Relativ zu nicht verwendet werden.
Um die Schaltfläche „X“ auszuwählen und nicht einen Bereich relativ dazu, vergewissern Sie sich, dass die Schaltfläche „X“ einen grünen Umriss hat.
Wenn die Schaltfläche „X“ nicht stabil ist, können Sie relativ zu einem stabilen Element klicken.
Die Computer Vision-Aktivitäten bieten auch Unterstützung für das Anzeigen von Tabellen. Das Targeting in Tabellen kann durch Auswählen einer Zelle erfolgen, mit der Sie interagieren möchten, wodurch das neuronale Netzwerk automatisch die Spalte und die Zeile identifiziert, die die Position dieser Zelle definieren, und sie in einem Raster anzeigt.
Standardmäßig werden die Namen der Spalte und Zeile im Deskriptor verwendet, um die Position der Zelle zu bestimmen. Wenn Sie auf die Spalten- und Zeilenindizes klicken, werden sie automatisch zu Ihrem Deskriptor hinzugefügt. Dies kann in Situationen nützlich sein, in denen Spalten- und Zeilennamen geändert werden, Sie aber dieselbe Position einer Zelle extrahieren möchten.
Nachdem Sie das Zielerfolgreich angegeben haben, wird der Assistent geschlossen und die Aktivität wird mit dem von Ihnen ausgewählten Ziel konfiguriert.