- Überblick
- UI-Automatisierung (UI Automation)
- Mit UI-Automatisierung automatisierte Anwendungen und Technologien
- Projektkompatibilität
- UI-ANA-016 – URL zum Öffnen eines Browsers abrufen
- UI-ANA-017 – ContinueOnError True
- UI-ANA-018 – OCR-/Bildaktivitäten auflisten
- UI-DBP-006 – Containernutzung
- UI-DBP-013 – Falscher Gebrauch von Excel-Automatisierung
- UI-DBP-030 – Verwendung unzulässiger Variablen in Selektoren
- UI-PRR-001 – Klick simulieren
- UI-PRR-002 – Typ simulieren
- UI-PRR-003 – Offener Anwendungsmissbrauch
- UI-PRR-004 – Hartcodierte Verzögerungen
- UI-REL-001 – Große IDX in Selektoren
- UI-SEC-004 – Selektor-E-Mail-Daten
- UI-SEC-010 – App-/URL-Einschränkungen
- UI-USG-011 – Nicht zulässige Attribute
- UX-SEC-010 – App-/URL-Einschränkungen
- UX-DBP-029 – Unsichere Kennwortnutzung
- UI-PST-001 – Prüfungsprotokollebene in Projekteinstellungen
- UiPath-Browsermigrationstool
- Clipping region
- Computer Vision Recorder
- Aktivieren (Activate)
- Ankerbasis (Anchor Base)
- Browser anhängen (Attach Browser)
- Fenster anhängen (Attach Window)
- Benutzeingabe blockieren (Block User Input)
- Textfeld (Callout)
- Prüfen (Check)
- Klicken (Click)
- Bild anklicken (Click Image)
- Bild-Trigger anklicken (Click Image Trigger)
- OCR-Text anklicken (Click OCR Text)
- Text anklicken (Click Text)
- Trigger anklicken (Click Trigger)
- Anwendung schließen (Close Application)
- Registerkarte schließen (Close Tab)
- Fenster schließen (Close Window)
- Kontextbewusster Anker
- Ausgewählten Text kopieren (Copy Selected Text)
- Element Attribute Change Trigger
- Element vorhanden (Element Exists)
- Elementumfang (Element Scope)
- Element State Change Trigger
- Export UI Tree
- Strukturierte Daten extrahieren (Extract Structured Data)
- Untergeordnete Elemente finden (Find Children)
- Element finden (Find Element)
- Bild finden (Find Image)
- Bildübereinstimmung finden (Find Image Matches)
- OCR-Textposition finden (Find OCR Text Position)
- Relatives Element finden (Find Relative Element)
- Textposition finden (Find Text Position)
- Aktives Fenster abrufen (Get Active Window)
- Vorgänger-Element erhalten (Get Ancestor)
- Attribut erhalten (Get Attribute)
- Ereignisinfo erhalten (Get Event Info)
- Aus Zwischenablage erhalten (Get From Clipboard)
- Volltext erhalten (Get Full Text)
- OCR-Text erhalten (Get OCR Text)
- Passwort erhalten (Get Password)
- Position erhalten (Get Position)
- Quellelement erhalten (Get Source Element)
- Text erhalten (Get Text)
- Sichtbaren Text erhalten (Get Visible Text)
- Zurück (Go Back)
- Weiter (Go Forward)
- Zur Startseite (Go Home)
- Google Cloud Vision OCR
- Fenster ausblenden (Hide Window)
- Markieren (Highlight)
- Hotkey-Trigger (Hotkey Trigger)
- Darauf zeigen (Hover)
- Auf Bild zeigen (Hover Image)
- Auf OCR-Text zeigen (Hover OCR Text)
- Text beim Darauf zeigen (Hover Text)
- Bild vorhanden (Image Exists)
- Auf Bildschirm anzeigen (Indicate On Screen)
- .NET-Code einfügen
- Inject Js Script
- ActiveX-Methode aufrufen
- Tastendruck-Trigger (Key Press Trigger)
- Bild laden (Load Image)
- Fenster maximieren (Maximize Window)
- Microsoft Azure ComputerVision OCR
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- Fenster minimieren (Minimize Window)
- Ereignisse überwachen (Monitor Events)
- Maus-Trigger (Mouse Trigger)
- Fenster verschieben (Move Window)
- Navigieren zu (Navigate To)
- OCR-Text vorhanden (OCR Text Exists)
- Auf Element erscheinen (On Element Appear)
- Auf Element verschwinden (On Element Vanish)
- Auf Bild erscheinen (On Image Appear)
- Auf Bild verschwinden (On Image Vanish)
- Anwendung öffnen (Open Application)
- Browser öffnen (Open Browser)
- Browser aktualisieren (Refresh Browser)
- Benutzerereignis wiedergeben (Replay User Event)
- Fenster wiederherstellen (Restore Window)
- Bild speichern (Save Image)
- Objekt auswählen (Select Item)
- Mehrere Objekte auswählen (Select Multiple Items)
- Hotkey senden (Send Hotkey)
- Ausschneidebereich einstellen (Set Clipping Region)
- Fokus legen auf (Set Focus)
- Text einstellen (Set Text)
- Auf Zwischenablage setzen (Set To Clipboard)
- Web-Attribut setzen (Set Web Attribute)
- Fenster anzeigen (Show Window)
- Prozess starten (Start Process)
- System-Trigger (System Trigger)
- Screenshot anfertigen (Take Screenshot)
- Tesseract OCR
- Text vorhanden (Text Exists)
- Tooltip
- Eingeben in (Type Into)
- Sicheren Text eingeben (Type Secure Text)
- Vordergrund verwenden
- Attribut abwarten (Wait Attribute)
- Warten, bis Element verschwindet (Wait Element Vanish)
- Warten, bis Bild verschwindet (Wait Image Vanish)
- Application event trigger
- Check/Uncheck
- Check App State
- Check Element
- Klicken (Click)
- Click Event Trigger
- Popup schließen
- Ziehen und Ablegen
- Extract Table Data
- For Each UI Element
- Attribut erhalten (Get Attribute)
- Get Browser Data
- Text erhalten (Get Text)
- Get URL
- Zu URL wechseln
- Markieren (Highlight)
- Darauf zeigen (Hover)
- Inject Js Script
- Tastenkombinationen
- Keypress Event Trigger
- Mouse Scroll
- Navigate Browser
- Objekt auswählen (Select Item)
- Set Browser Data
- Set Runtime Browser
- Text einstellen (Set Text)
- Screenshot anfertigen (Take Screenshot)
- Eingeben in (Type Into)
- Use Application/Browser
- Anhängen
- Prüfen (Check)
- Klicken (Click)
- Ziehen und Ablegen
- Daten extrahieren
- Attribut erhalten (Get Attribute)
- GetChildren
- GetRuntimeTarget
- GetText
- Get URL
- GoToUrl
- Markieren (Highlight)
- Darauf zeigen (Hover)
- IsEnabled
- Tastaturkürzel (Keyboard Shortcut)
- Mouse Scroll
- Offen
- Objekt auswählen (Select Item)
- Screenshot anfertigen (Take Screenshot)
- Eingeben in (Type Into)
- Wartestatus
- Führen Sie eine Browsersuche durch und rufen Sie Ergebnisse mithilfe von UIAutomation-APIs ab
- Web-Browsing
- Finden von Bildern
- Klicken auf Bilder
- Auslösen und Überwachen von Ereignissen
- Erstellen und Überschreiben von Dateien
- HTML-Seiten: Extrahieren und Bearbeiten von Informationen
- Bearbeiten von Fenstern
- Automatisierte Listenauswahl
- Finden und Bearbeiten von Fensterelementen
- Verwalten der Textautomatisierung
- Laden und Verarbeiten von Bildern
- Verwalten von mausaktivierten Aktionen
- Automatisieren der Anwendungslaufzeit
- Automatisierte Ausführung einer lokalen Anwendung
- Browsernavigation
- Web-Automatisierung
- Beispiel für Trigger Scope
- Computer Vision Local Server
- Mobile Automation
- Versionshinweise
- Projektkompatibilität
- Get Log Types
- Get Logs
- Get Page Source
- Get Device Orientation
- Get Session Identifier
- Install App
- Manage Current App
- Manage Other App
- DeepLink öffnen
- Open URL
- Mobile Device Connection
- Richtungswechsel
- Muster zeichnen
- Positional Swipe
- Press Hardware Button
- Set Device Orientation
- Screenshot anfertigen (Take Screenshot)
- Take Screenshot Part
- Element vorhanden (Element Exists)
- Execute Command
- Attribut erhalten (Get Attribute)
- Get Selected Item
- Text erhalten (Get Text)
- Set Selected Item
- Text einstellen (Set Text)
- Wischen
- Tap
- Type Text
- Terminal
- Versionshinweise
- Über das Terminal-Aktivitätspaket
- Projektkompatibilität
- Best Practices
- Find Text
- Get Color At Position
- Get Cursor Position
- Feld erhalten (Get Field)
- Feld an Position erhalten (Get Field at Position)
- Bildschirmbereich erhalten (Get Screen Area)
- Text erhalten (Get Text)
- Text an Position erhalten (Get Text at Position)
- Cursor bewegen (Move Cursor)
- Move Cursor to Text
- Strg-Taste senden (Send Control Key)
- Tasten senden (Send Keys)
- Sichere Tasten senden (Send Keys Secure)
- Feld setzen (Set Field)
- Feld an Position setzen (Set Field at Position)
- Terminalsitzung (Terminal Session)
- Warte auf Feldtext (Wait Field Text)
- Warte auf Bildschirmtext (Wait Screen Text)
- Warte auf Text an Position (Wait Text at Position)
CV Screen Scope
UiPath.CV.Activities.CVScope
Initialisiert das neuronale Netzwerk von UiPath Computer Vision, analysiert das angegebene Fenster und bietet einen Scope für alle nachfolgenden Computer Vision-Aktivitäten. Mit der Aktivität können Sie auswählen, welche OCR-Engine Sie für das Scraping des Texts in der Zielanwendung verwenden möchten. Die standardmäßig verwendete OCR-Engine für diese Aktivität ist UiPath Screen OCR. Sie können die Engine ändern, indem Sie die standardmäßige Engine manuell durch eine gewünschte ersetzen.
Allgemein
-
BeiFehlerFortfahren (ContinueOnError) - Gibt an, ob die Automatisierung auch bei Auftreten eines Fehlers weiterlaufen soll. Das Feld unterstützt nur Boolesche Werte (Wahr, Falsch). Der Standardwert ist Falsch. Dadurch wird die Ausführung des Projekts beim Auftreten eines Fehlers angehalten, wenn das Feld leer. Wenn der Wert auf Wahr gesetzt ist, wird das Projekt weiter ausgeführt, auch wenn Fehler auftreten.
Hinweis: Wenn diese Aktivität in Try Catch enthalten ist und der Wert der Eigenschaft BeiFehlerFortsetzen auf „True“ gesetzt ist, wird kein Fehler beim Ausführen des Projekts aufgefangen. - VerzögernVor – Verzögerungszeit (in Millisekunden), bevor die Aktivität Operationen ausführt. Der Standardwert für dieses Feld ist 300 Millisekunden.
- AnzeigeName (DisplayName) - Der Anzeigename der Aktivität.
Eingabe
-
CVMethode – Eine Dropdownliste, die angibt, welche Erkennungsmethode Sie mit dieser Aktivität verwenden möchten. Standardmäßig sind die beiden Optionen Elementerkennung und OCR ausgewählt. Die folgenden Optionen sind verfügbar:
- Keine – Verwendet nur Bildautomatisierung.
- Elementerkennung – Verwendet Computer Vision.
- OCR – Verwendet OCR.
- Target.ClippingRegion - Definiert das Ausschneide-Rechteck in Pixel im Verhältnis zum UIElement in folgenden Richtungen: links, oben, rechts, unten. Es unterstützt sowohl positive als auch negative Zahlen.
- Ziel.Element – Verwendet die UIElement-Variable, die von einer anderen Aktivität zurückgegeben wird. Diese Eigenschaft kann nicht zusammen mit der Selektor-Eigenschaft verwendet werden. Dieses Feld unterstützt nur UIElement-Variablen.
- Ziel.Selektor (Target.Selector) - Texteigenschaft zum Suchen eines bestimmten UI-Elements, wenn die Aktivität ausgeführt wird. Die Eigenschaft ist genau genommen ein XML-Fragment, das Attribute des gesuchten GUI-Elements und einige übergeordnete Elemente spezifiziert.
- Timeout (Millisekunden) – Gibt an, wie lange (in Millisekunden) die Aktivität laufen muss, bevor der Fehler
SelectorNotFoundException
ausgegeben wird. Der Standardwert ist 30.000 Millisekunden (30 Sekunden). -
Ziel.WartenAufBereitschaft – Wartet vor der Ausführung der Aktionen, bis das Ziel bereit ist. Standardmäßig ist dieses Feld auf INTERAKTIV festgelegt. Die folgenden Optionen sind verfügbar:
- Keine (None) - Wartet ausschließlich auf das UI-Zielelement, bevor die Aktion ausgeführt wird. Sie können diese Option beispielsweise verwenden, wenn Sie nur Text einer Website abrufen oder eine bestimmte Schaltfläche anklicken möchten, ohne auf das Laden aller UI-Elemente warten zu müssen. Beachten Sie, dass dies ungewünschte Folgen haben kann, wenn die Schaltfläche von Elementen wie Skripten abhängt, die noch nicht geladen sind.
- INTERAKTIV – Wartet, bis die UI-Elemente, mit denen Sie in der Zielanwendung arbeiten, vorhanden sind, bevor die Aktion ausgeführt wird.
-
ABGESCHLOSSEN – Wartet, bis alle UI-Elemente in der Zielanwendung vorhanden sind, bevor die Aktion tatsächlich ausgeführt wird.
Um zu beurteilen, ob sich eine Anwendung im Status „Interaktiv“ oder „Abgeschlossen“ befindet, werden die folgenden Tags überprüft:
- Desktop-Anwendungen (Desktop applications) - Eine Nachricht
wm_null
wird versendet, um zu prüfen, ob die Tags<wnd>
,<ctrl>
,<java>
oder<uia>
vorhanden sind. Sind die Tags vorhanden, wird die Aktivität ausgeführt. - Webanwendung
- Internet Explorer – Das
<webctrl>
-Tag wird verwendet, um zu überprüfen, ob der Status Bereit des HTML-Dokuments Abgeschlossen ist. Zudem muss der Status Beschäftigt aufFalse
festgelegt sein. - Andere – Das
<webctrl>
-Tag wird verwendet, um zu überprüfen, ob der Bereitschafts-Status des HTML-Dokuments Abgeschlossen ist.
- Internet Explorer – Das
- SAP-Anwendungen – Zuerst wird überprüft, ob das Tag
<wnd>
vorhanden ist. Dann wird eine SAP-spezifische API verwendet, um zu überprüfen, ob die Sitzung beschäftigt ist.
- Desktop-Anwendungen (Desktop applications) - Eine Nachricht
Sonstiges
- Privat (Private) - Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.
Bildlauf
- Bildlauf-Offset – Bildlauf-Offset, der beim Bildlauf verwendet wird, um das Ziel jeder der Computer Vision-Aktivitäten in diesem Scope zu finden.
Server (synchronisiert)
-
ApiSchlüssel (ApiKey) - Der API-Schlüssel für die Authentifizierung gegenüber dem Computer Vision Server. Dieses Feld unterstützt nur Zeichenfolgen oder String-Variablen. Hierbei handelt es sich um eine globale Eigenschaft, die alle CV-Bildschirmbereich- (CV Screen Scope) Aktivitäten im Workflow aufweisen.
Hinweis: Bitte beachten Sie, dass der API-Schlüssel nur erforderlich ist, wenn Sie eine Verbindung mit dem UiPath Automation Cloud-Server herstellen. Weitere Informationen zum Erhalten eines Schlüssels finden Sie hier.Hinweis: Wenn die APISchlüssel-Eigenschaft für eine Scope-Aktivität bearbeitet wird, wird der Wert für alle anderen Scopes im aktuellen Workflow geändert, sodass Sie dies nicht manuell machen müssen. - URL – Die URL des Servers, der den Computer Vision-Dienst ausführt. Standardmäßig ist diese Eigenschaft auf
https://cv.uipath.com/
festgelegt. Das ist eine globale Eigenschaft, die von allen CV Screen Scope-Aktivitäten im Workflow genutzt wird. -
LokalenServerVerwenden – Wenn diese Option aktiviert ist, wird der lokale Server für die Analyse verwendet. Um den lokalen Server zu verwenden, muss das Paket UiPath.ComputerVision.LocalServer installiert werden.
Hinweis:Wenn Sie eine lokale Serverbereitstellung des Neuralnetzwerkmodells verwenden, müssen Sie zum Herstellen einer Verbindung damit mit den Computer Vision-Aktivitäten den Wert der URL -Eigenschaft der Aktivität CV Screen Scope in die URL Ihres Servers ändern.
Weitere Informationen zum Herstellen einer Verbindung mit dem Server finden Sie hier.
Die Anwendung, die Sie automatisieren möchten, kann für die „CV Screen Scope“-Aktivität mit der Schaltfläche Auf Bildschirm anzeigen im Textkörper der Aktivität angegeben werden. Danach wird eine Aufnahme des Bildschirms, den Sie angegeben haben, im Textkörper der Aktivität angezeigt.
Wenn Sie beim Automatisieren einer Anwendung mehrere Bildschirme angeben, können Sie mit den direktionalen Schaltflächen (<, >) zwischen den Bildschirmen wechseln, um einfach zu überprüfen, welche Bildschirme die Aktivität verwendet.
Bildschirme können auch umbenannt werden, indem Sie sie aus der Dropdownliste Bildschirmname auswählen und auf die Schaltfläche klicken.