- Überblick
- UI-Automatisierung (UI Automation)
- Mit UI-Automatisierung automatisierte Anwendungen und Technologien
- Projektkompatibilität
- UI-ANA-016 – URL zum Öffnen eines Browsers abrufen
- UI-ANA-017 – ContinueOnError True
- UI-ANA-018 – OCR-/Bildaktivitäten auflisten
- UI-DBP-006 – Containernutzung
- UI-DBP-013 – Falscher Gebrauch von Excel-Automatisierung
- UI-DBP-030 – Verwendung unzulässiger Variablen in Selektoren
- UI-PRR-001 – Klick simulieren
- UI-PRR-002 – Typ simulieren
- UI-PRR-003 – Offener Anwendungsmissbrauch
- UI-PRR-004 – Hartcodierte Verzögerungen
- UI-REL-001 – Große IDX in Selektoren
- UI-SEC-004 – Selektor-E-Mail-Daten
- UI-SEC-010 – App-/URL-Einschränkungen
- UI-USG-011 – Nicht zulässige Attribute
- UX-SEC-010 – App-/URL-Einschränkungen
- UX-DBP-029 – Unsichere Kennwortnutzung
- UI-PST-001 – Prüfungsprotokollebene in Projekteinstellungen
- UiPath-Browsermigrationstool
- Clippingbereich
- Computer Vision Recorder
- Aktivieren (Activate)
- Ankerbasis (Anchor Base)
- Browser anhängen (Attach Browser)
- Fenster anhängen (Attach Window)
- Benutzeingabe blockieren (Block User Input)
- Textfeld (Callout)
- Prüfen (Check)
- Klicken (Click)
- Bild anklicken (Click Image)
- Bild-Trigger anklicken (Click Image Trigger)
- OCR-Text anklicken (Click OCR Text)
- Text anklicken (Click Text)
- Trigger anklicken (Click Trigger)
- Anwendung schließen (Close Application)
- Registerkarte schließen (Close Tab)
- Fenster schließen (Close Window)
- Kontextbewusster Anker
- Ausgewählten Text kopieren (Copy Selected Text)
- Element Attribute Change Trigger
- Element vorhanden (Element Exists)
- Elementumfang (Element Scope)
- Element State Change Trigger
- Export UI Tree
- Strukturierte Daten extrahieren (Extract Structured Data)
- Untergeordnete Elemente finden (Find Children)
- Element finden (Find Element)
- Bild finden (Find Image)
- Bildübereinstimmung finden (Find Image Matches)
- OCR-Textposition finden (Find OCR Text Position)
- Relatives Element finden (Find Relative Element)
- Textposition finden (Find Text Position)
- Aktives Fenster abrufen (Get Active Window)
- Vorgänger-Element erhalten (Get Ancestor)
- Attribut erhalten (Get Attribute)
- Ereignisinfo erhalten (Get Event Info)
- Aus Zwischenablage erhalten (Get From Clipboard)
- Volltext erhalten (Get Full Text)
- OCR-Text erhalten (Get OCR Text)
- Passwort erhalten (Get Password)
- Position erhalten (Get Position)
- Quellelement erhalten (Get Source Element)
- Text erhalten (Get Text)
- Sichtbaren Text erhalten (Get Visible Text)
- Zurück (Go Back)
- Weiter (Go Forward)
- Zur Startseite (Go Home)
- Google Cloud Vision OCR
- Fenster ausblenden (Hide Window)
- Markieren (Highlight)
- Hotkey-Trigger (Hotkey Trigger)
- Darauf zeigen (Hover)
- Auf Bild zeigen (Hover Image)
- Auf OCR-Text zeigen (Hover OCR Text)
- Text beim Darauf zeigen (Hover Text)
- Bild vorhanden (Image Exists)
- Auf Bildschirm anzeigen (Indicate On Screen)
- .NET-Code einfügen
- Inject Js Script
- ActiveX-Methode aufrufen
- Tastendruck-Trigger (Key Press Trigger)
- Bild laden (Load Image)
- Fenster maximieren (Maximize Window)
- Microsoft Azure ComputerVision OCR
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- Fenster minimieren (Minimize Window)
- Ereignisse überwachen (Monitor Events)
- Maus-Trigger (Mouse Trigger)
- Fenster verschieben (Move Window)
- Navigieren zu (Navigate To)
- OCR-Text vorhanden (OCR Text Exists)
- Auf Element erscheinen (On Element Appear)
- Auf Element verschwinden (On Element Vanish)
- Auf Bild erscheinen (On Image Appear)
- Auf Bild verschwinden (On Image Vanish)
- Anwendung öffnen (Open Application)
- Browser öffnen (Open Browser)
- Browser aktualisieren (Refresh Browser)
- Benutzerereignis wiedergeben (Replay User Event)
- Fenster wiederherstellen (Restore Window)
- Bild speichern (Save Image)
- Objekt auswählen (Select Item)
- Mehrere Objekte auswählen (Select Multiple Items)
- Hotkey senden (Send Hotkey)
- Ausschneidebereich einstellen (Set Clipping Region)
- Fokus legen auf (Set Focus)
- Text einstellen (Set Text)
- Auf Zwischenablage setzen (Set To Clipboard)
- Web-Attribut setzen (Set Web Attribute)
- Fenster anzeigen (Show Window)
- Prozess starten (Start Process)
- System-Trigger (System Trigger)
- Screenshot anfertigen (Take Screenshot)
- Tesseract OCR
- Text vorhanden (Text Exists)
- Tooltip
- Eingeben in (Type Into)
- Sicheren Text eingeben (Type Secure Text)
- Vordergrund verwenden
- Attribut abwarten (Wait Attribute)
- Warten, bis Element verschwindet (Wait Element Vanish)
- Warten, bis Bild verschwindet (Wait Image Vanish)
- Application event trigger
- Check/Uncheck
- Check App State
- Check Element
- Klicken (Click)
- Click Event Trigger
- Popup schließen
- Ziehen und Ablegen
- Extract Table Data
- For Each UI Element
- Attribut erhalten (Get Attribute)
- Get Browser Data
- Text erhalten (Get Text)
- Get URL
- Zu URL wechseln
- Markieren (Highlight)
- Darauf zeigen (Hover)
- Inject Js Script
- Tastenkombinationen
- Keypress Event Trigger
- Mouse Scroll
- Navigate Browser
- Objekt auswählen (Select Item)
- Set Browser Data
- Set Runtime Browser
- Text einstellen (Set Text)
- Screenshot anfertigen (Take Screenshot)
- Eingeben in (Type Into)
- Use Application/Browser
- Anhängen
- Prüfen (Check)
- Klicken (Click)
- Ziehen und Ablegen
- Daten extrahieren
- Attribut erhalten (Get Attribute)
- GetChildren
- GetRuntimeTarget
- GetText
- Get URL
- GoToUrl
- Markieren (Highlight)
- Darauf zeigen (Hover)
- IsEnabled
- Tastaturkürzel (Keyboard Shortcut)
- Mouse Scroll
- Offen
- Objekt auswählen (Select Item)
- Screenshot anfertigen (Take Screenshot)
- Eingeben in (Type Into)
- Wartestatus
- Führen Sie eine Browsersuche durch und rufen Sie Ergebnisse mithilfe von UIAutomation-APIs ab
- Web-Browsing
- Finden von Bildern
- Klicken auf Bilder
- Auslösen und Überwachen von Ereignissen
- Erstellen und Überschreiben von Dateien
- HTML-Seiten: Extrahieren und Bearbeiten von Informationen
- Bearbeiten von Fenstern
- Automatisierte Listenauswahl
- Finden und Bearbeiten von Fensterelementen
- Verwalten der Textautomatisierung
- Laden und Verarbeiten von Bildern
- Verwalten von mausaktivierten Aktionen
- Automatisieren der Anwendungslaufzeit
- Automatisierte Ausführung einer lokalen Anwendung
- Browsernavigation
- Web-Automatisierung
- Beispiel für Trigger Scope
- Computer Vision Local Server
- Versionshinweise
- Über das Computer Vision Local Server-Paket
- Mobile Automation
- Versionshinweise
- Projektkompatibilität
- Get Log Types
- Get Logs
- Get Page Source
- Get Device Orientation
- Get Session Identifier
- Install App
- Manage Current App
- Manage Other App
- DeepLink öffnen
- Open URL
- Mobile Device Connection
- Richtungswechsel
- Muster zeichnen
- Positional Swipe
- Press Hardware Button
- Set Device Orientation
- Screenshot anfertigen (Take Screenshot)
- Take Screenshot Part
- Element vorhanden (Element Exists)
- Execute Command
- Attribut erhalten (Get Attribute)
- Get Selected Item
- Text erhalten (Get Text)
- Set Selected Item
- Text einstellen (Set Text)
- Wischen
- Tap
- Type Text
- Terminal
- Versionshinweise
- Über das Terminal-Aktivitätspaket
- Projektkompatibilität
- Best Practices
- Find Text
- Get Color At Position
- Get Cursor Position
- Feld erhalten (Get Field)
- Feld an Position erhalten (Get Field at Position)
- Bildschirmbereich erhalten (Get Screen Area)
- Text erhalten (Get Text)
- Text an Position erhalten (Get Text at Position)
- Cursor bewegen (Move Cursor)
- Move Cursor to Text
- Strg-Taste senden (Send Control Key)
- Tasten senden (Send Keys)
- Sichere Tasten senden (Send Keys Secure)
- Feld setzen (Set Field)
- Feld an Position setzen (Set Field at Position)
- Terminalsitzung (Terminal Session)
- Warte auf Feldtext (Wait Field Text)
- Warte auf Bildschirmtext (Wait Screen Text)
- Warte auf Text an Position (Wait Text at Position)
Über das Computer Vision Local Server-Paket
UiPath.ComputerVision.LocalServer
-Paket enthält keine Aktivitäten, ermöglicht Ihnen aber nach der Installation in einem Projekt die Verwendung eines lokalen Computer Vision-Servers. Es kann über den Paket-Manager in Studio installiert werden.
Das lokale Computer Vision-Modell entspricht in seinen Funktionen dem aktuellen Servermodell. Es gibt kleine Unterschiede zwischen diesen Modellversionen, z. B.:
- Mit dem Computer Vision Local Server können Sie Computer Vision direkt auf der Maschine verwenden, auf der es installiert ist, ohne dass andere externe Ressourcen benötigt werden, wie z. B. eine separate Servermaschine oder eine leistungsstarke GPU usw.
- Der lokale Server ist langsamer als die anderen verfügbaren Servertypen.
- Alle von dieser Version des Modells verwendeten Daten werden lokal auf der Maschine verarbeitet, auf der sie installiert ist. Es werden keine Daten außerhalb Ihrer Maschine gesendet, um verarbeitet zu werden.
- Die mit dieser Version des Modells verbundenen Kosten sind erheblich niedriger, da die Hardware- und Wartungsanforderungen im Vergleich zur lokalen Serverversion null sind.
- Das Modell kann bis zu 2000 Wörter pro Anforderung verarbeiten. Wenn eine Anforderung diesen Grenzwert überschreitet, gibt das Modell weiterhin 2000 Wörter zurück, jedoch ohne sichere Reihenfolge.
- Bis v21.6 unterstützt der lokale Computer Vision-Server OCR nicht.
- Bis v22.7 unterstützt der lokale Computer Vision-Server die Tabellenextraktion nicht.
Empfohlene Hardwarespezifikationen
Sie benötigen eine Maschine mit den folgenden Hardwarespezifikationen:
- eine CPU mit mindestens 4 Kernen; Die Leistung skaliert mit mehreren CPUs, sodass 8 Kerne noch besser wären. Beachten Sie jedoch, dass eine Skalierung über 16 Kerne zu abnehmenden Erträgen mit geringer bis gar keiner Beschleunigung führen würde.
- AVX2-Unterstützung; CPUs ohne AVX2-Anweisungen werden nicht unterstützt und ein Fehler wird ausgegeben, wenn sie verwendet werden
- mindestens 8 GB RAM
Wann sollte diese Serverversion verwendet werden?
- Wenn Sie den Computer Vision-Cloud-Server oder den lokalen Computer Vision-Server nicht verwenden können.
- Wenn Sie aus Sicherheitsgründen nicht möchten, dass Daten die Maschine verlassen, auf der Sie den Automatisierungsprozess ausführen.
- Wenn Sie keine zusätzliche Software auf der Maschine installieren können, die Sie verwenden möchten, da diese Version keine zusätzliche Installation auf der Maschine erfordert, kann sie einfach über Studio über den Paket-Manager installiert werden.
Wie verwenden Sie diesen Server?
Installieren Sie das Paket UiPath.ComputerVision.LocalServer in Ihrem Studio-Projekt mithilfe des Paket-Managers.
Sobald dieses Paket installiert ist, kann die Aktivität CV Screen Scope über die Eigenschaft UseLocalServer so konfiguriert werden, dass sie diesen lokalen Server verwendet.
Sie können auch Computer Vision Local Server verwenden, wenn Sie Lokalen Server verwenden in Projekteinstellungen > Computer Vision auf True festlegen. Wenn der lokale Server aktiviert ist, wird der Serverwert überschrieben.
Der Computer Vision Local Server ist in plattformübergreifenden Projekten nicht verfügbar.
Zur ordnungsgemäßen Ausführung benötigt UiPath.ComputerVision.LocalServer die Visual C++ Redistributables für 2015-2019 sowohl für x64- als auch für x86-Systeme, die auf dem Betriebssystem installiert sind, in dem Sie sie verwenden möchten. Die neuesten Versionen finden Sie hier.
Response from server is not valid
-Fehler auftritt, ist die wahrscheinlichste Erklärung, dass die ausführbare Datei des lokalen Servers von einer Antivirensoftware blockiert wird. Bitte überprüfen Sie das
UiPath.CVLocalServer.Host.exe
von CurrentUser\.nuget\packages\uipath.computervision.localserver\20.10.0\lib\net461
(für Version 20.10) oder CurrentUser\.nuget\packages\uipath.computervision.localserver\USED_VERSION\build
(für Version 21.2 und höher) wird von der von Ihnen verwendeten Antivirensoftware als vertrauenswürdig eingestuft.