ai-computer-vision

2024.10

false

Versionshinweise
Überblick
- Einleitung
- Widerstandsfähigkeit der Modellaktualisierung
Einstellung und Konfiguration (Setup and Configuration)
Datenspeicher
- Datenspeicher

Wichtig :

Bitte beachten Sie, dass dieser Inhalt teilweise mithilfe von maschineller Übersetzung lokalisiert wurde. Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

AI Computer Vision-Benutzerhandbuch

BEREITSTELLUNG:

Letzte Aktualisierung 19. Dez. 2025

Einleitung

AI Computer Vision ist eine auf Machine Learning basierende Methode, die alle UI-Elemente auf einem Computerbildschirm visuell identifiziert und mit ihnen über UiPath Robots interagiert, um eine menschliche Interaktion zu simulieren. Dabei werden nicht die zugrunde liegenden Eigenschaften von Anwendungen benötigt oder verwendet, sondern nur das Aussehen und die Beziehung verschiedener Bildschirmelemente.

Anstatt sich auf Selektoren zu verlassen, nutzt AI Computer Vision KI (Objekterkennung, OCR, Fuzzy Text-Matching, Image-Matching für Symbole) und ein Ankersystem, um alles miteinander zu verknüpfen. Genauer gesagt führt AI Computer Vision zum visuellen Lokalisieren von Elementen auf dem Bildschirm eine Elementerkennung (auf dem Machine-Learning-Server) und eine Texterkennung (OCR) durch und kombiniert diese beiden zu einem vollständigen Verständnis der UI. Die Beziehung zwischen Elementen, die mit diesen beiden Methoden erkannt werden, wird dann in einen Deskriptor mit mehreren Ankern codiert, der das Zielelement eindeutig identifiziert.

AI Computer Vision besteht aus einer Reihe von Aktivitäten, die Teil des UIAutomation-Aktivitätspakets sind, sowie aus einem Server (der Cloud, lokal oder lokal sein kann), der ein KI-Modell hostet, das zur Durchführung der Aufgaben erforderlich ist tatsächliche Analyse der Benutzeroberfläche, die Sie automatisieren. Standardmäßig wird unser UiPath-Cloudserver verwendet und auch für alle AI Computer Vision- und UI Automation-Aktivitäten empfohlen. Sie können die AI Computer Vision-Cloud unabhängig von Ihrem Bereitstellungstyp verwenden. Es spielt beispielsweise keine Rolle, ob Sie einen Orchestrator lokal oder einen Orchestrator in der Cloud haben: Sie können Computer Vision in der Cloud ausführen, ohne dass eine spezielle Konfiguration erforderlich ist.

Alternativ können Sie Ihren eigenen lokalen AI Computer Vision-Server hosten und verwalten und zum Ausführen der AI Computer Vision-Aktivitäten verwenden. Wenn Sie diesen Servertyp verwenden, benötigen Sie eine eigene Hardwareinfrastruktur (GPUs) oder eine eigene Cloud-Umgebung. Außerdem müssen Sie Ihre eigene Umgebung lokal bereitstellen, aktualisieren und warten. Im Vergleich zum UiPath Cloud-Server können Sie auch beim Aktualisieren des KI-Modells Probleme mit der Abwärtskompatibilität haben. Weitere Informationen zur Vermeidung dieser Art von Problemen finden Sie unter Widerstandsfähigkeit bei Modellaktualisierung.

Der lokale Server ist eine weitere Variante, für die Sie sich entscheiden können. Sie wird auf der lokalen CPU ausgeführt und ist die portabelste Version. Er ist jedoch langsamer und hat eine etwas geringere Erkennungsgenauigkeit.

Vorteile

Hier sind einige Funktionen von AI Computer Vision, von denen Sie profitieren können:

Automatisierung über Selektoren hinaus – Ermöglicht Robotern die Erkennung und Interaktion mit weiteren Feldern und Komponenten auf dem Bildschirm – sogar mit Flash, Silverlight, PDFs und Bildern.
Zuverlässig auf VDIs und Desktops – Behebt Probleme mit fehleranfälligen Bildautomatisierungstechniken und mit selektorbasiertem Targeting auf Desktops. Fangen Sie damit an, dass Sie Automatisierungen in Citrix, VMware oder Microsoft-Remotedesktop erstellen.
Große Auswahl an Schnittstellentypen – Enthält VDI-Umgebungen (Citrix, VMWare, Microsoft RDP, VNC und andere) für Desktop- und Webanwendungen. Sparen Sie Zeit, indem Sie UI-Elemente identifizieren und zum Object-Repository hinzufügen lassen.
Intelligente, intuitive Funktionen – Bietet Details, Validierungen und Benachrichtigungen zu Auswahlen auf dem Bildschirm über einen Bildschirmassistenten. Verwendet den Recorder, um auf einfache Weise vollständige Vision-basierte Automatisierungen zu generieren.
Unterstützung des automatischen Bildlaufs zur Laufzeit – Bildlaufinhalte in Webseiten oder Apps mithilfe von AI Computer Vision-Aktivitäten können Sie ganz einfach automatisieren.
Plattformübergreifende Funktionen – Automatisierung für Windows, Linux, Android und andere Betriebssysteme über Remote-Desktops.
Automatisierung zwischen VDI und Nicht-VDI – Vereinfacht die VDI-zu-Desktop-Automatisierung durch Reduzierung der erforderlichen Änderungen.
Mehrere Bereitstellungsoptionen – Wird über SaaS bereitgestellt; lokal für Linux und Windows oder direkt von Ihrem Desktop aus verfügbar.
Dynamische UI-Elemente – Ermöglicht Automatisierungen, die Tabellen, Dropdownlisten und Checkbox-Elemente enthalten. Dadurch wird die Widerstandsfähigkeit Ihrer Automatisierungen erhöht, sodass sie sich an kleine Änderungen an der Benutzeroberfläche anpassen und mit diesen dynamischen Elementen interagieren können.
Verfügbar in der UI-Automatisierung als Teil des einheitlichen Ziels – Reduziert die Komplexität beim Erstellen von UI-basierten Automatisierungen, wenn Sie sowohl Selektoren als auch AI Computer Vision-Deskriptoren benötigen.

Bereitstellungsoptionen

Einen Parallelvergleich unserer vorhandenen AI Computer Vision-Bereitstellungsoptionen finden Sie im Abschnitt AI Computer Vision-Unterschiede in der Übersicht.

Auf dieser Seite