studio
2024.10
true
Studio-Benutzerhandbuch
Last updated 30. Okt. 2024

Beispiel der Verwendung von Ausgabe- oder Screen-Sraping-Methoden

Um zu veranschaulichen, wie man die verschiedenen Screen-Scraping-Methoden und die praktischen Unterschiede zwischen ihnen verwendet, sollten wir zuerst ein Notepad-Fenster mit etwas Text extrahieren und uns die Ergebnisse ansehen. Wir haben den folgenden Screenshot verwendet.



Die FullText-Methode



Wie Sie sehen, wird keine Formatierung beibehalten, aber wenn Sie das Notepad-Fenster während des Scraping ausblenden, wird der Text trotzdem abgerufen. Dies ist die schnellste Methode.

Die Native-Methode





Wie Sie im ersten Screenshot sehen, können Sie Text mit seiner Position am Bildschirm extrahieren und ebenso die exakte Position jedes Wortes (zweiter Screenshot) abrufen.

Die Microsoft OCR-Methode



Wie Sie sehen können, ist die Genauigkeit dieser Ausgabemethode nicht 100%ig, aber es gelingt trotzdem, die Position des Textes beizubehalten. Es ist auch noch möglich, die genaue Position auf dem Bildschirm in Pixeln zu erhalten. Wie Sie sehen, ist dies nicht die schnellste Ausgabemethode.

Die Google OCR-Methode



Wie bei den Microsoft-Modi ist die Google OCR-Methode nicht zu 100 % genau und dauert im Vergleich zu den anderen länger. Sie ruft jedoch die Position des Texts innerhalb des Fensters ab.

Fügen Sie nun beispielsweisen in Paint weißen Text auf einer schwarzen Seite hinzu und versuchen Sie, diesen zu extrahieren.



Wie Sie sehen können, funktionieren in diesem Szenario nur die OCR-Methoden.



Versuchen wir nun, eine Anwendung zu extrahieren und die Ergebnisse anzuzeigen. Wir verwenden eine Dummy-Ausgaben-App, die Sie hier herunterladen können.



Wenn wird das gesamte Fenster extrahieren, erhalten wir die folgenden Ergebnisse:

  1. FullText funktioniert mit ausgeblendetem Text sehr gut, da sogar die Schaltflächen zum Minimieren und Wiederherstellen erkannt wird.



  2. Nativ funktioniert auf dieser UI nicht, da die grafische Geräteschnittstelle zum Rendern von Text nicht verwendet wird. Weitere Informationen zu GDI finden Sie in der offiziellen Microsoft-Dokumentation.
  3. Microsoft OCR (Microsoft OCR) arbeitet sehr gut, obwohl noch keine 100%ige Genauigkeit erreich ist.



  4. Google OCR (Google OCR) kann diese UI nicht sehr gut bearbeiten, da der extrahierte Bereich sehr groß ist.



War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten