activities

latest

false

Wichtig :

Bitte beachten Sie, dass dieser Inhalt teilweise mithilfe von maschineller Übersetzung lokalisiert wurde. Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

UIAutomation-Aktivitäten

Letzte Aktualisierung 19. Feb. 2025

Tesseract OCR

UiPath.Core.Activities.GoogleOCR

Extrahiert mit dem Tesseract OCR-Modul einen String und dessen Informationen aus einem angegebenen UI-Element oder Bild. Kann mit anderen Aktivitäten des OCR verwendet werden, wie Click OCR Text, Hover OCR Text, Double Click OCR Text, Get OCR Text und Find OCR Text Position.

Hinweis: Das in UiPath verwendete Tesseract OCR-Modul wird auf Version 4.0 aktualisiert. Weitere Informationen zu den Funktionen dieses Moduls finden Sie hier.

Hinweis: Diese Aktivität unterstützt keine gedrehten Dokumente und daher sind die Ergebnisse für solche Dokumente nicht vorhersehbar.

Voraussetzungen

Bevor Sie die Tesseract OCR-Engine ausführen, installieren Sie Visual C++ Redistributable x86 (32-Bit) auf der entsprechenden Maschine. Auch wenn Ihr Betriebssystem 64-Bit (x64) verwendet, müssen Sie die x86-Version (32-Bit) installieren. Besuchen Sie Visual C++ Redistributable – aktuelle unterstützte Downloads, um die richtige Version von Visual C++ für Ihre Anforderungen auszuwählen und zu installieren.

Eigenschaften

Optionen

ErlaubteZeichen (AllowedCharacters) - Der OCR-Engine extrahiert die hier angegebene Zeichenfolge.
AbgelehnteZeichen (DeniedCharacters) - Der OCR-Engine extrahiert eine angegebene Zeichenfolge, ohne dabei an die hier angegebenen Zeichen zu berücksichtigen.
Umkehren (Invert) - Wenn dieses Auswahlfeld ausgewählt ist, werden die Farben des angegebenen UI-Elements vor dem Extrahieren umgekehrt. Dieses Vorgehen ist sinnvoll, wenn der Hintergrund dunkler als die Textfarbe ist.
Sprache -Die vom OCR-Modul zum Extrahieren der Zeichenfolge aus dem UI-Element verwendete Sprache. Für die Google OCR-Engine muss dieses Feld das Präfix der Sprachdatei enthalten, z. B. „ron“ für Rumänisch, „ita“ für Italienisch und „fra“ für Französisch. Die unterstützten Sprachpräfixe finden Sie auf dieser Seite.

Hinweis: Der Sprachordner kann hier heruntergeladen und Ihrem lokalen Ordner %UserProfile%\.nuget\packages\uipath.vision\3.x.x\build\net461\tessdata hinzugefügt werden. Nachdem der Sprachordner lokal hinzugefügt wurde, stellen Sie sicher, dass Sie die UiPath Studio-Anwendung neu starten.
WörterExtrahieren (ExtractWords) - Wenn dieses Auswahlfeld ausgewählt ist, wird die Position jedes gefundenen Worts auf dem Bildschirm extrahiert.
Profil (Profile) - Wählen Sie ein Profil zur Vorverarbeitung eines angegebenen Bilds oder UI-Elements für ein besseres OCR-Ergebnis. Folgende Optionen sind verfügbar: Keine (None) - kein Profil zur Vorverarbeitung wird verwendet; Bildschirm (Screen) - passende Vorverarbeitung für Anwendungen auf einem Remote-Desktop; Scan - passende Vorverarbeitung für eingescannte Dateien; Altdaten (Legacy) - verwendet die Standardeinstellungen des Engine zur Vorverarbeitung von Bildern. Dies ist die Standardoption.
Skalierung (Scale) - Der Skalierungsfaktor des ausgewählten UI-Elements oder Bilds. Je größer die Zahl, desto höher die Vergrößerung des Bilds. So kann das OCR-Lesen besser funktionieren, und wir empfehlen dieses Vorgehen bei kleinen Bildern. Zum Verkleinern sind auch Werte zwischen 0 und 1 möglich. Standardmäßig ist der Wert auf 2 gesetzt.

Wichtig: Große Bilder können zu einem Fehler führen, wenn der Skalierungsfaktor größer als 1 ist.

Ausgabe

Text – Die extrahierte Zeichenfolge. Dieses Feld unterstützt nur string Variablen.
Ergebnis – Die extrahierten Wörter zusammen mit ihrer Position auf dem Bildschirm. Dieses Feld unterstützt nur KeyValuePair <rectangle,string> Variablen.