Aktivitäten
Neuestes
False
Bannerhintergrundbild
UIAutomation-Aktivitäten
Letzte Aktualisierung 26. Apr. 2024

Google Cloud Vision OCR

UiPath.Core.Activities.GoogleCloudOCR

Extrahiert mit dem Google Cloud OCR-Modul einen String und seine Informationen aus einem angegebenen UI-Element oder Bild. Kann mit anderen OCR-Aktivitäten verwendet werden, z. B. Click OCR Text, Double Click OCR Text, Hover OCR Text, Get OCR Textund Find OCR Text Position.

Eigenschaften

Allgemein
  • AnzeigeName (DisplayName) - Der Anzeigename der Aktivität.
Eingabe
  • Bild (Image) - Das Bild, das Sie verarbeiten möchten. Das Feld unterstützt nur Variablen vom Typ Image.
Anmeldung (Logon)
  • ApiSchlüssel (ApiKey) - Der API-Schlüssel zum Zugriff auf die Google Cloud OCR.
Sonstiges
  • Privat (Private) - Bei Auswahl werden die Werte von Variablen und Argumenten nicht mehr auf der Stufe Verbose protokolliert.
Optionen
  • Erkennungsmodus – Gibt an, welche Erkennungsmarkierung an Google Cloud Vision OCR gesendet werden soll. Wählen Sie eine von zwei Optionen aus: TextDetection, DocumentTextDetection. Der Standardwert ist TextDetection.

    Wichtig: Der TextDetection- Modus meldet keine Konfidenzwerte für die identifizierten Wörter. Wenn das OCR-Modul in der Aktivität Digitize Document verwendet wird, werden alle OCR-Konfidenzwerte für alle Wörter auf -1 (Unbekannt) festgelegt.
  • WörterExtrahieren (ExtractWords) - Wenn dieses Auswahlfeld ausgewählt ist, wird die Position jedes gefundenen Worts auf dem Bildschirm extrahiert.
  • Sprache - Die vom OCR-Modul zum Extrahieren des Texts aus dem UI-Element oder Bild verwendete Sprache. Für die Google OCR-Engine muss dieses Feld das Präfix der Sprachdatei enthalten, z. B. „ron“ für Rumänisch, „ita“ für Italienisch und „fra“ für Französisch. Die unterstützten Sprachpräfixe finden Sie auf dieser Seite.
  • Größe auf max. Grenze ändern, falls erforderlich (ResizeToMaxLimitIfNecessary) - Wenn ausgewählt, versucht die Engine die Größe der Zielbildes zu verkleinern, sodass die Größengrenze der Google Cloud Vision Engine nicht überschritten wird. Standardmäßig ist dieses Kontrollfeld nicht markiert.
  • Skalierung (Scale) - Der Skalierungsfaktor des ausgewählten UI-Elements oder Bilds. Je größer die Zahl, desto höher die Vergrößerung des Bilds. So kann das OCR-Lesen besser funktionieren, und wir empfehlen dieses Vorgehen bei kleinen Bildern. Zum Verkleinern sind auch Werte zwischen 0 und 1 möglich. Standardmäßig ist der Wert auf 2 gesetzt.

    Wichtig: Große Bilder können zu einem Fehler führen, wenn der Skalierungsfaktor größer als 1 ist.
Ausgabe
  • Text - Der extrahierte Text. Dieses Feld unterstützt nur string-Variablen.
  • Ergebnis – Die extrahierten Wörter zusammen mit ihrer Position auf dem Bildschirm. Dieses Feld unterstützt nur KeyValuePair<rectangle,string> Variablen.
  • Eigenschaften

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
UiPath Logo weiß
Vertrauen und Sicherheit
© 2005-2024 UiPath. All rights reserved.