document-understanding
2022.4
true
UiPath logo, featuring letters U and I in white
Document Understanding-Benutzerhandbuch.
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 24. Okt. 2024

OCR-Dienste

Über OCR-Dienste

OCR Engines werden für die folgenden Zwecke verwendet:

  • Zum Zeitpunkt der Datenbeschriftung beim Importieren von Dokumenten in den Document Manager. Die für diesen Schritt verfügbaren Module sind UiPath Document OCR, Google Cloud Vision OCR und Microsoft Read OCR.
  • Zur Laufzeit beim Aufrufen von Modellen aus RPA-Workflows. Die für diesen Schritt verfügbaren Engines sind alle in die UiPath-RPA-Plattform integrierte Engines, einschließlich der oben genannten, sowie Abbyy Finereader, Microsoft OCR (Legacy), Microsoft Project Oxford OCR und Tesseract.

In der Produktion empfehlen wir, die OCR mit der Aktivität Digitize Document in Ihrem Workflow aufzurufen und das Dokumentobjektmodell als Eingabe an die Aktivität zu übergeben, die das ML-Modell aufruft. Dazu müssen Sie die Aktivität Machine Learning Extractor (Offizieller Feed) verwenden.

Für Testzwecke lässt sich die OCR auch gut direkt im AI Center konfigurieren (Fenster Einstellungen), aber für Produktionsbereitstellungen wird dies nicht empfohlen.

Konfigurieren von OCR-Diensten in ML-Paketen für Document Understanding für Document Manager und AI Center

Die folgende Tabelle zeigt, wie die 6 unterstützten OCR-Modul-Typen im Document Manager und AI Center konfiguriert werden.

Wichtig: Im AI Center entspricht das ocr.method-Argument dem Dropdownmenü „OCR-Modul“ in der Ansicht zur ML-Paketerstellung.

OCR-Modul

OCR-Methode

OCR-Schlüssel

OCR-URL

UiPath

UiPath Document OCR

UiPath Automation Cloud

API-Schlüssel „Document Understanding“

Enterprise-Plan

http://<IP_addr>:<port_number>

Google

Google Cloud Vision OCR

API-Schlüssel der GCP-Konsole

https://vision.googleapis.com/v1/images:annotate

Microsoft Read 2.0 On-Prem

Microsoft Read OCR

Keine

http://<IP_addr>:<port_number>/vision/v2.0/read/core/Analyze

Microsoft Read 2.0 Azure

Microsoft Read OCR

API-Schlüssel für Ihre Ressource im Azure Portal

<Azure_resource_Endpoint>/vision/v2.0/read/core/asyncBatchAnalyze

Microsoft Read 3.2 On-Prem

Microsoft Read OCR

Keine

http://<IP_addr>:<port_number>/vision/v3.2/read/analyze

Microsoft Read 3.2 Azure

Microsoft Read OCR

API-Schlüssel für Ihre Ressource im Azure Portal

<Azure_resource_Endpoint>/vision/v3.2/read/analyze

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten