OCR-Dienste

Über OCR-Dienste

OCR Engines werden für die folgenden Zwecke verwendet:

Zum Zeitpunkt der Datenbeschriftung beim Importieren von Dokumenten in den Document Manager. Die für diesen Schritt verfügbaren Module sind UiPath Document OCR, Google Cloud Vision OCR und Microsoft Read OCR.
Zur Laufzeit beim Aufrufen von Modellen aus RPA-Workflows. Die für diesen Schritt verfügbaren Engines sind alle in die UiPath-RPA-Plattform integrierte Engines, einschließlich der oben genannten, sowie Abbyy Finereader, Microsoft OCR (Legacy), Microsoft Project Oxford OCR und Tesseract.

In der Produktion empfehlen wir, die OCR mit der Aktivität Digitize Document in Ihrem Workflow aufzurufen und das Dokumentobjektmodell als Eingabe an die Aktivität zu übergeben, die das ML-Modell aufruft. Dazu müssen Sie die Aktivität Machine Learning Extractor (Offizieller Feed) verwenden.

Für Testzwecke lässt sich die OCR auch gut direkt im AI Center konfigurieren (Fenster Einstellungen), aber für Produktionsbereitstellungen wird dies nicht empfohlen.

Konfigurieren von OCR-Diensten in ML-Paketen für Document Understanding für Document Manager und AI Center

Die folgende Tabelle zeigt, wie die 6 unterstützten OCR-Modul-Typen im Document Manager und AI Center konfiguriert werden.

Wichtig: Im AI Center entspricht das ocr.method-Argument dem Dropdownmenü „OCR-Modul“ in der Ansicht zur ML-Paketerstellung.

OCR-Modul	OCR-Methode	OCR-Schlüssel	OCR-URL
UiPath	UiPath Document OCR (Cloud und lokal) UiPathDocumentOCR_CPU (lokal) OCR für Chinesisch, Japanisch, Koreanisch (Cloud und lokal)	UiPath Automation Cloud API-Schlüssel „Document Understanding“ Enterprise-Plan	`http://<IP_addr>:<port_number>`
Google	Google Cloud Vision OCR	API-Schlüssel der GCP-Konsole	`https://vision.googleapis.com/v1/images:annotate`
Microsoft Read 2.0 On-Prem	Microsoft Read OCR	Keine	`http://<IP_addr>:<port_number>/vision/v2.0/read/core/Analyze`
Microsoft Read 2.0 Azure	Microsoft Read OCR	API-Schlüssel für Ihre Ressource im Azure Portal	`<Azure_resource_Endpoint>/vision/v2.0/read/core/asyncBatchAnalyze`
Microsoft Read 3.2 On-Prem	Microsoft Read OCR	Keine	`http://<IP_addr>:<port_number>/vision/v3.2/read/analyze`
Microsoft Read 3.2 Azure	Microsoft Read OCR	API-Schlüssel für Ihre Ressource im Azure Portal	`<Azure_resource_Endpoint>/vision/v3.2/read/analyze`