Abonnieren

UiPath Document Understanding

UiPath Document Understanding

OCR-Dienste

Über OCR-Dienste

OCR Engines werden für die folgenden Zwecke verwendet:

  • Zum Zeitpunkt der Datenbeschriftung beim Importieren von Dokumenten in den Document Manager. Die für diesen Schritt verfügbaren Module sind UiPath Document OCR, Google Cloud Vision OCR und Microsoft Read OCR.
  • Zur Laufzeit beim Aufrufen von Modellen aus RPA-Workflows. Die für diesen Schritt verfügbaren Engines sind alle in die UiPath-RPA-Plattform integrierte Engines, einschließlich der oben genannten, sowie Abbyy Finereader, Microsoft OCR (Legacy), Microsoft Project Oxford OCR und Tesseract.

In production, we recommend calling the OCR using the Digitize Document activity in your workflow and passing the Document Object Model as input to the activity calling the ML model. For this purpose, you need to use the Machine Learning Extractor activity (Official feed).

Für Testzwecke lässt sich die OCR auch gut direkt im AI Center konfigurieren (Fenster Einstellungen), aber für Produktionsbereitstellungen wird dies nicht empfohlen.

Konfigurieren von OCR-Diensten in ML-Paketen für Document Understanding für Document Manager und AI Center

Die folgende Tabelle zeigt, wie die 6 unterstützten OCR-Modul-Typen im Document Manager und AI Center konfiguriert werden.

🚧

Warning

In AI Center entspricht das Argument ocr.method dem Dropdownmenü „OCR Engine“ in der Ansicht „Erstellen von ML-Paketen“.

OCR Engine

OCR Method

OCR Key

OCR URL

UiPath

UiPath Document OCR

UiPath Automation Cloud
Document Understanding API Key
Enterprise Plan

http://<IP_addr>:<port_number>

Google

Google Cloud Vision OCR

GCP Console API Key

https://vision.googleapis.com/v1/images:annotate

Microsoft Read 2.0 On-Prem

Microsoft Read OCR

None

http://<IP_addr>:<port_number>/vision/v2.0/read/core/Analyze

Microsoft Read 2.0 Azure

Microsoft Read OCR

API Key for your resource from Azure Portal

<Azure_resource_Endpoint>/vision/v2.0/read/core/asyncBatchAnalyze

Microsoft Read 3.2 On-Prem

Microsoft Read OCR

None

http://<IP_addr>:<port_number>/vision/v3.2/read/analyze

Microsoft Read 3.2 Azure

Microsoft Read OCR

API Key for your resource from Azure Portal

<Azure_resource_Endpoint>/vision/v3.2/read/analyze

Aktualisiert vor 3 Monaten


OCR-Dienste


Auf API-Referenzseiten sind Änderungsvorschläge beschränkt

Sie können nur Änderungen an dem Textkörperinhalt von Markdown, aber nicht an der API-Spezifikation vorschlagen.