- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Zahlungsbelege – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- OCR-Dienste
- Unterstützte Sprachen
- Deep Learning
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)

Document Understanding user guide
OCR-Dienste
Über OCR-Dienste
OCR Engines werden für die folgenden Zwecke verwendet:
- At data labeling time, when importing documents into Document Manager. The engines available for this step are UiPath® Document OCR, Google Cloud Vision OCR, and Microsoft Read OCR.
- Zur Runtime, wenn Modelle aus RPA-Workflows aufgerufen werden. Für diesen Schritt sind alle Engines verfügbar, die in die Plattform UiPath RPA integriert sind, sowie Microsoft OCR (legacy), Microsoft Project Oxford OCR und Tesseract.
In production, we recommend calling the OCR using the Digitize Document activity in your workflow and passing the Document Object Model as input to the activity calling the ML model. For this purpose, you need to use the Machine Learning Extractor activity (Official feed).
Für Testzwecke lässt sich die OCR auch gut direkt im AI Center konfigurieren (Fenster Einstellungen), aber für Produktionsbereitstellungen wird dies nicht empfohlen.
Konfigurieren von OCR-Diensten in ML-Paketen für Document Understanding™ für Document Manager und AI Center
In folgender Tabelle wird beschrieben, wie die sechs unterstützten OCR-Enginetypen in Document Manager und in AI Center konfiguriert werden.
In AI Center entspricht das Argument ocr.method dem Dropdownmenü „OCR Engine“ in der Ansicht „Erstellen von ML-Paketen“.
| OCR-Modul | OCR-Methode | OCR-Schlüssel | OCR-URL |
|---|---|---|---|
| UiPath | UiPath Document OCR (Cloud and On-Premises) UiPathDocumentOCR_CPU(On-Premises) OCR for Chinese, Japanese, Korean (Cloud and On-Premises) | Automation Suite API Key* Enterprise Plan | Die URL der ML-Fähigkeit, die nach der Bereitstellung von UiPath Document OCR generiert wird. |
| Google Cloud Vision OCR | API-Schlüssel der GCP-Konsole | https://vision.googleapis.com/v1/images:annotate | |
| Microsoft Read 2.0 On-Prem | Microsoft Read OCR | Keine | http://<IP_addr>:<port_number>/vision/v2.0/read/core/Analyze |
| Microsoft Read 2.0 Azure | Microsoft Read OCR | API-Schlüssel für Ihre Ressource im Azure Portal | <Azure_resource_Endpoint>/vision/v2.0/read/core/asyncBatchAnalyze |
| Microsoft Read 3.2 On-Prem | Microsoft Read OCR | Keine | http://<IP_addr>:<port_number>/vision/v3.2/read/analyze |
| Microsoft Read 3.2 Azure | Microsoft Read OCR | API-Schlüssel für Ihre Ressource im Azure Portal | <Azure_resource_Endpoint>/vision/v3.2/read/analyze |
*If you consume services or endpoints from an Automation CloudTM environment (for example, du.uipath.com/ocr or du.uipath.com/ie/invoices) while you are using a deployment type other than Automation Cloud, such as Automation Suite offline, you need to add the API key from an Automation Cloud account. Make sure that you use the Automation Cloud API Key for public endpoints, and the Automation Suite API Key for endpoints hosted within Automation Suite.