- Erste Schritte
- Framework-Komponenten
- Document Understanding im AI Center
- Pipelines
- ML-Pakete
- Data Manager
- OCR-Dienste
- Lizenzierung
- Referenzen
Konfigurieren von OCR
Um Dokumente in Data Manager zu importieren, müssen Sie einen OCR-Dienst konfigurieren. Das ist möglich über die Schaltfläche rechts oben auf dem Bildschirm: Einstellungen > OCR-Ansicht.
Zum Konfigurieren der OCR muss der OCR Dienst über eine URL verfügen. Hier sind die möglichen URLs, die Sie verwenden können:
- öffentliche URLs wie etwa https://du.uipath.com/ocr oder Drittanbieter-URLs von Google Vision OCR oder Microsoft Read OCR;
- URLs von UiPath Document OCR oder eigenständigen Omnipage OCR-Containern, die von UiPath vor Ort bereitgestellt werden;
- URLs vom OCR ML-Paket, die als ML-Fähigkeiten bereitgestellt wurden und im lokalen AI Center v2020.10 oder höher öffentlich gemacht wurde.
Wichtig:Wenn Sie OCR auf der gleichen Maschine wie Data Manager ausführen, verwenden Sie nicht
localhost
, um auf die lokale Maschine zu verweisen, sondern verwenden Sie die IP-Adresse oder den Domänennamen der lokalen Maschine.Verwenden Sie bei URLs von OCR, die als öffentliche ML-Fähigkeit im lokalen AI Center bereitgestellt wird, die URL, so wie sie in AI Center auf dem Bildschirm mit den Details zu den ML-Fähigkeiten angezeigt wird.
Die Auswahl der OCR-Engine, die zum Importieren von Dokumenten in Data Manager verwendet werden soll, ist eine kritische Entscheidung.
Es wird empfohlen, die gleiche OCR zum Importieren von Trainingsdaten (Trainingszeit) wie zum Bereitstellen des Modells zu verwenden (Ausführungszeit).
Idealerweise sollten Sie einige verschiedene ausprobieren, um zu sehen, welche am besten bei Ihren Dokumenten funktioniert, und erst dann eine Entscheidung treffen.
Die lokalen Optionen sind:
- UiPath OCR-Container, der die wichtigsten westeuropäischen Sprachen unterstützt;
- Omnipage OCR-Container (auch von UiPath verfügbar), der am besten bei sauber gescannten Dokumenten funktioniert und die beste Sprachabdeckung bietet;
- Microsoft Read-Container (verfügbar als Vorschau von Microsoft), auch mit einer guten Sprachabdeckung;
- UiPath OCR ML-Fähigkeiten, die im lokalen AI Center v2020.10 oder höher bereitgestellt werden.
Die cloudbasierten Optionen sind:
- UiPath Document OCR – https://du.uipath.com/ocr;
- Google Cloud OCR, mit der besten Sprachabdeckung;
- Microsoft Read Azure OCR.