- Überblick
- Erste Schritte
- Aktivitäten
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
- Insights-Dashboards
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Digitalisierung – Übersicht
- Digitalisierung – verwandte Aktivitäten
- OCR-Engines
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Passports – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Einschränkungen für den Datenverkehr
- OCR-Konfiguration
- Pipelines
- OCR-Dienste
- Unterstützte Sprachen
- Deep Learning
- Lizenzierung
Digitalisierung – Übersicht
Digitalisierung ist der Prozess zum Erhalt von maschinenlesbarem Text aus einer bestimmten eingehenden Datei, sodass ein Roboter dann seinen Inhalt verstehen und darauf reagieren kann. Das ist der erste Schritt, der auf Dateien angewendet wird, die über das Document UnderstandingTM- Framework verarbeitet werden müssen.
Der Digitalisierungsschritt hat zwei Ausgaben:
- Den Text von der verarbeiteten Datei, der in einer String-Variablen gespeichert wird und
- Das Dokumentobjektmodell dieser Datei – JSON-Objekt, das grundlegende Informationen wie Name, Inhaltstyp, Textlänge, Anzahl der Seiten sowie detaillierte Informationen wie Seitenrotation, erkannte Sprache, Inhalt und Koordinaten für jedes in der Datei identifizierte Wort enthält.
Im Document Processing-Framework wird die Digitalisierung mit der Aktivität Digitize Document durchgeführt.
Der Digitalisierungsschritt hängt damit zusammen, ist aber keine OCR.
In vielen Fällen handelt es sich bei den Dateien, die verarbeitet werden müssen, um native PDF-Dateien (nicht gescannt), die vom Roboter programmgesteuert ohne OCR gelesen werden können.
Die Aktivität Digitize Document erfordert als Teil ihrer Konfiguration die Auswahl eines OCR-Moduls – damit es bei Bedarf verwendet werden kann, aber OCR nur ausführt bei:
- Dateien, die Bilder sind
- unterstützte Bildformate sind .png, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp
- bei mehrseitigen TIFF-Dateien wird OCR für jede Seite angewendet
- PDF-Seiten, die
- keine maschinenlesbaren Inhalte verfügbar machen
- Bilder enthalten, die einen erheblichen Bereich der Seite abdecken.
- Die Dateigröße ist auf 160 MB begrenzt.
- Es gibt einen Grenzwert von maximal 500 Seiten pro Dokument.
OCR wird auch immer dann angewendet, wenn die Aktivität Digitize Document so konfiguriert ist, dass die ForceApplyOCR-Flag auf True gesetzt ist. Diese Option wird normalerweise für Anwendungsfälle empfohlen, in denen ein signifikanter Prozentsatz von Dateien nativen Inhalt zu enthalten scheint, aber der nativ gelesene Inhalt nicht dem entspricht, was ein Benutzer in diesen Dateien sehen kann.
Da jeder Anwendungsfall seine eigenen Besonderheiten hat, wird dringend empfohlen, alle verfügbaren OCR-Module mit unterschiedlichen Einstellungen zu testen, um festzustellen, welche für Ihr Projekt am besten funktioniert. Eine weitere Empfehlung ist, besonders auf die OCR-Modul-Argumente zu achten, wie Profil, Skalierung, Sprache usw. (kann von Modul zu Modul variieren), damit Sie die besten Einstellungen für jeden Anwendungsfall erkennen.