- Überblick
- Erste Schritte
- Aktivitäten
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
- Insights-Dashboards
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenextraktionsvalidierung – Übersicht
- Datenextraktionsvalidierung – verwandte Aktivitäten
- Validierungsstation
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Passports – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Einschränkungen für den Datenverkehr
- OCR-Konfiguration
- Pipelines
- OCR-Dienste
- Unterstützte Sprachen
- Deep Learning
- Lizenzierung
Document Understanding-Benutzerhandbuch.
Datenextraktionsvalidierung – Übersicht
Nach der automatischen Datenextraktion ist ein optionaler (aber dringend empfohlener) Schritt die Validierung der extrahierten Daten.
Dies bezieht sich auf einen Schritt der menschlichen Überprüfung, bei der zuständige Mitarbeiter die automatisch extrahierten Ergebnisse überprüfen und ggf. korrigieren können.
Die Verwendung der Datenextraktionsvalidierung stellt sicher, dass die jetzt verfügbaren strukturierten Daten zu 100 % korrekt sind.
Es wird dringend empfohlen, die Komponenten zur Datenextraktionsvalidierung zu verwenden, wenn:
- 100%ige Genauigkeit der Daten erforderlich ist,
-
Sie keine andere Möglichkeit haben, die automatisch extrahierten Informationen aus anderen Quellen zu überprüfen
- Zum Beispiel können Sie einen bestimmten Namen oder eine Adresse überprüfen, die mit einem bereits bestätigten Namen oder einer bereits bestätigten Adresse identisch ist und in einer Datenbank vorhanden ist usw.
-
Sie keine ausreichenden synthetischen Prüfungen haben, die Sie für die Datenkonsistenz verwenden können
-
Zum Beispiel können Sie überprüfen, ob Zeilenelemente einen bestimmten Gesamtwert ergeben, ob die Prüfsumme einer ID-Nummer korrekt ist usw.
Hinweis:Wir empfehlen, nach Möglichkeit den Validierungsschritt hinzuzufügen, wenn Sie eine 100%ige Genauigkeit benötigen.
Wenn das keine Option für alle Dokumente ist, dann:
- Versuchen Sie, so viele Informationen wie möglich zu überprüfen
- Versuchen Sie, sich für bestimmte Konfidenzschwellenwerte zu entscheiden, die beim Geschäftsanwendungsfall für bestimmte Felder akzeptabel sind
- Überprüfen Sie immer die Extraktionskonfidenz sowie die OCR-Konfidenz für einen bestimmten Wert, bevor Sie Ihre Entscheidung treffen.
-
Die Validierung der automatisch extrahierten Daten kann durch eine menschliche Eingabe über die Validation Station erfolgen.
Die Validation Station ist auf zwei Wegen verfügbar:
- Als Attended-Aktivität durch die Verwendung der Aktivität Present Validation Station oder
- Als Action Center-Aufgaben durch die Verwendung der Aktivitäten Create Document Validation Action und Wait for Document Validation Action and Resume.