- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenextraktionsvalidierung – Übersicht
- Datenextraktionsvalidierung – verwandte Aktivitäten
- Validierungsstation
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Zahlungsbelege – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Unterstützte Sprachen
- Deep Learning
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)

Document Understanding user guide
Datenextraktionsvalidierung – Übersicht
Was ist Datenextraktionsvalidierung
Nach der automatischen Datenextraktion ist ein optionaler (aber dringend empfohlener) Schritt die Validierung der extrahierten Daten.
Dies bezieht sich auf einen Schritt der menschlichen Überprüfung, bei der zuständige Mitarbeiter die automatisch extrahierten Ergebnisse überprüfen und ggf. korrigieren können.
Die Verwendung der Datenextraktionsvalidierung stellt sicher, dass die jetzt verfügbaren strukturierten Daten zu 100 % korrekt sind.
Wann sollte Datenextraktionsvalidierung verwendet werden
Es wird dringend empfohlen, die Komponenten zur Datenextraktionsvalidierung zu verwenden, wenn:
- 100%ige Genauigkeit der Daten erforderlich ist,
- Sie keine andere Möglichkeit haben, die automatisch extrahierten Informationen aus anderen Quellen zu überprüfen
- Zum Beispiel können Sie einen bestimmten Namen oder eine Adresse überprüfen, die mit einem bereits bestätigten Namen oder einer bereits bestätigten Adresse identisch ist und in einer Datenbank vorhanden ist usw.
- Sie keine ausreichenden synthetischen Prüfungen haben, die Sie für die Datenkonsistenz verwenden können
-
Zum Beispiel können Sie überprüfen, ob Zeilenelemente einen bestimmten Gesamtwert ergeben, ob die Prüfsumme einer ID-Nummer korrekt ist usw.
Hinweis:Wir empfehlen, nach Möglichkeit den Validierungsschritt hinzuzufügen, wenn Sie eine 100%ige Genauigkeit benötigen.
Wenn das keine Option für alle Dokumente ist, dann:
- Versuchen Sie, so viele Informationen wie möglich zu überprüfen
- Versuchen Sie, sich für bestimmte Konfidenzschwellenwerte zu entscheiden, die beim Geschäftsanwendungsfall für bestimmte Felder akzeptabel sind
- Überprüfen Sie immer die Extraktionskonfidenz sowie die OCR-Konfidenz für einen bestimmten Wert, bevor Sie Ihre Entscheidung treffen.
-
Wie die Komponenten zur Datenextraktionsvalidierung verwendet werden
Validating the automatically extracted data can be done by a human input through the use of Validation Station.
Die Validation Station ist auf zwei Wegen verfügbar:
- as an attended activity, through the use of the Present Validation Station activity, or
- as Action Center tasks, through the use of the Create Document Validation Action and Wait for Document Validation Action and Resume activities.