- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Deep Learning
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Übersicht zur Dokumentklassifizierung
Document Classification is a component in the Document UnderstandingTM Framework that helps in identifying what types of files the robot is processing.
Eine Datei kann abhängig vom Inhalt und den verwendeten Klassifizierungsmethoden in einen oder mehrere Dokumenttypen klassifiziert werden:
- Wenn eine Datei einen einzigen logischen Dokumenttyp enthält (z. B. eine Rechnung oder eine vollständige Gesundheitsakte ist), sollte die Klassifizierungskomponente entsprechend konfiguriert werden und ein einziges Klassifizierungsergebnis zurückgeben;
- Wenn eine Datei mehrere logische Dokumenttypen enthält (z. B. eine Rechnung von Seite 1 bis Seite 5, eine Gesundheitsakte für die nächsten 10 Seiten und einen Versicherungsvertrag von Seite 16 bis zum Ende), sollte die Klassifizierungskomponente mehrere Klassifizierungsergebnisse zurückgeben, die jeweils dem richtigen Seitenbereich der Eingabedatei entsprechen.
Dokumenttypen, für welche die Klassifizierung versucht wird, sind die in der Taxonomie des Projekts definierten.
Wenn ein Projekt Dateien verarbeiten muss, die alle den gleichen Dokumenttyp aufweisen und immer als eine einzige Instanz pro Datei vorhanden sind (z. B. eine einzige Rechnung in einer einzigen Datei), dann ist eine Klassifizierung nicht erforderlich und kann vollständig übersprungen werden.
Doch wenn das Projekt zwei oder mehr Dokumenttypen behandelt (z. B. wenn der Workflow Rechnungen und Gesundheitsakten verarbeiten muss, die vor der Verarbeitung nicht unterschieden werden können) oder Dateien manchmal zwei oder mehr unterschiedliche Dokumenttypen enthalten können (z. B. wenn eine einzige Datei 3 Rechnungen enthält), dann wird eine Klassifizierung dringend empfohlen.
Die Klassifizierung erfolgt über die Aktivität Classify Document Scope. Um die Dokumente zu klassifizieren, können Sie einen oder mehrere Klassifizierer verwenden, da die Scope-Aktivität die Aufgabe hat, einen oder mehrere Algorithmen für die Dokumentklassifizierung zu konfigurieren und auszuführen und eine einfache, einheitliche Konfigurationsoption für alle Anforderungen zu bieten.
Grundlegende Aktionen von Classify Document Scope:
- Stellt allen Klassifizierern (Klassifizierungsalgorithmen) die erforderlichen Konfigurationen zur Ausführung bereit.
- Akzeptiert einen oder mehrere Klassifizierer.
- Ermöglicht die Dokumenttypfilterung, Taxonomiezuordnung und Mindestkonfidenz-Schwellenwerteinstellungen auf Klassifiziererebene.
- Meldet Klassifizierungsinformationen auf einheitliche Weise, unabhängig von der Quelle der Klassifizierung.
Classify Document Scope ermöglicht das Konfigurieren über den Assistenten Klassifizierer konfigurieren. Sie können anpassen,
- welche Dokumenttypen von welchem Klassifizierer akzeptiert werden,
- welcher Mindestkonfidenzschwellenwert bei einem bestimmten Ergebnis für den jeweiligen Klassifizierer akzeptabel ist,
- welche Taxonomiezuordnung auf Dokumenttypebene, zwischen der Projekttaxonomie und der internen Taxonomie des Klassifizierers (falls vorhanden) gilt.
Bitte beachten Sie, dass die Reihenfolge der Klassifizierer bei Classify Document Scope wichtig ist:
- Klassifizierer werden mit einer Priorität von links nach rechts ausgeführt;
- Ein Klassifizierungsergebnis, das von einem Klassifizierer zurückgegeben wird, wird akzeptiert, wenn es einen der akzeptierten Dokumenttypen meldet und einen Konfidenzschwellenwert größer/gleich dem Mindestkonfidenzschwellenwert aufweist, der für den Klassifizierer festgelegt wurde;
- Ein Klassifizierer wird nur für die Seitenbereiche ausgeführt, die von den vorherigen Klassifizierern noch nicht klassifiziert worden sind (kann also bei einer Ausführung mehrmals aufgerufen werden).
Je nach den Anforderungen des Anwendungsfalls können Sie aus mehreren Klassifizierungsmethoden wählen, die als Klassifizierer bezeichnet werden.
Klassifizierer finden Sie in den Paketen UiPath.IntelligentOCR.Activities oder UiPath.DocumentUnderstanding.ML.Activities.
Verfügbare Klassifizierer:
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Intelligenter Schlüsselwortklassifizierer
- Machine Learning Classifier
- Generativer Klassifizierer
Sie können jederzeit einen eigenen Klassifizierer erstellen, indem Sie die öffentlichen Document Processing Contracts verwenden und so jeden Algorithmus implementieren können, der zu Ihrem Anwendungsfall passt.