- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Zahlungsbelege – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Unterstützte Sprachen
- Deep Learning
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)

Document Understanding user guide
Übersicht zur Dokumentklassifizierung
Was ist Dokumentklassifizierung
Document Classification is a component in the Document UnderstandingTM Framework that helps in identifying what types of files the robot is processing.
Eine Datei kann abhängig vom Inhalt und den verwendeten Klassifizierungsmethoden in einen oder mehrere Dokumenttypen klassifiziert werden:
- Wenn eine Datei einen einzigen logischen Dokumenttyp enthält (z. B. eine Rechnung oder eine vollständige Gesundheitsakte ist), sollte die Klassifizierungskomponente entsprechend konfiguriert werden und ein einziges Klassifizierungsergebnis zurückgeben;
- Wenn eine Datei mehrere logische Dokumenttypen enthält (z. B. eine Rechnung von Seite 1 bis Seite 5, eine Gesundheitsakte für die nächsten 10 Seiten und einen Versicherungsvertrag von Seite 16 bis zum Ende), sollte die Klassifizierungskomponente mehrere Klassifizierungsergebnisse zurückgeben, die jeweils dem richtigen Seitenbereich der Eingabedatei entsprechen.
Dokumenttypen, für welche die Klassifizierung versucht wird, sind die in der Taxonomie des Projekts definierten.
Wann sollte Dokumentklassifizierung verwendet werden
Wenn ein Projekt Dateien verarbeiten muss, die alle den gleichen Dokumenttyp aufweisen und immer als eine einzige Instanz pro Datei vorhanden sind (z. B. eine einzige Rechnung in einer einzigen Datei), dann ist eine Klassifizierung nicht erforderlich und kann vollständig übersprungen werden.
Doch wenn das Projekt zwei oder mehr Dokumenttypen behandelt (z. B. wenn der Workflow Rechnungen und Gesundheitsakten verarbeiten muss, die vor der Verarbeitung nicht unterschieden werden können) oder Dateien manchmal zwei oder mehr unterschiedliche Dokumenttypen enthalten können (z. B. wenn eine einzige Datei 3 Rechnungen enthält), dann wird eine Klassifizierung dringend empfohlen.
Wie die Komponente zur Dokumentklassifizierung verwendet wird
Classification is done through the Classify Document Scope activity. To classify the documents, you can use one or more classifiers, as the scope activity has the role of configuring and executing one or more algorithms for document classification and of offering an easy, unitary configuration option for all your needs.
Grundlegende Aktionen von Classify Document Scope:
- Stellt allen Klassifizierern (Klassifizierungsalgorithmen) die erforderlichen Konfigurationen zur Ausführung bereit.
- Akzeptiert einen oder mehrere Klassifizierer.
- Ermöglicht die Dokumenttypfilterung, Taxonomiezuordnung und Mindestkonfidenz-Schwellenwerteinstellungen auf Klassifiziererebene.
- Meldet Klassifizierungsinformationen auf einheitliche Weise, unabhängig von der Quelle der Klassifizierung.
The Classify Document Scope allows you to configure it by using the Configure Classifiers wizard. You can customize
- welche Dokumenttypen von welchem Klassifizierer akzeptiert werden,
- welcher Mindestkonfidenzschwellenwert bei einem bestimmten Ergebnis für den jeweiligen Klassifizierer akzeptabel ist,
- welche Taxonomiezuordnung auf Dokumenttypebene, zwischen der Projekttaxonomie und der internen Taxonomie des Klassifizierers (falls vorhanden) gilt.
Please note that the order of the classifiers in the Classify Document Scope is important:
- Klassifizierer werden mit einer Priorität von links nach rechts ausgeführt;
- Ein Klassifizierungsergebnis, das von einem Klassifizierer zurückgegeben wird, wird akzeptiert, wenn es einen der akzeptierten Dokumenttypen meldet und einen Konfidenzschwellenwert größer/gleich dem Mindestkonfidenzschwellenwert aufweist, der für den Klassifizierer festgelegt wurde;
- Ein Klassifizierer wird nur für die Seitenbereiche ausgeführt, die von den vorherigen Klassifizierern noch nicht klassifiziert worden sind (kann also bei einer Ausführung mehrmals aufgerufen werden).
Verfügbare Klassifizierer
Je nach den Anforderungen des Anwendungsfalls können Sie aus mehreren Klassifizierungsmethoden wählen, die als Klassifizierer bezeichnet werden.
Classifiers can be found in the UiPath.IntelligentOCR.Activities or UiPath.DocumentUnderstanding.ML.Activities packages.
Verfügbare Klassifizierer:
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Intelligenter Schlüsselwortklassifizierer
- Machine Learning Classifier
- Generativer Klassifizierer
Sie können jederzeit einen eigenen Klassifizierer erstellen, indem Sie die öffentlichen Document Processing Contracts verwenden und so jeden Algorithmus implementieren können, der zu Ihrem Anwendungsfall passt.