- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Dokumentklassifizierungstraining – Übersicht
- „Klassifizierer konfigurieren“-Assistent von Train Classifiers Scope
- Machine Learning Classifier Trainer
- Dokumentklassifizierungstraining – verwandte Aktivitäten
- ML-Pakete
- Pipelines
- Data Manager
- OCR-Dienste
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Referenzen
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Dokumentklassifizierungstraining – Übersicht
Dokumentklassifizierungstraining ist eine Komponente im Document Understanding-Framework, die beim Schließen der Feedback-Schleife für Klassifizierer hilft, die von menschlichem Feedback lernen können.
Sie können Document Understanding-Prozesse erstellen, die keine Trainingskomponente enthalten. Dies kann verschiedene Gründe haben, beispielsweise:
- Ihre verwendenden Klassifizierer unterstützen kein erneutes Training.
- Sie möchten kein erneutes Training durchführen, da der Prozess immer das gleiche Training verwenden soll.
- Sie möchten das Klassifizierertraining offline aktualisieren und Sie verwalten seine Aktualisierungen außerhalb Ihres DU-Prozesses.
Das Training Ihrer Klassifizierer im Rahmen der normalen Prozessnutzung ist jedoch in den meisten Fällen von großem Nutzen, da die Klassifizierer ihre eigenen Trainingsdaten sammeln und ihre eigenen Aktualisierungen durchführen können, indem sie die Informationen der menschlichen Validierung erfassen, ohne dass Sie Ihre bereits vorhandenen Workflows in irgendeiner Weise aktualisieren müssen. Sie werden sozusagen selbstlernende Algorithmen, die es sich selbst beibringen können, in Zukunft besser zu agieren, indem sie die Daten nutzen, die Menschen als richtig validiert haben.
Das Klassifizierungstraining erfolgt über die Aktivität Train Classifiers Scope. Sie können einen oder mehrere Klassifizierer trainieren, da die Scope-Aktivität die Aufgabe des Konfigurierens und Ausführens eines oder mehrerer Algorithmen für das Klassifizierungstraining in einem Zug hat.
Das Klassifizierungstraining wird in der Regel nach der Validierung der Dokumentklassifizierung ausgeführt: Nur von Menschen bestätigtes Feedback sollte für das Training an die Klassifizierer zurückgeschickt werden, um die Genauigkeit der Trainingsdaten des Algorithmus zu gewährleisten.
Ausgeführt werden sollte das Klassifizierungstraining sowohl im Falle einer fehlgeschlagenen Klassifizierung (keine automatische Klassifizierung oder eine automatische Klassifizierung, die vom zuständigen Mitarbeiter korrigiert wurde) als auch im Falle einer erfolgreichen (keine Korrekturen durch den Benutzer in der Validierungsstufe, alle automatischen Ergebnisse bestätigt). Der Grund dafür ist, dass die Algorithmen aus beiden Fällen lernen können.
Sie können Klassifizierer trainieren, die in der Dokumentklassifizierungsphase verwendet wurden, sowie Klassifizierer, die nicht für die Klassifizierungsvorhersage verwendet wurden. Der letztere Ansatz wird verwendet, um Trainingsdaten zu sammeln und einen Klassifizierer von Grund auf zu trainieren, damit er später eingesetzt werden kann, indem er zu Document Understanding-Workflows hinzugefügt wird.
Das sind die grundlegenden Aufgaben von Train Classifiers Scope:
- Liefert allen Klassifizierertrainern (Trainingsalgorithmen) die erforderlichen Konfigurationen zur Ausführung.
- Akzeptiert einen oder mehrere Klassifizierertrainer.
- Ermöglicht die Dokumenttypfilterung und die Taxonomiezuordnung zwischen der Projekttaxonomie und allen internen Klassifizierertaxonomien.
Train Classifiers Scope ermöglicht das Konfigurieren über den Assistenten Klassifizierer konfigurieren. Sie können anpassen,
- welche Dokumenttypen zum Training an welchen Klassifizierertrainer gesendet werden,
- welche Taxonomiezuordnung auf Dokumenttypebene, zwischen der Projekttaxonomie und der internen Taxonomie des Klassifizierers (falls vorhanden) gilt.
Klassifizierer und ihre jeweiligen Traineraktivitäten finden Sie in den UiPath.IntelligentOCR.Activities-Paketen.
Verfügbare Klassifizierertrainer:
- Keyword Based Classifier Trainer, Traineraktivität für den Keyword Based Classifier
- Intelligent Keyword Classifier Trainer, Traineraktivität für den Intelligent Keyword Classifier