- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- ML-Pakete
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Deep Learning
- Lizenzierung
- Referenzen
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Document Understanding-Benutzerhandbuch.
Feinabstimmung
In AI Center lassen sich ML-Modelle auch mithilfe von Daten anpassen, die von einem Menschen mithilfe der Validation Station überprüft wurden.
Da Ihr RPA-Workflow Dokumente mit einem vorhandenen ML-Modell verarbeitet, können einige Dokumente eine menschliche Überprüfung mithilfe der Aktivität [Present Validation Station] (https://docs.uipath.com/de/activities/docs/present-validation-station) erfordern. Diese ist für Attended-Roboter oder im Browser mithilfe von Orchestrator Action Center verfügbar.
Die in der Validation Station generierten validierten Daten können mit der Aktivität Machine Learning Extractor Trainer exportiert und zur Feinabstimmung von ML-Modellen im AI Center verwendet werden.
Es wird nicht empfohlen, ML-Modelle von Grund auf (d. h. das ML-Paket von DocumentUnderstanding) mit Daten aus der Validation Station zu trainieren, es sei denn vorhandene ML-Modelle (einschließlich out-of-the-box Modelle) sollen fein abgestimmt werden.
- Die detaillierten Schritte zur Feinabstimmung eines ML-Modells finden Sie im Abschnitt „Importieren von Dokumenten“ der Document Manager-Dokumentation.
-
Weitere Informationen zum Erstellen eines Datasets für die Feinabstimmung finden Sie hier.
Wichtig:Fügen Sie immer Validation Station-Daten zu demselben Dataset hinzu, und trainieren Sie mit ML-Paket-Nebenversion 0
Es wird oft fälschlicherweise angenommen, dass Daten aus der Validation Station dazu verwendet werden, die vorherige Modellversion iterativ erneut zu trainieren, d. h. anhand des aktuellen Batch wird Paket X.1 trainiert, um X.2 zu erhalten. Dann wird der nächste Batch mit X.2 trainiert, um X.3 zu erhalten und so weiter. Dies ist die falsche Art, das Produkt zu verwenden. Jeder Batch der Validation Station muss in dieselbe Document Manager-Sitzung importiert werden wie die ursprünglichen manuell beschrifteten Daten, was ein größeres Dataset ergibt, mit dem dann immer auf der ML-Paketversion X.0 trainiert werden muss.