- Erste Schritte
- Framework-Komponenten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Intelligenter Schlüsselwortklassifizierer
- FlexiCapture Classifier
- Machine Learning Classifier
- Dokumentklassifizierung – verwandte Aktivitäten
- ML-Pakete
- Pipelines
- Data Manager
- OCR-Dienste
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Deep Learning
- Lizenzierung
- Referenzen
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Über Pipelines
Document Understanding-ML-Pakete können alle drei Pipelinetypen ausführen:
Nach Abschluss hat eine Pipelineausführung zugehörige Ausgaben und Protokolle. Um diese Informationen auf der Registerkarte Pipelines in der linken Seitenleiste anzuzeigen, klicken Sie auf eine Pipeline. Es öffnet sich die Pipelineansicht, die aus Folgendem besteht:
- Pipelinedetails wie Typ, Name und Version des ML-Pakets, Dataset, GPU-Nutzung, Parameter und Ausführungszeit
- Bereich Ausgaben; dieser enthält immer eine
_results.json
-Datei mit einer Zusammenfassung der Pipelinedetails - Seite Protokolle; die Protokolle können auch auf der Registerkarte ML-Protokolle in der linken Seitenleiste abgerufen werden
Trainingspipelines oder vollständige Pipelines können auch verwendet werden für:
- Feinabstimmung von ML-Modellen mit Daten aus der Validation Station
- Automatische Feinabstimmung eines ML-Modells
Training: Trainieren eines Modells von Grund auf, d. h. mit dem DocumentUnderstanding-ML-Paket im AI Center.
Erneutes Training: Training mit einem vorab trainierten Basismodell, d. h. mit einem der anderen ML-Pakete zur Dokumentextraktion im AI Center, z. B. Invoices, Receipts, Purchase Orders usw.
Automatisches erneutes Training: Dies ist der Name einer Umgebungsvariablen, die beim Erstellen einer Pipeline im AI Center festgelegt werden kann. Sie ermöglicht es der Pipeline, automatisch das zuletzt exportierte Dataset für das Training zu verwenden. Diese Variable ist unabhängig davon, ob das Dataset Daten aus der Validation Station enthält oder nicht.
Feinabstimmung: Training oder erneutes Training eines Modells mit einem Dataset, das Daten von der Validation Station enthält.
Automatische Feinabstimmung: Verwenden der Umgebungsvariablenfunktion für automatisches erneutes Training zum automatischen Trainieren eines Modells mit Daten, die von der Validation Station mit der Funktion „Geplanter Export“ des Data Managers bereitgestellt werden.