- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Intelligenter Schlüsselwortklassifizierer
- FlexiCapture Classifier
- Machine Learning Classifier
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- ML-Pakete
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Deep Learning
- Lizenzierung
- Referenzen
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Document Understanding-Benutzerhandbuch.
Über Pipelines
Document Understanding-ML-Pakete können alle drei Pipelinetypen ausführen:
Nach Abschluss hat eine Pipelineausführung zugehörige Ausgaben und Protokolle. Um diese Informationen auf der Registerkarte Pipelines in der linken Seitenleiste anzuzeigen, klicken Sie auf eine Pipeline. Es öffnet sich die Pipelineansicht, die aus Folgendem besteht:
- Pipelinedetails wie Typ, Name und Version des ML-Pakets, Dataset, GPU-Nutzung, Parameter und Ausführungszeit
- Bereich Ausgaben; dieser enthält immer eine
_results.json
-Datei mit einer Zusammenfassung der Pipelinedetails - Seite Protokolle; die Protokolle können auch auf der Registerkarte ML-Protokolle in der linken Seitenleiste abgerufen werden
Trainingspipelines oder vollständige Pipelines können auch verwendet werden für:
- Feinabstimmung von ML-Modellen mit Daten aus der Validation Station
- Automatische Feinabstimmung eines ML-Modells
Training:
Training eines Modells von Grund auf, d. h. mit dem ML-Paket für DocumentUnderstanding im AI Center.
Erneutes Training:
Training mit einem vortrainierten Basismodell, d. h. mit einem der anderen ML-Pakete zur Dokumentextraktion im AI Center, etwa für Invoices, Receipts, Purchase Orders usw.
Automatisches erneutes Training:
Dies ist der Name einer Umgebungsvariablen, die beim Erstellen einer Pipeline im AI Center festgelegt werden kann. Sie ermöglicht es der Pipeline, automatisch das zuletzt exportierte Dataset für das Training zu verwenden. Diese Variable ist unabhängig davon, ob dieses Dataset Daten aus der Validation Station enthält oder nicht.
Feinabstimmung:
Training oder erneutes Training eines Modells mithilfe eines Datasets, der Daten aus der Validation Station enthält.
Automatische Feinabstimmung:
Verwendung der Umgebungsvariablenfunktion für automatisches erneutes Training für ein Modells mithilfe der Daten, die mithilfe der Funktion für den geplanten Export von Document Manager aus der Validation Station eingespeist werden.