- Versionshinweise
- Bevor Sie beginnen
- Erste Schritte
- Installieren der Automation Suite
- Migration und Upgrade
- Projekte
- Datasets
- ML-Pakete
- Pipelines
- ML-Skills
- ML-Protokolle
- Document Understanding im AI Center
- Anleitungen zu …
- Grundlegende Anleitung zur Fehlerbehebung
Über Pipelines
Eine Pipeline ist eine Beschreibung eines Machine Learning-Workflows, einschließlich aller Funktionen im Workflow und der Reihenfolge der Ausführungen dieser Funktionen. Die Pipeline enthält die Definition der Eingaben, die zum Ausführen der Pipeline erforderlich sind, und die von ihr empfangenen Ausgaben.
Eine Pipelineausführung ist eine Ausführung einer Pipeline, die auf einem Code basiert, der vom Benutzer bereitgestellt wurde. Nach Abschluss hat eine Pipelineausführung zugehörige Ausgaben und Protokolle.
Es gibt drei Arten von Pipelines:
- Trainingspipeline – Nimmt als Eingabe ein Paket und ein Dataset und erzeugt eine neue Paketversion.
- Auswertungspipeline – Nimmt als Eingabe eine Paketversion und ein Dataset und erzeugt eine Reihe von Metriken und Protokollen.
-
Vollständige Pipeline – führt eine Verarbeitungsfunktion, eine Trainingspipeline und unmittelbar nach einer Auswertungspipeline aus.
Tipp: Die Beispiele, mit denen diese Konzepte erklärt werden, basieren auf einem Beispielpaket, tutorialpackage.zip, das Sie herunterladen können, indem Sie auf die Schaltfläche unten klicken. Wir empfehlen Ihnen, dieses Beispielpaket hochzuladen, wenn Sie zum ersten Mal etwas über Pipelines erfahren. Stellen Sie sicher, dass Sie es für das Training aktivieren.
Auf der Seite Pipelines, auf die Sie nach der Auswahl eines Projekts über das Menü Pipelines zugreifen können, können Sie alle Pipelines innerhalb dieses Projekts zusammen mit Informationen über ihren Typ, das zugehörige Paket und seine Version, den Status, die Erstellungszeit, die Dauer und die Punktzahl anzeigen. Hier können Sie neue Pipelines erstellen, auf Details vorhandener Pipelines zugreifen oder Pipelines entfernen.
Eine Pipelineausführung kann einen der folgenden Status haben:
- Geplant –Eine Pipeline, die in der Zukunft starten soll (z. B. jeden Montag um 1 Uhr). Wenn Datum/Uhrzeit für den Start der Ausführung einer Pipeline erreicht sind, wird die Pipeline in die Warteschlange gesetzt, um ausgeführt zu werden.
- Verpackung - Eine Pipeline, die mit dem Erstellen des Docker-Image begonnen hat, auf dem der Auftrag selbst ausgeführt wird. Wenn Sie zum ersten Mal diese bestimmte Version des ML-Pakets trainieren, kann dies bis zu 20 Minuten dauern.
- Wird ausgeführt – Eine Pipeline, die gestartet wurde und ausgeführt wird.
- Fehlgeschlagen – Eine Pipeline, die während der Ausführung fehlgeschlagen ist.
Hinweis: Pipelines können fehlschlagen, wenn die Größe des Datasets den Grenzwert von 50 GB überschreitet.
- Beendet –Eine Pipeline, die ausgeführt wurde, bis der Benutzer die Beendigung explizit aufgerufen hat.
- Erfolgreich – Eine Pipeline, die die Ausführung abgeschlossen hat.
Hinweis: Pipelines werden nach sieben Tagen automatisch beendet, um zu vermeiden, dass sie für längere Zeit hängen bleiben und Lizenzen verbrauchen.