- Erste Schritte
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Allgemeine Felder (früher Entitäten)
- Bezeichnungen (Vorhersagen, Konfidenzniveaus, Hierarchie usw.)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Überprüfte und nicht überprüfte Nachrichten
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Verwaltung
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Create or delete a data source in the GUI
- Hochladen einer CSV-Datei in eine Quelle
- Vorbereiten von Daten für den CSV-Upload
- Ein neues Dataset erstellen
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern Sie die Einstellungen eines Datasets
- Löschen Sie Nachrichten über die Benutzeroberfläche
- Löschen Sie ein Dataset
- Exportieren Sie ein Dataset
- Verwenden von Exchange-Integrationen
- Modelltraining und -wartung
- Verstehen von Beschriftungen, allgemeinen Feldern und Metadaten
- Bezeichnungshierarchie und bewährte Methode
- Definieren Ihrer Taxonomieziele
- Analyse- vs. Automatisierungsanwendungsfälle
- Konvertieren Ihrer Ziele in Bezeichnungen
- Erstellen Ihrer Taxonomiestruktur
- Best Practices für den Taxonomieentwurf
- Ihre Taxonomie wird importiert
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung (NEU)
- Der Status des Datasets
- Best Practice für Modelltraining und Anmerkungen
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Grundlegendes zu Datenanforderungen
- Trainieren
- Einführung in Verfeinerung
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- Wie funktioniert die Validierung?
- Verstehen und Verbessern der Modellleistung
- Warum kann eine Bezeichnung eine geringe durchschnittliche Genauigkeit haben?
- Training mit Beschriftung „Überprüfen“ und Beschriftung „Verpasst“.
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Abgleichs und Verwendung des Abgleichs
- Wann das Training Ihres Modells beendet werden soll
- Verwenden von allgemeinen Feldern
- Generative Extraktion
- Verwenden von Analyse und Überwachung
- Automatisierungs- und Communications Mining
- Lizenzierungsinformationen
- Häufige Fragen und mehr
Communications Mining-Benutzerhandbuch
Training mit Mischen
Benutzerberechtigung erforderlich: „Quellen anzeigen“ UND „Überprüfen und Beschriften“.
„Machine“ ist der erste Schritt in „ Erkunden “ und dient dazu, den Benutzern eine zufällige Auswahl von Nachrichten zur Verfügung zu stellen, die sie überprüfen können. Im Mischmodus zeigt die Plattform Ihnen Nachrichten mit Vorhersagen an, die alle Bezeichnungen abdecken (und bei denen es keine gibt). Der Schritt des Mischens unterscheidet sich also von den anderen im Erkundungsmodus, da er sich nicht auf eine bestimmte Bezeichnung zum Trainieren konzentriert, sondern alle abdeckt .
Warum ist das Training im Mischmodus so wichtig?
Es ist sehr wichtig, den Mischmodus zu verwenden, um sicherzustellen, dass Sie Ihrem Modell ausreichend Trainingsbeispiele zur Verfügung stellen, die für das Dataset als Ganzes repräsentativ sind, und nicht voreingenommen sind, indem Sie sich nur auf sehr bestimmte Bereiche der Daten konzentrieren.
Insgesamt sollten sich mindestens 10 % der Trainings, die Sie in Ihrem Dataset abschließen, im Mischmodus befinden.
Das Anmerkungen im Mischmodus stellt im Wesentlichen sicher, dass Ihre Taxonomie die Daten innerhalb Ihres Datasets gut abdeckt, und verhindert, dass Sie ein Modell erstellen, das nur für einen kleinen Teil der Daten innerhalb des Datasets sehr genaue Vorhersagen treffen kann.
Das Durchsuchen von Nachrichten im Mischmodus ist daher eine einfache Möglichkeit, ein Gefühl für die Funktionsweise des Gesamtmodells zu bekommen und kann während des gesamten Trainingsprozesses als Referenz verwendet werden. In einer gut trainierten Taxonomie sollten Sie in der Lage sein, alle nicht überprüften Meldungen auf Mischen durchzugehen und Vorhersagen zu akzeptieren, um das Modell weiter zu trainieren. Wenn Sie feststellen, dass viele der Vorhersagen falsch sind, können Sie sehen, welche Bezeichnungen mehr Training erfordern.
Das Durchgehen mehrerer Seiten auf Mischen später im Trainingsprozess ist auch eine gute Möglichkeit, um zu überprüfen, ob es Absichten oder Konzepte gibt, die von Ihrer Taxonomie nicht erfasst wurden, aber hätten erfasst werden sollen. Sie können dann bei Bedarf vorhandene Beschriftungen hinzufügen oder bei Bedarf neue erstellen.
- Wählen Sie „Mischen“ aus dem Dropdownmenü aus, um 20 zufällige Nachrichten anzuzeigen
- Filtern Sie nach nicht überprüften Nachrichten
- Überprüfen Sie jede Meldung und alle zugehörigen Vorhersagen
- Wenn Vorhersagen vorhanden sind, sollten Sie diese entweder bestätigen oder ablehnen. Bestätigen Sie, indem Sie auf die zutreffenden klicken
- Denken Sie daran, dass Sie auch alle anderen zusätzlich zutreffenden Beschriftungen hinzufügen sollten
- Wenn Sie die Vorhersage(n) ablehnen, sollten Sie alle richtigen Beschriftung(en) anwenden – lassen Sie die Nachricht nicht ohne Beschriftungen
- Sie können auch auf die Schaltfläche „Aktualisieren“ klicken, um einen neuen Satz von Meldungen zu erhalten, oder auf die nächste Seite klicken (unten)
Es wird empfohlen, mindestens 10 Seiten an Nachrichten in Mischen mit Anmerkungen zu versehen. In großen Datasets mit vielen Trainingsbeispielen könnte dies viel mehr sein.
Sie sollten versuchen, mindestens 10 % des gesamten Trainings im Mischmodus zu absolvieren.