- Erste Schritte
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Allgemeine Felder (früher Entitäten)
- Bezeichnungen (Vorhersagen, Konfidenzniveaus, Hierarchie usw.)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Überprüfte und nicht überprüfte Nachrichten
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Verwaltung
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Erstellen Sie eine Datenquelle in der GUI
- Hochladen einer CSV-Datei in eine Quelle
- Ein neues Dataset erstellen
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern Sie die Einstellungen eines Datasets
- Löschen Sie Nachrichten über die Benutzeroberfläche
- Löschen Sie ein Dataset
- Löschen Sie eine Quelle
- Exportieren Sie ein Dataset
- Verwenden von Exchange-Integrationen
- Vorbereiten von Daten für den CSV-Upload
- Modelltraining und -wartung
- Verstehen von Beschriftungen, allgemeinen Feldern und Metadaten
- Bezeichnungshierarchie und bewährte Methode
- Definieren Ihrer Taxonomieziele
- Analyse- vs. Automatisierungsanwendungsfälle
- Konvertieren Ihrer Ziele in Bezeichnungen
- Erstellen Ihrer Taxonomiestruktur
- Best Practices für den Taxonomieentwurf
- Ihre Taxonomie wird importiert
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung (NEU)
- Verstehen des Status Ihres Datasets
- Best Practice für Modelltraining und Anmerkungen
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Trainieren
- Überblick
- Training mit Clustern
- Training mit der Suche (Discover)
- Einführung in Verfeinerung
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- Wie funktioniert die Validierung?
- Verstehen und Verbessern der Modellleistung
- Warum kann eine Bezeichnung eine geringe durchschnittliche Genauigkeit haben?
- Training mit Beschriftung „Überprüfen“ und Beschriftung „Verpasst“.
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Abgleichs und Verwendung des Abgleichs
- Wann das Training Ihres Modells beendet werden soll
- Verwenden von allgemeinen Feldern
- Generative Extraktion
- Verwenden von Analyse und Überwachung
- Automatisierungs- und Communications Mining
- Lizenzierungsinformationen
- Häufige Fragen und mehr
Training mit Clustern
Benutzerberechtigungen erforderlich: „Quellen anzeigen“ UND „Überprüfen und Kommentieren“.
Sobald sich Ihre Daten in der Plattform befinden, gruppiert die Plattform 30 Kommunikationscluster (Nachrichten), von denen sie annimmt, dass sie Konzepte oder ähnliche Absichten teilen, und zeigt sie an. Das Ziel dieses Teils des Trainingsprozesses ist es, jeden dieser Cluster zu durchlaufen und die in jedem von ihnen präsentierten Daten zu kommentieren.
Dieser Prozess macht das Training des Modells zu Beginn einfacher und schneller, da Sie mehreren ähnlichen Nachrichten gleichzeitig Beschriftungen hinzufügen und nach Bedarf Beschriftungen zu einzelnen Nachrichten hinzufügen/entfernen können.
Hilfreiche Tipps zum Kommentieren von Clustern:
- Denken Sie nicht zu lange über den Namen der Beschriftung nach. Sie können eine Bezeichnung während des Trainingsprozesses jederzeit umbenennen.
- Seien Sie bei der Benennung einer Beschriftung so spezifisch wie möglich und halten Sie die Taxonomie anfangs so flach wie möglich (fügen Sie nicht zu viele untergeordnete Beschriftungen hinzu). Es ist besser, mit dem Beschriftungsnamen zu Beginn so spezifisch wie möglich zu sein, da Sie die Hierarchie später jederzeit ändern und neu strukturieren können. An diesem Punkt sollten Sie einer Nachricht so viele Beschriftungen wie möglich hinzufügen, da Sie sie später jederzeit löschen können. Das ist schneller und einfacher als das Erweitern einer vorhandenen Beschriftung.
- Denken Sie daran, dass es oft einfacher ist, von vornherein eine spezifischere, differenziertere Taxonomie zu erstellen. Wenn sie zu detailliert ist, kann Ihre Taxonomie später einfach bearbeitet und bereinigt werden. Das bedeutet, dass Sie mehr als weniger Beschriftungen und Unterbeschriftungen hinzufügen
- Es ist gut, mit Bezeichnungen in einer flache Hierarchie zu beginnen (nicht zu viele Unterbeschriftungen hinzuzufügen) – Sie können die Taxonomie später jederzeit in eine hierarchischere Struktur umstrukturieren
- Jeder Nachricht können mehrere Beschriftungen zugewiesen werden – Stellen Sie sicher, dass Sie alle relevanten Beschriftungen anwenden, da Sie dem Modell andernfalls beibringen, sie nicht mit der Beschriftung zu verknüpfen, die Sie ausgelassen haben
- Es ist besser, sich jetzt die Zeit für sorgfältige Anmerkungen zu nehmen, damit die Maschine Beschriftungen in Zukunft schnell und genau vorhersagen kann
- Nicht alle Cluster haben offensichtlich ähnliche Absichten. Es ist in Ordnung, fortzufahren, wenn sie alle unterschiedlich sind
Wenn Sie zum ersten Mal ein neues Dataset erstellen, stellen Sie möglicherweise fest, dass Discover leer ist, wie unten gezeigt. Keine Sorge, das liegt einfach daran, dass die Algorithmen der Plattform im Hintergrund damit beschäftigt sind, Ihre Nachrichten in Clustern zu gruppieren. Je nach Anzahl der Meldungen in der Datenquelle kann die Verarbeitung einige Stunden dauern.
Das Layout von Discover und ein Beispielcluster werden unten angezeigt. In diesem Beispiel hat die Plattform erkannt, dass diese Meldungen das gleiche Thema wie der Komfort der Hotelbetten teilen:
Layout erklärt:
A
– Umschaltfläche zum Wechseln zwischen „Cluster“ und „Suchmodus“.B
– Dropdownmenü, mit dem Sie zwischen verschiedenen Clustern wechseln könnenC
– Schaltfläche zum Anwenden einer Beschriftung auf alle auf der Seite angezeigten NachrichtenD
– Eine von sechs Meldungen, die aus Cluster Nr. 7 angezeigt werden (jeder Cluster enthält 12 Meldungen).E
– Schaltfläche zum Anwenden einer Beschriftung auf eine einzelne NachrichtF
– Dropdownmenü zum Anpassen der Anzahl der auf der Seite angezeigten Meldungen (zwischen 6 und 12)G
– Schaltflächen zum Anpassen und Umkehren der Auswahl der Nachrichten auf der SeiteH
– Schaltfläche zum Aufheben der Auswahl einer Nachricht, um sie von massenweise hinzugefügten Beschriftungen auszuschließen
Wie in der folgenden Abbildung hervorgehoben, hebt Discover die Teile einer Nachricht hervor, die am meisten zur Aufnahme dieser Nachricht in den Cluster beitragen, sodass Sie gemeinsame Themen schneller erkennen können:
Entdecken Sie die Hervorhebung gängiger Themen
- Die dunkleren Linien stellen wichtigereTeile des Abschnitts dar (dies wird erklärt, wenn Sie mit dem Mauszeiger darüber fahren).
- Die helleren Linien deuten auf einen mittleren und etwas wirkenden Beitrag zum Cluster hin
1. Überprüfen Sie jede Meldung im Cluster
2. Wenn Sie der Meinung sind, dass es eine Beschriftung gibt, die für alle Nachrichten auf der Seite gilt, wählen Sie „Beschriftung hinzufügen“ aus.
3.Geben Sie den Namen der Beschriftung ein und drücken Sie die Eingabetaste oder klicken Sie auf die angezeigte Anheftschaltfläche (auf diese Weise können Sie mehrere Beschriftungen gleichzeitig hinzufügen, geben Sie einfach eine weitere Beschriftung ein und klicken Sie erneut auf die Anheftschaltfläche).
4. Klicken Sie auf die SchaltflächeBeschriftungen anwenden , um den Nachrichten die Beschriftung(en) zuzuweisen. Die zugewiesenen Beschriftungen werden jetzt unter jeder Nachricht auf der Seite angezeigt.
Alternativ können Sie einzelnen Nachrichten eine Beschriftung hinzufügen, indem Sie auf die Schaltfläche „Beschriftung hinzufügen + “ klicken, die darunter hervorgehoben ist.
Wenn Sie einer Gruppe von Nachrichten auf der Seite eine Beschriftung hinzufügen möchten, aber eine oder mehrere ausschließen möchten, können Sie sie mit der hervorgehobenen Umschaltfläche (A) abwählen. Sie können dann die Auswahl umkehren oder die Auswahl aufheben/erneut auswählen,indem Sie die oben hervorgehobenen Schaltflächen verwenden (B).
Sie können verschiedene Seiten desselben Clusters anzeigen (A) und die Anzahl der Meldungen pro Seite (B) mithilfe der hervorgehobenen Schaltflächen anpassen. Sobald der Cluster mit einer Anmerkung versehen wurde, können Sie mithilfe der Dropdownliste unten (C) zu einem neuen Cluster wechseln.
Das Modell präsentiert Ihnen 30 Cluster und es ist wichtig, dass Sie sich durch diese arbeiten, um eine solide Grundlage für die Erkundungsphase zu schaffen. Wenn ein Cluster für Sie jedoch nicht relevant ist, überspringen Sie ihn einfach.
Discover beginnt mit dem erneuten Training, nachdem eine beträchtliche Menge an Training abgeschlossen wurde. Nachdem 180 Nachrichten mit Anmerkungen versehen wurden (die Hälfte der Cluster), trainiert und aktualisiert Discover die Cluster erneut. Lassen Sie sich nicht verunsichern, sondern arbeiten Sie einfach weiter, bis Sie mindestens30 durchgegangen sind.