- Einleitung
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Allgemeine Felder (früher Entitäten)
- Bezeichnungen (Vorhersagen, Konfidenzniveaus, Hierarchie usw.)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Nachrichten mit und ohne Anmerkungen
- Extraktionsfelder
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Zugriffskontrolle und Verwaltung
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Erstellen oder löschen Sie eine Datenquelle in der GUI
- Hochladen einer CSV-Datei in eine Quelle
- Vorbereiten von Daten für den CSV-Upload
- Ein neues Dataset erstellen
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern Sie die Dataset-Einstellungen
- Löschen Sie Nachrichten über die Benutzeroberfläche
- Löschen Sie ein Dataset
- Exportieren Sie ein Dataset
- Verwenden von Exchange-Integrationen
- Modelltraining und -wartung
- Grundlegendes zu Beschriftungen, allgemeinen Feldern und Metadaten
- Beschriftungshierarchie und Best Practices
- Analyse- vs. Automatisierungsanwendungsfälle
- Konvertieren Ihrer Ziele in Bezeichnungen
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung (NEU)
- Der Status des Datasets
- Best Practice für Modelltraining und Anmerkungen
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Grundlegendes zu Datenanforderungen
- Trainieren
- Einführung in Verfeinerung
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- Wie funktioniert die Validierung?
- Verstehen und Verbessern der Modellleistung
- Warum kann eine Bezeichnung eine geringe durchschnittliche Genauigkeit haben?
- Training mit Beschriftung „Überprüfen“ und Beschriftung „Verpasst“.
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Abgleichs und Verwendung des Abgleichs
- Wann das Training Ihres Modells beendet werden soll
- Verwenden von allgemeinen Feldern
- Generative Extraktion
- Verwenden von Analyse und Überwachung
- Automatisierungs- und Communications Mining
- Lizenzierungsinformationen
- Häufige Fragen und mehr

Communications Mining-Benutzerhandbuch
Beschriftungshierarchie und Best Practices
Um Ihre Geschäftsziele zu erreichen, ist es wichtig zu verstehen, wie Sie Ihre Taxonomie erstellen, bevor Sie mit dem Training Ihres Modells beginnen. Dazu gehört, wie Sie Ihre Beschriftungen benennen und strukturieren und womit sie bestehen sollen. Weitere Informationen finden Sie unter Erstellen Ihrer Taxonomiestruktur.
Die generative Anmerkungsfunktion verwendet Beschriftungsnamen und Beschreibungen als Trainingseingabe. Daher ist es wichtig, klare, eindeutige und beschreibende Beschriftungsnamen zu verwenden. Beschriftungsnamen und Beschreibungen liefern dem Modell die besten Trainingsinputs, wenn es automatisch Vorhersagen generiert.
Sie können Beschriftungen jederzeit umbenennen und Hierarchieebenen hinzufügen. Auf diese Weise können Sie Beschriftungen und Beschriftungsbeschreibungen optimieren, um die automatisch generierten Vorhersagen zu verbessern, bevor Sie Nachrichten mit Beschriftungen kommentieren.
>
getrennt sind, um zu erfassen, wenn ein Beschriftungskonzept eine Teilmenge eines umfassenderen übergeordneten Konzepts ist.
Beispiele für Beschriftungsstrukturen:
- [Übergeordnete Beschriftung]
- [Übergeordnete Beschriftung] > [Untergeordnete Beschriftung]
- [Übergeordnete Beschriftung] > [Verzweigungsbezeichnung] > [Untergeordnete Beschriftung]
Sie können mehr als drei Hierarchieebenen hinzufügen, aber wir empfehlen, dies nicht oft zu tun, da es komplex wird, das Modell zu trainieren. Um zusätzliche Hierarchieebenen hinzuzufügen, können Sie Ihre Beschriftungen später im Modelltrainingsprozess umbenennen.
>
festgelegt, wenn Sie den Beschriftungsnamen angeben.
Um die Funktionsweise von Hierarchien zu verstehen, betrachten Sie das untergeordnete Beschriftung X aus dem Diagramm im Abschnitt Beschriftungshierarchien .
Wenn das Modell vorhersagt, dass die untergeordnete Beschriftung X auf eine Nachricht zutrifft, sagt es auch die Verzweigungsbeschriftung C und die übergeordnete Beschriftung 1 gleichzeitig vorher. Dies liegt daran, dass die untergeordnete Beschriftung X eine Teilmenge der beiden ist.
Mit jeder Hierarchieebene wird die Spezifität immer höher. Das Modell ist jedoch oft sicherer bei der Zuweisung einer übergeordneten oder Verzweigungsbeschriftung als eine spezifischere untergeordnete Beschriftung. Das bedeutet, dass das Modell verschiedenen Beschriftungsvorhersagen innerhalb derselben Hierarchie unterschiedliche Wahrscheinlichkeiten zuweisen kann.
Zum Beispiel für eine bestimmte Nachricht könnte das Modell wie folgt aussehen:
- 99 % sicher, dass übergeordnete Beschriftung 1 zutrifft.
- 88 % zuversichtlich, dass Verzweigungsbeschriftung C zutrifft.
- 75 % sicher, dass die untergeordnete Beschriftung X zutrifft.
Das Modell sagt jede Beschriftung unabhängig vorher, daher ist es wichtig, dass übergeordnete Beschriftungen echte Themen oder Konzepte anstelle von abstrakten darstellen.
Beispielsweise ist es ineffizient, einen Prozess als übergeordnete Beschriftung zu verwenden, wenn er bestimmte Prozesse gruppiert, da er zu abstrakt ist, um das Modell vorherzusagen. Stattdessen funktioniert ein bestimmter Prozessname aus dem Nachrichtentext besser als übergeordnete Beschriftung, mit Verzweigungs- und untergeordneten Beschriftungen, die relevante Unterprozesse darstellen.
Manchmal müssen Sie schwierige Entscheidungen bezüglich der Struktur Ihrer Taxonomie treffen. Beispielsweise kann es schwierig sein, auszuwählen, ob eine Beschriftung eine übergeordnete oder eine untergeordnete Beschriftung sein soll. Dies kann passieren, weil die Beschriftung logisch als umfassende übergeordnete Kategorie mit eigenen Unterkategorien dienen könnte oder eine bestimmte Unterkategorie einer anderen umfassenderen übergeordneten Kategorie sein könnte.
Stellen Sie sich zum Beispiel ein Dataset mit Hotelbewertungen vor. Viele Bewertungen können die Preise für verschiedene Aspekte des Urlaubs und des Ereignisses beinhalten, wie das Lokal, die Bar, die Fenster, die Aktivitäten usw.
Sie könnten die folgenden Optionen in Betracht ziehen:
- Sie können Preise als übergeordnete Bezeichnung haben und jeden spezifischen Aspekt der Preisgestaltung (d. h Lokal) als untergeordnete Beschriftungen.
- Sie können jedoch auch übergeordnete Beschriftungen haben, die sich auf spezifische Aspekte beziehen, z. B. Aktivitäten wie Restaurantes und Fenster und unter jeder Beschriftung Preisgestaltung als untergeordnete Beschriftung haben.
Berücksichtigen Sie bei Ihrer Entscheidung Folgendes:
- Gibt es eine signifikante Anzahl anderer Konzepte im Zusammenhang mit diesem umfassenderen Thema, die Sie aufnehmen möchten? Wenn ja, sollte es sich um eine übergeordnete Beschriftung handeln.
- Was ist aus Sicht der Managementinformationen oder der Berichterstattung am wichtigsten? Ist es in Bezug auf unser Beispiel nützlich, in der Communications Mining-Analyse deutlich zu sehen, wie viele Personen über die Preisgestaltung und ihre Unterkategorien sprechen? Oder ist es hilfreicher, Gesamtstatistiken über das Feedback zu Fenstern, Aktivitäten, Aktivitäten usw. zu sehen, wobei die Preisgestaltung nur ein Aspekt davon ist?
In diesen Situationen gibt es nicht immer eine eindeutige richtige oder falsche Antwort – es hängt letzten Endes davon ab, was für Sie und Ihr Unternehmen am wichtigsten ist.
Bisher haben wir besprochen, wie Beschriftungen benannt und in Hierarchien strukturiert werden. Allerdings fragen Sie sich möglicherweise immer noch, was genau eine Beschriftung erfassen soll.
Es ist wichtig, sich daran zu erinnern, dass Communications Mining ein Werkzeug zur Verarbeitung natürlicher Sprache (NLP) ist. Die Plattform liest und interpretiert jede Nachricht, der eine Beschriftung zugewiesen ist, und beginnt, ein Verständnis dafür zu entwickeln, wie dieses Beschriftungskonzept identifiziert werden kann, hauptsächlich auf der Grundlage des darin enthaltenen Texts.
Je mehr Sie für jede Beschriftung vielfältigere und konsistentere Beispiele hinzufügen, desto verbessert das Modell sein Verständnis dieses Beschriftungskonzepts. Sobald eine Beschriftung gut funktioniert, vermeiden Sie das Hinzufügen weiterer Beschriftungen, da der Prozess sinkende Ergebnisse erzielen würde. Vermeiden Sie auch das Akzeptieren einer großen Anzahl von Vorhersagen mit hoher Konfidenz für eine Beschriftung, da das Modell dadurch keine neuen Informationen erhält.
Da Communications Mining die Sprache der Nachricht verwendet, um zu verstehen und zu identifizieren, was Beschriftungskonzepte ausmachen, muss die Beschriftung eindeutig aus dem Text der Nachrichten identifizierbar sein, auf die sie angewendet wird. Bei einer E-Mail-Nachricht umfasst dies sowohl den Betreff als auch den Text der E-Mail.
Cancellation > Confirmation > Termination
angewendet:
Sie können den Namen der Beschriftung eindeutig aus dem Betreff und dem Text der E-Mail ableiten.
Während das Modell bestimmte Metadateneigenschaften wie NPS-Bewertungen berücksichtigen kann, bleibt der Text der Nachricht die wichtigsten Daten für Communications Mining-Modelle, wenn es mit Kundenfeedback-Datasets trainiert wird, um die Stimmung zu verstehen.
Das bedeutet, dass jede Beschriftung spezifisch sein muss, was sie erfassen soll. Andernfalls hat das Modell Schwierigkeiten, die Trends und Muster in der Sprache zu erkennen, die für eine genaue Vorhersage des Beschriftungskonzepts erforderlich sind.
Sehr breite Beschriftungen wie Allgemeine Abfrage oder Alles andere können nicht hilfreich sein, wenn Sie sie verwenden, um mehrere verschiedene Themen zusammenzufassen, und es gibt kein klares Muster oder Gemeinsamkeit zwischen den Beispielen, die dem Modell zur Verfügung gestellt werden.
Damit das Modell eine Beschriftung genau vorhersagen kann, benötigt es mehrere ähnliche Beispiele für die verschiedenen Ausdrücke jedes Konzepts, das von der Beschriftung erfasst wird. Daher benötigen extrem breite Beschriftungen eine sehr große Anzahl von Beispielen, um effektiv vorhergesagt zu werden.
Es ist sinnvoll, breite Beschriftungen in getrennte Beschriftungen aufzuteilen, auch wenn Sie Alles andere > [Verschiedene untergeordnete Beschriftungen] haben.
Wenn das Modell eine untergeordnete Beschriftung besser identifizieren kann, da sie im Vergleich zu einer sehr breiten übergeordneten Kategorie spezifischer und klarer identifizierbar ist, kann es seine Fähigkeit, auch die übergeordnete Beschriftung vorherzusagen, erheblich verbessern.
Die Funktion Generative Anmerkung verwendet Beschriftungsbeschreibungen und Beschriftungsnamen, um automatisch ein spezielles Modell zu trainieren. Daher ist es wichtig, jeder Beschriftung beschreibende, klare und informative Beschreibungen hinzuzufügen, damit das Modell genaue Vorhersagen generieren kann.
Das generative KI-Modell verwendet Beschreibungen als Eingaben, um Nachrichten im Hintergrund vorab zu kommentieren. Das reduziert den Zeit- und Arbeitsaufwand für das manuelle Annotieren von Beispielen.
Sie können Beschriftungsbeschreibungen hinzufügen, sobald der Prozess „Dataset erstellen“ sie erstellt, oder Sie können sie auf der Seite Taxonomie in den Dataset-Einstellungen hinzufügen oder bearbeiten.
Eine effektive Möglichkeit, die Konsistenz der Beschriftungen während des gesamten Modellerstellungsprozesses aufrechtzuerhalten, besteht darin, jeder Beschriftung Beschreibungen hinzuzufügen. Dies ist nützlich, wenn mehrere Benutzer Ihr Modell trainieren, da so sichergestellt wird, dass alle Benutzer das gleiche Verständnis für eine bestimmte Beschriftung und das zugehörige Konzept haben. Ein weiterer Vorteil der Aufrechterhaltung der Beschriftungskonsistenz besteht darin, dass der Übergabeprozess effizienter wird, wenn Sie das Modell an einen anderen Benutzer übertragen müssen.