- Erste Schritte
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Entitäten
- Bezeichnungen (Vorhersagen, Konfidenzniveaus, Hierarchie usw.)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Überprüfte und nicht überprüfte Nachrichten
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Verwaltung
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Erstellen Sie eine Datenquelle in der GUI
- Hochladen einer CSV-Datei in eine Quelle
- Ein neues Dataset erstellen
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern Sie die Einstellungen eines Datasets
- Löschen Sie Nachrichten über die Benutzeroberfläche
- Löschen Sie ein Dataset
- Exportieren Sie ein Dataset
- Verwenden von Exchange-Integrationen
- Vorbereiten von Daten für den CSV-Upload
- Modelltraining und -wartung
- Verstehen von Bezeichnungen, Entitäten und Metadaten
- Bezeichnungshierarchie und bewährte Methode
- Definieren Ihrer Taxonomieziele
- Analyse- vs. Automatisierungsanwendungsfälle
- Konvertieren Ihrer Ziele in Bezeichnungen
- Erstellen Ihrer Taxonomiestruktur
- Best Practices für den Taxonomieentwurf
- Ihre Taxonomie wird importiert
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung (NEU)
- Verstehen des Status Ihres Datasets
- Best Practice für Modelltraining und Beschriftung
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Trainieren
- Einführung zu „Verfeinern“
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- Wie funktioniert die Validierung?
- Verstehen und Verbessern der Modellleistung
- Warum kann eine Bezeichnung eine geringe durchschnittliche Genauigkeit haben?
- Training mit „Bezeichnung überprüfen“ und „Bezeichnung fehlen“
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Ausgleichs und Verwendung von „Neuausgleich“
- Wann das Training Ihres Modells beendet werden soll
- Definieren und Einrichten Ihrer Entitäten
- Grundlegendes zu Entitäten
- Welche vortrainierten Entitäten sind verfügbar?
- Aktivieren, Deaktivieren, Aktualisieren und Erstellen von Entitäten
- Entitätsfilterung
- Überprüfen und Anwenden von Entitäten
- Validierung für Entitäten
- Verbesserung der Entitätsleistung
- Erstellen von benutzerdefinierten Regex-Entitäten
- Verwenden von Analytics & Monitoring
- Automatisierungs- und Communications Mining
- Häufige Fragen und mehr
Generative Anmerkung (NEU)
Generative Annotation verwendet den Azure OpenAI-Endpunkt von Microsoft, um KI-vorgeschlagene Beschriftungen zu generieren, um den Taxonomieentwurf und frühere Phasen des Modelltrainings zu beschleunigen; und die Zeit bis zur Wertschöpfung bei allen Communications Mining-Anwendungsfällen zu reduzieren.
Es beinhaltet:
- Clustervorschläge: Vorgeschlagene neue oder vorhandene Bezeichnungen für Cluster basierend auf ihren identifizierten Themen
- Assisted Labeling: Automatische Vorhersagen für Beschriftungen basierend auf den Beschriftungsnamen oder Beschreibungen.
Die Funktionen für generative Anmerkungen werden automatisch für Datasets aktiviert – Sie müssen nichts tun, um sie zu verwenden.
Sobald ein Dataset erstellt wurde, werden Clustervorschläge automatisch innerhalb kurzer Zeit generiert. Wenn eine Taxonomie hochgeladen wurde (dringend empfohlen), schlägt Communications Mining sowohl bestehende als auch neue Bezeichnungen für Cluster vor.
Wenn eine Taxonomie in ein Dataset hochgeladen wird, wird auch automatisch ein erstes Modell ausgelöst, das ohne Trainingsdaten trainiert wird, sondern nur mit Bezeichnungsnamen und Beschreibungen. Dies kann einige Minuten nach dem Hochladen der Taxonomie dauern.
- Für Clustervorschläge: Wechseln Sie zur Registerkarte Trainieren und wählen Sie einen Clusterbatch aus oder wechseln Sie zur Registerkarte Discover und wählen Sie den Clustermodus aus, um mit der Beschriftung zu beginnen
- Für die unterstützte Beschriftung: Wechseln Sie zur Registerkarte Trainieren und befolgen Sie die empfohlenen Aktionen, oder wechseln Sie zur Registerkarte Erkunden und wählen Sie den Modus Mischen oder Beschriftung lernen aus, um mit der Beschriftung zu beginnen.
Voraussetzung: Berechtigung zum „Überprüfen und Beschriften“ /
Clustervorschläge werden oben auf jeder Clusterseite angezeigt (weiße Schattierung mit blauer Umrandung). Dies können eine oder mehrere vorgeschlagene Bezeichnungen für jeden Cluster sein.
Wenn Sie die Stimmungsanalyse für Beschriftungen aktiviert haben, haben Clustervorschläge entweder eine positive oder negative Stimmung (weiße Schattierung mit grünem oder rotem Rahmen).
Sie können erkennen, dass es sich um eine von der KI vorgeschlagene Bezeichnung anhand des roten Blitz-Symbols neben dem Beschriftungsnamen handelt.
Modelltrainer sollten jeden Clustervorschlag überprüfen und:
- Akzeptieren Sie sie, indem Sie darauf klicken, oder
- Weisen Sie eine neue Bezeichnung zu, wenn Sie mit dem gegebenen Vorschlag nicht einverstanden sind.
Clustervorschläge können die erste Phase des Modelltrainingsprozesses erheblich beschleunigen, indem automatisch Bezeichnungsvorschläge für jeden Cluster generiert werden.
Dies kann auch beim Taxonomieentwurf helfen, wenn Benutzer Schwierigkeiten haben, die Konzepte zu definieren, die sie trainieren möchten.
Clustervorschläge werden basierend auf dem identifizierten Thema generiert, das in den Nachrichten innerhalb eines Clusters geteilt wird.
Die Erstellung von Clustern und die Generierung von Beschriftungsvorschlägen ist ein automatischer und völlig unbeaufsichtigter Prozess, bei dem keine menschliche Eingabe erforderlich ist.
Beschriftungsvorschläge für Cluster werden mit oder ohne vordefinierte Taxonomie generiert. Vorschläge werden jedoch durch die Nutzung importierter/vorhandener Beschriftungen beeinflusst und in der Regel hilfreicher gemacht.
Voraussetzung 1: Berechtigung zum „Überprüfen und Beschriften “.
Voraussetzung 2: Importierte Liste von Beschriftungsnamen.
Optional, aber dringend empfohlen: Importierte Liste von Beschriftungsbeschreibungen.
Sobald das ursprüngliche Modell automatisch unter Verwendung von Beschriftungsnamen und Beschreibungen als Trainingseingabe trainiert wurde, werden Vorhersagen für viele der Nachrichten im Dataset angezeigt.
Diese Vorhersagen funktionieren auf genau die gleiche Weise wie zuvor – sie werden nur ohne Trainingsdaten generiert.
Wenn Sie die Stimmungsanalyse mit Beschriftung aktiviert haben, haben anfängliche Vorhersagen entweder eine positive oder eine negative Stimmung (verschiedene Grün-/Rotschattierungen je nach Konfidenzniveau).
Assisted Labeling funktioniert in jedem Trainingsbatch oder Modus, am effektivsten ist jedoch die Verwendung in „Shuffle“ und „Teach Label“ (folgen Sie den regulären Beschriftungsschritten in jedem Trainingsbatch in Trainieren oder Erkunden).
Assisted Labeling kann die zweite Phase des Modelltrainingsprozesses erheblich beschleunigen, indem automatisch Vorhersagen für jede Beschriftung mit ausreichend Kontext generiert werden, ohne dass Trainingsbeispiele erforderlich sind.
Anfängliche Vorhersagen werden von der Qualität der Bezeichnungsnamen und Beschreibungen in natürlicher Sprache abhängen (d. h vage Namen können zu vage oder minimale Vorhersagen führen). Detaillierte Beschriftungsbeschreibungen können die Leistung des ursprünglichen Modells steigern.
Wenn Sie Ihr Dataset weiter trainieren, verwendet die Plattform sowohl die Bezeichnungsnamen und Beschreibungen als auch Ihre angehefteten Beispiele, um relevante Bezeichnungsvorhersagen zu generieren.
Diese werden mit mehr Training weiter verbessert und basieren letzten Endes nur auf kommentierten Trainingsbeispielen, wenn genügend zur Verfügung gestellt wurde.
Assisted Labeling erfordert immer noch überwachtes Lernen durch Akzeptieren/Ablehnung der Vorhersagen, aber es beschleunigt den zeitaufwändigsten Teil des Modelltrainings, indem bessere Vorhersagen mit null oder sehr wenigen fixierten Beispielen bereitgestellt werden.