- Erste Schritte
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Allgemeine Felder (früher Entitäten)
- Bezeichnungen (Vorhersagen, Konfidenzniveaus, Hierarchie usw.)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Überprüfte und nicht überprüfte Nachrichten
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Verwaltung
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Erstellen Sie eine Datenquelle in der GUI
- Hochladen einer CSV-Datei in eine Quelle
- Ein neues Dataset erstellen
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern Sie die Einstellungen eines Datasets
- Löschen Sie Nachrichten über die Benutzeroberfläche
- Löschen Sie ein Dataset
- Löschen Sie eine Quelle
- Exportieren Sie ein Dataset
- Verwenden von Exchange-Integrationen
- Vorbereiten von Daten für den CSV-Upload
- Modelltraining und -wartung
- Verstehen von Beschriftungen, allgemeinen Feldern und Metadaten
- Bezeichnungshierarchie und bewährte Methode
- Definieren Ihrer Taxonomieziele
- Analyse- vs. Automatisierungsanwendungsfälle
- Konvertieren Ihrer Ziele in Bezeichnungen
- Erstellen Ihrer Taxonomiestruktur
- Best Practices für den Taxonomieentwurf
- Ihre Taxonomie wird importiert
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung (NEU)
- Verstehen des Status Ihres Datasets
- Best Practice für Modelltraining und Anmerkungen
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Trainieren
- Einführung in Verfeinerung
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- Wie funktioniert die Validierung?
- Verstehen und Verbessern der Modellleistung
- Warum kann eine Bezeichnung eine geringe durchschnittliche Genauigkeit haben?
- Training mit Beschriftung „Überprüfen“ und Beschriftung „Verpasst“.
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Abgleichs und Verwendung des Abgleichs
- Wann das Training Ihres Modells beendet werden soll
- Verwenden von allgemeinen Feldern
- Generative Extraktion
- Verwenden von Analyse und Überwachung
- Automatisierungs- und Communications Mining
- Lizenzierungsinformationen
- Häufige Fragen und mehr
Generative Anmerkung (NEU)
Generative Annotation verwendet den Azure OpenAI-Endpunkt von Microsoft, um KI-vorgeschlagene Beschriftungen zu generieren, um den Taxonomieentwurf und frühere Phasen des Modelltrainings zu beschleunigen; und die Zeit bis zur Wertschöpfung bei allen Communications Mining-Anwendungsfällen zu reduzieren.
Es beinhaltet:
- Clustervorschläge: Vorgeschlagene neue oder vorhandene Bezeichnungen für Cluster basierend auf ihren identifizierten Themen
- Assisted Annotating: Automatische Vorhersagen für Beschriftungen basierend auf den Beschriftungsnamen oder Beschreibungen.
Die Funktionen für generative Anmerkungen werden automatisch für Datasets aktiviert – Sie müssen nichts tun, um sie zu verwenden.
Sobald ein Dataset erstellt wurde, werden Clustervorschläge automatisch innerhalb kurzer Zeit generiert. Wenn eine Taxonomie hochgeladen wurde (dringend empfohlen), schlägt Communications Mining sowohl bestehende als auch neue Bezeichnungen für Cluster vor.
Wenn eine Taxonomie in ein Dataset hochgeladen wird, wird auch automatisch ein erstes Modell ausgelöst, das ohne Trainingsdaten trainiert wird, sondern nur mit Bezeichnungsnamen und Beschreibungen. Dies kann einige Minuten nach dem Hochladen der Taxonomie dauern.
- Für Clustervorschläge: Wechseln Sie zur Registerkarte Trainieren und wählen Sie einen Clusterbatch aus oder wechseln Sie zur Registerkarte Entdecken und wählen Sie den Clustermodus aus, um mit der Anmerkung zu beginnen.
- Für Assisted Annotating: Wechseln Sie zur Registerkarte Trainieren und befolgen Sie die empfohlenen Aktionen, oder wechseln Sie zur Registerkarte Erkunden und wählen Sie den Modus zum Mischen oder Anlernen der Beschriftung aus, um mit der Anmerkung zu beginnen.
Voraussetzung: Berechtigung zum „Überprüfen und Kommentieren“ /
Clustervorschläge werden oben auf jeder Clusterseite angezeigt (weiße Schattierung mit blauer Umrandung). Dies können eine oder mehrere vorgeschlagene Bezeichnungen für jeden Cluster sein.
Wenn Sie die Stimmungsanalyse für Beschriftungen aktiviert haben, haben Clustervorschläge entweder eine positive oder negative Stimmung (weiße Schattierung mit grünem oder rotem Rahmen).
Sie können erkennen, dass es sich um eine von der KI vorgeschlagene Bezeichnung anhand des roten Blitz-Symbols neben dem Beschriftungsnamen handelt.
Modelltrainer sollten jeden Clustervorschlag überprüfen und:
- Akzeptieren Sie sie, indem Sie darauf klicken, oder
- Weisen Sie eine neue Bezeichnung zu, wenn Sie mit dem gegebenen Vorschlag nicht einverstanden sind.
Clustervorschläge können die erste Phase des Modelltrainingsprozesses erheblich beschleunigen, indem automatisch Bezeichnungsvorschläge für jeden Cluster generiert werden.
Dies kann auch beim Taxonomieentwurf helfen, wenn Benutzer Schwierigkeiten haben, die Konzepte zu definieren, die sie trainieren möchten.
Clustervorschläge werden basierend auf dem identifizierten Thema generiert, das in den Nachrichten innerhalb eines Clusters geteilt wird.
Die Erstellung von Clustern und die Generierung von Beschriftungsvorschlägen ist ein automatischer und völlig unbeaufsichtigter Prozess, bei dem keine menschliche Eingabe erforderlich ist.
Beschriftungsvorschläge für Cluster werden mit oder ohne vordefinierte Taxonomie generiert. Vorschläge werden jedoch durch die Nutzung importierter/vorhandener Beschriftungen beeinflusst und in der Regel hilfreicher gemacht.
Voraussetzung 1: Berechtigung zum „Überprüfen und Kommentieren “.
Voraussetzung 2: Importierte Liste von Beschriftungsnamen.
Optional, aber dringend empfohlen: Importierte Liste von Beschriftungsbeschreibungen.
Sobald das ursprüngliche Modell automatisch unter Verwendung von Beschriftungsnamen und Beschreibungen als Trainingseingabe trainiert wurde, werden Vorhersagen für viele der Nachrichten im Dataset angezeigt.
Diese Vorhersagen funktionieren auf genau die gleiche Weise wie zuvor – sie werden nur ohne Trainingsdaten generiert.
Wenn Sie die Stimmungsanalyse mit Beschriftung aktiviert haben, haben anfängliche Vorhersagen entweder eine positive oder eine negative Stimmung (verschiedene Grün-/Rotschattierungen je nach Konfidenzniveau).
Assisted Annotating funktioniert in jedem Trainingsbatch oder Modus, aber am effektivsten ist die Verwendung in „Shuffle“ und „Teach Label“ (folgen Sie den regulären Schritten für Anmerkungen in jedem Trainingsbatch in Trainieren oder Erkunden).
Assisted Annotating kann die zweite Phase des Modelltrainingsprozesses erheblich beschleunigen, indem automatisch Vorhersagen für jede Beschriftung mit ausreichend Kontext generiert werden, ohne dass Trainingsbeispiele erforderlich sind.
Anfängliche Vorhersagen werden von der Qualität der Bezeichnungsnamen und Beschreibungen in natürlicher Sprache abhängen (d. h vage Namen können zu vage oder minimale Vorhersagen führen). Detaillierte Beschriftungsbeschreibungen können die Leistung des ursprünglichen Modells steigern.
Wenn Sie Ihr Dataset weiter trainieren, verwendet die Plattform sowohl die Bezeichnungsnamen und Beschreibungen als auch Ihre angehefteten Beispiele, um relevante Bezeichnungsvorhersagen zu generieren.
Diese werden mit mehr Training weiter verbessert und basieren letzten Endes nur auf kommentierten Trainingsbeispielen, wenn genügend zur Verfügung gestellt wurde.
Assisted Annotating erfordert immer noch überwachtes Lernen durch Akzeptieren/Ablehnung der Vorhersagen, aber es beschleunigt den zeitaufwändigsten Teil des Modelltrainings, indem bessere Vorhersagen mit null oder sehr wenigen fixierten Beispielen bereitgestellt werden.