- Erste Schritte
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Entitäten
- Bezeichnungen (Vorhersagen, Konfidenzniveaus, Hierarchie usw.)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Überprüfte und nicht überprüfte Nachrichten
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Verwaltung
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Erstellen Sie eine Datenquelle in der GUI
- Hochladen einer CSV-Datei in eine Quelle
- Ein neues Dataset erstellen
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern Sie die Einstellungen eines Datasets
- Löschen Sie Nachrichten über die Benutzeroberfläche
- Löschen Sie ein Dataset
- Exportieren Sie ein Dataset
- Verwenden von Exchange-Integrationen
- Vorbereiten von Daten für den CSV-Upload
- Modelltraining und -wartung
- Verstehen von Bezeichnungen, Entitäten und Metadaten
- Bezeichnungshierarchie und bewährte Methode
- Definieren Ihrer Taxonomieziele
- Analyse- vs. Automatisierungsanwendungsfälle
- Konvertieren Ihrer Ziele in Bezeichnungen
- Erstellen Ihrer Taxonomiestruktur
- Best Practices für den Taxonomieentwurf
- Ihre Taxonomie wird importiert
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung (NEU)
- Verstehen des Status Ihres Datasets
- Best Practice für Modelltraining und Beschriftung
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Trainieren
- Einführung zu „Verfeinern“
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- Wie funktioniert die Validierung?
- Verstehen und Verbessern der Modellleistung
- Warum kann eine Bezeichnung eine geringe durchschnittliche Genauigkeit haben?
- Training mit „Bezeichnung überprüfen“ und „Bezeichnung fehlen“
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Ausgleichs und Verwendung von „Neuausgleich“
- Wann das Training Ihres Modells beendet werden soll
- Definieren und Einrichten Ihrer Entitäten
- Grundlegendes zu Entitäten
- Welche vortrainierten Entitäten sind verfügbar?
- Aktivieren, Deaktivieren, Aktualisieren und Erstellen von Entitäten
- Entitätsfilterung
- Überprüfen und Anwenden von Entitäten
- Validierung für Entitäten
- Verbesserung der Entitätsleistung
- Erstellen von benutzerdefinierten Regex-Entitäten
- Verwenden von Analytics & Monitoring
- Automatisierungs- und Communications Mining
- Häufige Fragen und mehr
Training mit „Niedriger Konfidenz“
Benutzerberechtigungen erforderlich: „Quellen anzeigen“ UND „Überprüfen und Beschriften“.
Der letzte wichtige Schritt beim Erkunden ist das Training im Modus „Niedrige Konfidenz“, der Ihnen Meldungen anzeigt, die von informativen Bezeichnungsvorhersagen nicht gut abgedeckt werden. Diese Nachrichten haben entweder keine Vorhersagen oder Vorhersagen mit sehr geringer Konfidenz für Beschriftungen, die die Plattform als informativ versteht.
'Informative Bezeichnungen ' sind solche Bezeichnungen, die die Plattform als nützlich als eigenständige Bezeichnungen versteht, indem sie betrachtet, wie häufig sie mit anderen Bezeichnungen zugewiesen werden.
Dies ist ein sehr wichtiger Schritt zur Verbesserung der Gesamtabdeckung Ihres Modells. Wenn Sie Nachrichten sehen, für die vorhandene Beschriftungen vorhergesagt werden sollten, ist dies ein Zeichen, dass Sie für diese Beschriftungen mehr Training absolvieren müssen . Wenn Sie relevante Meldungen sehen, für die keine aktuelle Beschriftung gilt, möchtenSiemöglicherweise neue Beschriftungen erstellen , um sie zu erfassen.
Sie können Nachrichten in diesem Modus auf die gleiche Weise wie in jedem anderen Erkundungsmodus Beschriftungen zuweisen.
Um auf diesen Modus zuzugreifen, verwenden Sie die Dropdownliste in der oberen linken Ecke der Seite Erkunden:
Wie viel Training sollte ich für diesen Schritt durchführen?
In diesem Modus werden Ihnen 20 Meldungen gleichzeitig angezeigt. Sie sollten in diesem Modus eine angemessene Menge an Training durchführen, indem Sie mehrere Seiten mit Meldungen durchgehen und die richtigen Bezeichnungen anwenden, um die Abdeckung des Modells zu erhöhen (eine detaillierte Erklärung finden Sie hier ). der Abdeckung).
Der Gesamtumfang des Trainings, das Sie bei „Niedrige Konfidenz“ absolvieren müssen, hängt von verschiedenen Faktoren ab:
- Die Menge des Trainings, das Sie in Mischen und Lernen abgeschlossenhaben – Je mehr Training Sie in Mischen und Lernen durchführen, desto mehr sollte Ihr Trainingssatz eine repräsentative Stichprobe des Datasets als Ganzes sein, und desto weniger relevante Meldungen sollten in „Niedrige Konfidenz“ vorhanden sein.
- Der Zweck des Datasets – Wenn das Dataset für die Automatisierung verwendet werden soll und eine sehr hohe Abdeckung erfordert, sollten Sie einen größeren Teil des Trainings mit „Geringer Konfidenz“ durchführen, um die verschiedenen Randfälle für jede Bezeichnung zu identifizieren
Mindestens fünf Seiten mit Nachrichten in diesem Modus sollten Sie beschriften. Später in der Verfeinerungsphase , wenn Sie Ihre Abdeckung überprüfen, stellen Sie möglicherweise fest, dass Sie weitere Trainings mit „Geringer Konfidenz“ durchführen müssen, um Ihre Abdeckung weiter zu verbessern.