- Erste Schritte
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Allgemeine Felder (früher Entitäten)
- Bezeichnungen (Vorhersagen, Konfidenzniveaus, Hierarchie usw.)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Überprüfte und nicht überprüfte Nachrichten
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Verwaltung
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Create or delete a data source in the GUI
- Hochladen einer CSV-Datei in eine Quelle
- Vorbereiten von Daten für den CSV-Upload
- Ein neues Dataset erstellen
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern Sie die Einstellungen eines Datasets
- Löschen Sie Nachrichten über die Benutzeroberfläche
- Löschen Sie ein Dataset
- Exportieren Sie ein Dataset
- Verwenden von Exchange-Integrationen
- Modelltraining und -wartung
- Verstehen von Beschriftungen, allgemeinen Feldern und Metadaten
- Bezeichnungshierarchie und bewährte Methode
- Definieren Ihrer Taxonomieziele
- Analyse- vs. Automatisierungsanwendungsfälle
- Konvertieren Ihrer Ziele in Bezeichnungen
- Erstellen Ihrer Taxonomiestruktur
- Best Practices für den Taxonomieentwurf
- Ihre Taxonomie wird importiert
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung (NEU)
- Der Status des Datasets
- Best Practice für Modelltraining und Anmerkungen
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Grundlegendes zu Datenanforderungen
- Trainieren
- Einführung in Verfeinerung
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- Wie funktioniert die Validierung?
- Verstehen und Verbessern der Modellleistung
- Warum kann eine Bezeichnung eine geringe durchschnittliche Genauigkeit haben?
- Training mit Beschriftung „Überprüfen“ und Beschriftung „Verpasst“.
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Abgleichs und Verwendung des Abgleichs
- Wann das Training Ihres Modells beendet werden soll
- Verwenden von allgemeinen Feldern
- Generative Extraktion
- Verwenden von Analyse und Überwachung
- Automatisierungs- und Communications Mining
- Lizenzierungsinformationen
- Häufige Fragen und mehr
Communications Mining-Benutzerhandbuch
Der Status des Datasets
Jedes Mal, wenn Sie Beschriftungen anwenden oder allgemeine Felder in Ihrem Dataset überprüfen, wird Ihr Modell erneut trainiert und eine neue Modellversion erstellt. Weitere Informationen zur Verwendung verschiedener Modellversionen finden Sie hier.
Wenn das Modell erneut trainiert wird, nimmt es die neuesten Informationen, die es erhalten hat, und berechnet alle seine Vorhersagen im gesamten Dataset neu. Dieser Prozess beginnt, wenn Sie mit dem Training beginnen, und oft, wenn Communications Mining die Anwendung der Vorhersagen für eine Modellversion abschließt, werden die Vorhersagen bereits für eine neuere Modellversion neu berechnet. Wenn Sie das Training nach einer Weile beenden, wird Communications Mining in Kürze aufholen und die Vorhersagen anwenden, die das allerneueste Training widerspiegeln, das im Dataset abgeschlossen wurde.
Dieser Prozess kann je nach Umfang des abgeschlossenen Trainings, der Größe des Datasets und der Anzahl der Beschriftungen in der Taxonomie einige Zeit in Anspruch nehmen. Communications Mining verfügt über eine hilfreiche Statusfunktion, die Benutzern hilft zu verstehen, wann ihr Modell auf dem neuesten Stand ist oder ob es ein erneutes Training ist und wie lange das voraussichtlich dauern wird.
Wenn Sie sich in einem Dataset befinden, zeigt eines dieser beiden Symbole oben auf der Seite den aktuellen Status an:
Dieses Symbol gibt an, dass das Dataset auf dem neuesten Stand ist und die Vorhersagen aus der neuesten Modellversion angewendet wurden. | |
Dies weist darauf hin, dass das Modell erneut trainiert wird und die Vorhersagen möglicherweise nicht auf dem neuesten Stand sind. |
Wenn Sie mit der Maus über das Symbol fahren, werden weitere Details zum Status angezeigt, wie unten gezeigt:
- Modelltraining
Bei diesem Prozess wird die aktuelle Modellversion erneut trainiert, um eine neue zu erstellen, wobei alle aktuellen Änderungen wie Taxonomieaktualisierungen oder Datenanmerkungen berücksichtigt werden. Das Modelltraining ist im Allgemeinen schnell, wobei die Dauer von mehreren Faktoren abhängig sein kann
- Anwenden von Vorhersagen
Dieser Prozess findet nach dem Modelltraining statt, bei dem die Plattform Vorhersagen aus der trainierten Modellversion abruft und auf jede Nachricht anwendet. Das Anwenden von Vorhersagen ist in der Regel langsamer und die Dauer wird hauptsächlich von der Größe und Komplexität des Datasets beeinflusst.
- Komplexität der Taxonomie von Beschriftungen und Feldern
Auswirkung: Je mehr Beschriftungen und Felder in Ihrem Dataset vorhanden sind, desto länger dauert es, das Modell zu trainieren und Vorhersagen auf Nachrichten hinweg anzuwenden.
- Verwendung der generativen Extraktion
Auswirkungen: Generative Extraktion erfordert das Verständnis der komplexen Beziehungen zwischen Beschriftungen und Feldern, was ein größeres und leistungsstärkeres Modell erfordert, das das Training verlangsamen kann.
- Größe Ihres Datasets (Daten mit und ohne Anmerkungen)
Auswirkungen: Hohe Mengen an Nachrichten mit Anmerkungen erhöhen die Datenpunkte, die das Modell während des Trainings berücksichtigen muss, und verlängern den Prozess. Ebenso können große Mengen an Nachrichten ohne Anmerkungen die Zeit verlängern, die für das Anwenden von Vorhersagen erforderlich ist.
Hinweis: Vorhersagen werden angezeigt, sobald sie verfügbar sind, sodass Sie nicht warten müssen, bis die Anwendung mit Anmerkungen abgeschlossen ist. Die Plattform wechselt zum Anwenden von Vorhersagen aus der neuesten trainierten Modellversion, wenn sie trainiert wird, bevor die Vorhersagen der vorherigen Version vollständig sind. - Anzahl der Datasets, die gleichzeitig trainiert werden
Auswirkungen: Wenn mehrere Modelle gleichzeitig in Ihrer Communications Mining-Umgebung trainiert werden, kann dies zu vorübergehenden Verlangsamungen führen, da die Plattformlast die erforderlichen Dienste ausbalanciert.
- Wann Sie sich an den Support wenden können
- Training: Wenn keiner der oben genannten Gründe das langsame Training erklärt und es länger als 4 Stunden läuft, wenden Sie sich bitte an den Support.
- Anwenden von Vorhersagen: Bei großen und komplexen Datasets wird das Anwenden von Vorhersagen viel Zeit in Anspruch nehmen. Wenden Sie sich nur dann an den Support, wenn dieser Prozess für eine einzelne Modellversion länger als 24 Stunden läuft.
Hinweis: Dadurch sollten Datenanmerkungen nicht blockiert werden, da Sie immer von neuen Vorhersagen profitieren, sobald diese verfügbar werden
Wenn Ihr Modell nicht innerhalb einer Stunde nach Abschluss einer Aktion, die das Training auslösen soll (z. B. das Hinzufügen von Nachrichten mit Beschriftungen oder Feldern mit Anmerkungen), mit dem Training beginnt, wenden Sie sich bitte an den Support.
Überprüfen des Trainingsstatus: Sie können überprüfen, ob Ihr Modell trainiert wird, indem Sie den Dataset-Status in der oberen rechten Ecke einer beliebigen Seite innerhalb eines Datasets überprüfen