- Erste Schritte
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Allgemeine Felder (früher Entitäten)
- Bezeichnungen (Vorhersagen, Konfidenzniveaus, Hierarchie usw.)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Überprüfte und nicht überprüfte Nachrichten
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Verwaltung
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Create or delete a data source in the GUI
- Hochladen einer CSV-Datei in eine Quelle
- Vorbereiten von Daten für den CSV-Upload
- Ein neues Dataset erstellen
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern Sie die Einstellungen eines Datasets
- Löschen Sie Nachrichten über die Benutzeroberfläche
- Löschen Sie ein Dataset
- Exportieren Sie ein Dataset
- Verwenden von Exchange-Integrationen
- Modelltraining und -wartung
- Verstehen von Beschriftungen, allgemeinen Feldern und Metadaten
- Bezeichnungshierarchie und bewährte Methode
- Definieren Ihrer Taxonomieziele
- Analyse- vs. Automatisierungsanwendungsfälle
- Konvertieren Ihrer Ziele in Bezeichnungen
- Erstellen Ihrer Taxonomiestruktur
- Best Practices für den Taxonomieentwurf
- Ihre Taxonomie wird importiert
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung (NEU)
- Der Status des Datasets
- Best Practice für Modelltraining und Anmerkungen
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Grundlegendes zu Datenanforderungen
- Trainieren
- Einführung in Verfeinerung
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- Wie funktioniert die Validierung?
- Verstehen und Verbessern der Modellleistung
- Warum kann eine Bezeichnung eine geringe durchschnittliche Genauigkeit haben?
- Training mit Beschriftung „Überprüfen“ und Beschriftung „Verpasst“.
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Abgleichs und Verwendung des Abgleichs
- Wann das Training Ihres Modells beendet werden soll
- Verwenden von allgemeinen Feldern
- Generative Extraktion
- Verwenden von Analyse und Überwachung
- Automatisierungs- und Communications Mining
- Lizenzierungsinformationen
- Häufige Fragen und mehr
Communications Mining-Benutzerhandbuch
Vorbereiten von Daten für den CSV-Upload
Benutzerberechtigungen erforderlich: „Sources admin“ UND „Nachrichten bearbeiten“.
Sie können Anweisungen zum Hochladen von Daten aus einer CSV-Datei hier zusammen mit häufigen Fehlermeldungen, die in der Plattform auftreten können.
Vor dem Hochladen von Daten in Communications Mining müssen einige Faktoren berücksichtigt werden, wenn die Daten vorbereitet werden, die von der Plattform erfasst werden sollen.
Stellen Sie sicher, dass Sie eine CSV-Datei hochladen und nicht in einer Excel-Datei sein.
Wenn Sie die CSV-Datei in Excel geöffnet und Änderungen vorgenommen haben, kann dies zu Formatierungsproblemen führen, die möglicherweise Probleme zum Zeitpunkt des Hochladens verursachen. Um dies zu vermeiden, stellen Sie sicher, dass alle Aktualisierungen in der CSV-Datei erfolgen direkt.
Überprüfen Sie außerdem auf Folgendes, bevor Sie Ihre CSV-Datei hochladen in die Plattform, um Fehler beim Hochladen oder Probleme mit der Datenqualität zu vermeiden, die sich negativ auf die Qualität der Modellleistung auswirken:
Element | Beschreibung |
Doppelte Zeilen | Dieselben Daten werden im gesamten Datenextrakt mehrmals wiederholt |
Header stimmen nicht überein | Die falschen Header werden auf die falschen Datenfelder ausgerichtet |
Hängende Zeilen oder Spalten | Nicht alle Daten sind in sequenziellen Zeilen enthalten
Beispiel: Alle Meldungen in Zeile 1 bis 10.000, aber eine Zeile mit einer Zelle mit Daten in Zeile 19.999. |
Inkonsistente Datumsformatierung | Unterschiedliche Zeilen mit inkonsistenten Datumsformaten
Beispiel: Eine Reihe von Nachrichten im US-Datumsformat und eine Reihe von Nachrichten im EU-Datumsformat, alle im selben Dataset, da dies Probleme bei der Normalisierung im Downstream haben wird. |
Inkhärente Sätze | Das sind Sätze, die eine Auswahl von Wörtern ohne klare Syntax- oder Semantikstruktur enthalten
Beispiel: „Der Benutzer fordert ein neues portierbares Ticket 28442 298 an, das erstellt werden soll“ |
Inkonsistente Abstände | Wenn zwischen Wörtern eine unregelmäßige Anzahl von Leerzeichen vorhanden ist.
Beispiel: anstatt „Die Richtlinie ist auf Erneuerung festgelegt“ |
Pausen in Wörtern | Wenn es in der Mitte eines Wortes Umbrüche gibt, die nicht vorhanden sein sollten.
Beispiel: Die Richtlinie ist festgelegt. zu verlängern“ anstelle von „Die Richtlinie ist auf Verlängerung festgelegt“ |
Fehlerhafte Zeichencodierung | Wenn Textdaten nicht richtig codiert sind, führt dies zu unlesbaren oder unlesbaren Zeichen.
Beispiel: „Thread åpp is gélöt“ statt „Die App ist großartig.“ |
Leere Nachrichten | Kommunikationen ohne Inhalt im Betreff/Text |
Nachrichten mit vielen Tippfehlern | Textdaten mit vielen Fehlern in der Rechtschreibung |
Header/Fußzeilen | Wenn Header oder Fußzeilen enthalten sind
Beispiele: Spam-Warnungen, Virenscan-Warnungen usw. |
Metadaten im Betreff/Textkörper anstatt als Metadateneigenschaft enthalten | Wenn Metadaten im Betreff oder Text enthalten sind
Beispiel: „[01/01/2023] Ich möchte meine Richtlinie erneuern“ als Text einer Nachricht, anstatt „Ich möchte meine Richtlinie erneuern“ als Nachricht mit dem Datum „01/01/2023“. die Metadaten. |
Mehrere Nachrichten in einer Nachricht kombiniert | Wenn es mehrere Nachrichten gibt, die in einem Thread in separate Nachrichten aufgeteilt und in einer einzigen Kommunikation kombiniert werden sollten. |