- Einleitung
- Einrichten Ihres Kontos
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Allgemeine Felder
- Beschriftungen (Vorhersagen, Konfidenzniveaus, Beschriftungshierarchie und Beschriftungsstimmung)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Nachrichten mit und ohne Anmerkungen
- Extraktionsfelder
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Zugriffssteuerung und Administration
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Erstellen oder Löschen einer Datenquelle in der GUI
- Hochladen einer CSV-Datei in eine Quelle
- Vorbereiten von Daten für den CSV-Upload
- Ein Dataset wird erstellt
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern der Dataset-Einstellungen
- Löschen einer Nachricht
- Löschen eines Datasets
- Exportieren eines Datasets
- Verwenden von Exchange-Integrationen
- Modelltraining und -wartung
- Grundlegendes zu Beschriftungen, allgemeinen Feldern und Metadaten
- Beschriftungshierarchie und Best Practices
- Vergleichen von Anwendungsfällen für Analyse und Automatisierung
- Konvertieren Ihrer Ziele in Bezeichnungen
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung
- Der Status des Datasets
- Best Practice für Modelltraining und Anmerkungen
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Training von Chat- und Anrufdaten
- Grundlegendes zu Datenanforderungen
- Trainieren
- Einführung in Verfeinerung
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- So funktioniert die Validierung
- Verstehen und Verbessern der Modellleistung
- Gründe für die geringe durchschnittliche Beschriftungsgenauigkeit
- Training mit Beschriftung „Überprüfen“ und Beschriftung „Verpasst“.
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Abgleichs und Verwendung des Abgleichs
- Wann das Training Ihres Modells beendet werden soll
- Anheften und Taggen einer Modellversion
- Löschen eines angehefteten Modells
- Hinzufügen neuer Bezeichnungen zu vorhandenen Taxonomien
- Verwalten eines Modells in der Produktion
- Modell-Rollback
- Verwenden von allgemeinen Feldern
- Generative Extraktion
- Verwenden von Analyse und Überwachung
- Automations and Communications Mining™
- Entwickler (Developer)
- Verwenden der API
- API-Tutorial
- Quellen
- Datasets
- Anmerkungen
- Anhänge (Attachments)
- Vorhersagen
- Erstellen Sie einen Stream
- Aktualisieren Sie einen Stream
- Rufen Sie einen Stream nach Namen ab
- Rufen Sie alle Streams ab
- Löschen Sie einen Stream
- Ergebnisse aus Stream abrufen
- Kommentare aus einem Stream abrufen (Legacy)
- Bringen Sie einen Stream vor
- Einen Stream zurücksetzen
- Kennzeichnen Sie eine Ausnahme
- Entfernen Sie das Tag einer Ausnahme
- Prüfungsereignisse
- Alle Benutzer abrufen
- Hochladen von Daten
- Herunterladen von Daten
- Exchange Integration mit einem Azure-Dienstbenutzer
- Exchange-Integration mit der Azure-Anwendungsauthentifizierung
- Exchange-Integration mit Azure Application Authentication und Graph
- Abrufen von Daten für Tableau mit Python
- Elasticsearch-Integration
- Allgemeine Feldextraktion
- Selbst gehostete Exchange-Integration
- UiPath® Automatisierungs-Framework
- Offizielle UiPath®-Aktivitäten
- Wie Maschinen lernen, Wörter zu verstehen: eine Anleitung zu Einbettungen in NLP
- Eingabeaufforderungsbasiertes Lernen mit Transformers
- Ef Robots II: Wissensdegesterration und Feinabstimmung
- Effiziente Transformer I: Warnmechanismen
- Tief hierarchische, nicht überwachte Absichtsmodellierung: Nutzen ohne Trainingsdaten
- Beheben von Anmerkungsverzerrungen mit Communications Mining™
- Aktives Lernen: Bessere ML-Modelle in weniger Zeit
- Auf Zahlen kommt es an – Bewertung der Modellleistung mit Metriken
- Darum ist Modellvalidierung wichtig
- Vergleich von Communications Mining™ und Google AutoML für Conversation Data Intelligence
- Lizenzierung
- Häufige Fragen und mehr

Communications Mining-Benutzerhandbuch
Das Erstellen eines geeigneten Modells für die Bereitstellung in einer Produktionsumgebung erfordert einen Zeitaufwand, der durch den Wert laufender Analysen und Effizienzeinsparungen durch Automatisierung schnell amortisiert wird.
Wenn Sie ein Modell im Laufe der Zeit nicht effektiv warten, können seine Vorteile verschwinden, da die Modellleistung ohne regelmäßiges Training nachlassen könnte.
Das ist auf die Konzeptabweichung zurückzuführen, die sich auf die Situation bezieht, dass sich die Konzepte, die ein Modell vorherzusagen versucht, im Laufe der Zeit auf unvorhergesehene Weise ändern können, wodurch Vorhersagen immer weniger genau werden.
Dies bezieht sich im Wesentlichen darauf, wie sich die Dinge in einem Unternehmen im Laufe der Zeit ändern können und wie es intern, mit anderen Unternehmen und mit seinen Kunden kommuniziert. Wenn die Trainingsdaten Ihres Modells nicht mehr repräsentativ für die heutige Umgebung Ihres Unternehmens sind, wird die Leistung schlechter, wenn Sie versuchen, Konzepte in Ihren Kommunikationsdaten zu identifizieren.
Die Pflege eines Produktionsmodells ist ein einfacher Prozess mit wenig Aufwand. Der Großteil des erforderlichen Aufwands wurde bereits aufgewendet, um die Trainingsdaten für Ihr Modell zu erstellen, bevor es bereitgestellt wird.
Es gibt zwei Hauptansätze zum Verwalten eines Modells, die beide sicherstellen, dass Ihr Modell mit zusätzlichen hilfreichen und repräsentativen Trainingsbeispielen ausgestattet ist:
- Ausnahmetraining
- Verwenden des Neuausgleichsmodus
1. Ausnahmetraining
Jedes Modell, das für Automatisierungszwecke verwendet wird, sollte über einen Ausnahmeprozess verfügen, der identifiziert, welche Nachrichten Ausnahmen waren, die die Plattform nicht sicher oder korrekt identifizieren konnte. Weitere Informationen finden Sie unter Echtzeit-Automatisierung.
Dies ist wichtig, da es Ihnen im Wesentlichen ermöglicht, die Nachrichten, mit denen die Plattform zu tun hatte, schnell zu finden und zu kommentieren, wodurch die Fähigkeit des Modells verbessert wird, zukünftige ähnliche Nachrichten vorherzusagen.
Ein Automatisierungsprozess wird eingerichtet, um Nachrichten automatisch mit einer Benutzereigenschaft zu kennzeichnen, die sie als Ausnahme identifiziert. Sie können dann in Explore nach diesen Nachrichten filtern und sie mit den richtigen Beschriftungen anmerken, um sicherzustellen, dass die Plattform in Zukunft ähnliche Nachrichten sicher und korrekt identifizieren kann.
Dies sollte Teil eines regulären Prozesses sein, der auf die konsistente Verbesserung des Modells abzielt. Je mehr Ausnahmen erfasst und mit Anmerkungen versehen werden, desto besser wird ein Modell im Laufe der Zeit funktionieren. Dadurch wird die Anzahl zukünftiger Ausnahmen minimiert und die Effizienzeinsparungen eines auf die Automatisierung ausgerichteten Modells maximiert.
2. Verwenden des Modus „Ausgleich“ und „Neuausgleich“.
Die Ausgewogenheitsbewertung Ihres Modells ist eine Komponente von seiner Modellbewertung. Dies spiegelt wider, wie ähnlich bzw. repräsentativ die Markierungsdaten Ihres Modells für das Dataset als Ganzes sind.
Theoretisch ist es, wenn sich die neuesten Daten, die einem Dataset im Laufe der Zeit hinzugefügt werden, erheblich von den älteren Daten unterscheiden, die zum Trainieren des Modells verwendet wurden, dann würde dies zu einem Drop des Ähnlichkeitswerts führen, der die Ausgewogenheitsbewertung Ihres Modells bestimmt.
Beim Ausnahmetraining ist es wichtig zu überprüfen, ob der Ähnlichkeitswert für das Modell sinkt. Wenn das der Fall ist, sollte dies behoben werden, da es ein Hinweis auf eine Konzeptabweichung sein könnte und die Leistung in der Produktion letztlich sinken wird.
Die einfachste Möglichkeit, einen Drop im Ähnlichkeitswert zu korrigieren, besteht darin, ein Training mit dem Neuausgleichsmodus durchzuführen.
Um sicherzustellen, dass Sie die neuesten Daten trainieren, die für die Art der Kommunikation repräsentativ sind, die heute empfangen wird, können Sie während des Trainings in Reausgleich auch einen Zeitstempelfilter hinzufügen, entweder zu den letzten 3 oder 6 Monaten. Dadurch wird sichergestellt, dass Ihr Modell nicht ausschließlich auf alten Trainingsdaten basiert und möglicherweise keine Änderungen in Ihrem Unternehmen widerspiegelt.