- Einleitung
- Einrichten Ihres Kontos
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Allgemeine Felder
- Beschriftungen (Vorhersagen, Konfidenzniveaus, Beschriftungshierarchie und Beschriftungsstimmung)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Nachrichten mit und ohne Anmerkungen
- Extraktionsfelder
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Zugriffssteuerung und Administration
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Erstellen oder Löschen einer Datenquelle in der GUI
- Hochladen einer CSV-Datei in eine Quelle
- Vorbereiten von Daten für den CSV-Upload
- Ein Dataset wird erstellt
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern der Dataset-Einstellungen
- Löschen einer Nachricht
- Löschen eines Datasets
- Exportieren eines Datasets
- Verwenden von Exchange-Integrationen
- Modelltraining und -wartung
- Grundlegendes zu Beschriftungen, allgemeinen Feldern und Metadaten
- Beschriftungshierarchie und Best Practices
- Best Practices für den Taxonomieentwurf
- Definieren von Taxonomiezielen
- Erstellen der Taxonomiestruktur
- Importieren der Taxonomie
- Vergleichen von Anwendungsfällen für Analyse und Automatisierung
- Konvertieren Ihrer Ziele in Bezeichnungen
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung
- Der Status des Datasets
- Best Practice für Modelltraining und Anmerkungen
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Grundlegendes zu Datenanforderungen
- Trainieren
- Einführung in Verfeinerung
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- So funktioniert die Validierung
- Verstehen und Verbessern der Modellleistung
- Gründe für die geringe durchschnittliche Beschriftungsgenauigkeit
- Training mit Beschriftung „Überprüfen“ und Beschriftung „Verpasst“.
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Abgleichs und Verwendung des Abgleichs
- Wann das Training Ihres Modells beendet werden soll
- Verwenden von allgemeinen Feldern
- Generative Extraktion
- Verwenden von Analyse und Überwachung
- Automations and Communications Mining™
- Entwickler (Developer)
- Verwenden der API
- API-Tutorial
- Quellen
- Datasets
- Anmerkungen
- Anhänge (Attachments)
- Vorhersagen
- Erstellen Sie einen Stream
- Aktualisieren Sie einen Stream
- Rufen Sie einen Stream nach Namen ab
- Rufen Sie alle Streams ab
- Löschen Sie einen Stream
- Ergebnisse aus Stream abrufen
- Kommentare aus einem Stream abrufen (Legacy)
- Bringen Sie einen Stream vor
- Einen Stream zurücksetzen
- Kennzeichnen Sie eine Ausnahme
- Entfernen Sie das Tag einer Ausnahme
- Prüfungsereignisse
- Alle Benutzer abrufen
- Hochladen von Daten
- Herunterladen von Daten
- Exchange Integration mit einem Azure-Dienstbenutzer
- Exchange-Integration mit der Azure-Anwendungsauthentifizierung
- Exchange-Integration mit Azure Application Authentication und Graph
- Abrufen von Daten für Tableau mit Python
- Elasticsearch-Integration
- Allgemeine Feldextraktion
- Selbst gehostete Exchange-Integration
- UiPath® Automatisierungs-Framework
- Offizielle UiPath®-Aktivitäten
- Wie Maschinen lernen, Wörter zu verstehen: eine Anleitung zu Einbettungen in NLP
- Eingabeaufforderungsbasiertes Lernen mit Transformers
- Ef Robots II: Wissensdegesterration und Feinabstimmung
- Effiziente Transformer I: Warnmechanismen
- Tief hierarchische, nicht überwachte Absichtsmodellierung: Nutzen ohne Trainingsdaten
- Beheben von Anmerkungsverzerrungen mit Communications Mining™
- Aktives Lernen: Bessere ML-Modelle in weniger Zeit
- Auf Zahlen kommt es an – Bewertung der Modellleistung mit Metriken
- Darum ist Modellvalidierung wichtig
- Vergleich von Communications Mining™ und Google AutoML für Conversation Data Intelligence
- Lizenzierung
- Häufige Fragen und mehr

Communications Mining-Benutzerhandbuch
Einer der grundlegendsten Faktoren, die bestimmen, wie gut Ihr Modell funktioniert und wie gut es Ihre Geschäftsziele erfüllt, ist die Struktur Ihrer Taxonomie, einschließlich dem, was von den einzelnen Beschriftungen erfasst wird.
Daher ist es wichtig, dass Sie sich vor dem Modelltraining über Ihre Zieltaxonomiestruktur Gedanken machen. Allerdings sollten Sie ein gewisses Maß an Flexibilität haben, um es im Laufe des Trainings nach Bedarf anzupassen, zu erweitern und zu verbessern. Dies nennen wir den datengestützten Trainingsansatz.
Letztendlich sollten die Beschriftungen in der Taxonomie und die für jede Beschriftung bereitgestellten Trainingsbeispiele eine genaue und ausgewogene Darstellung des Datasets als Ganzes erzeugen. Jede Beschriftung sollte aber auch nützlich sein, indem sie in irgendeiner Weise die Nachrichten, für die sie vorhergesagt wird, eindeutig darstellen.
Wenn Beschriftungen verwendet werden, um sehr umfassende, vage oder unklare Konzepte zu erfassen, ist die Wahrscheinlichkeit nicht nur höher, dass sie schlecht funktionieren, sondern es ist auch weniger wahrscheinlich, dass sie einen Geschäftswert bieten. Dies kann nützliche Einblicke in dieses Konzept geben oder dazu beitragen, dass ein Prozess im Anschluss vollständig oder teilweise automatisiert wird.
Dies ist ein Beispiel für eine Taxonomie auf hoher Ebene mit typischen Beschriftungen, die für verschiedene Anwendungsfälle oder Branchen gelten. Nicht alle davon gelten für Ihr Modell.
Ein Unternehmen erhält jedes Jahr Millionen von E-Mails von Kunden in verschiedenen Posteingängen zu einer Vielzahl von Problemen, Fragen, Vorschlägen, Ansprüchen usw.
Dieses Unternehmen beschließt, seine betriebliche Effizienz, Prozessstandardisierung und Transparenz über die Vorgänge in seinem Unternehmen zu erhöhen, indem es diese E-Mails von Kunden automatisch in Workflow-Tickets umwandelt. Diese können dann mithilfe bestimmter Prozesse und innerhalb festgelegter Zeitpläne nachverfolgt und bearbeitet werden.
Dazu entscheiden sie sich dafür, die Plattform zu verwenden, um diese eingehende, unstrukturierte Kommunikation zu interpretieren und eine Klassifizierung in Bezug auf den Prozess und Unterprozess bereitzustellen, auf den sich die E-Mail bezieht. Diese Klassifizierung wird verwendet, um das Workflow-Ticket zu aktualisieren, das automatisch mit einem Automatisierungsdienst erstellt wird, und sicherzustellen, dass es an das richtige Team oder die richtige Person weitergeleitet wird.
Um sicherzustellen, dass dieser Anwendungsfall so erfolgreich wie möglich ist und um die Anzahl der Ausnahmen zu minimieren (falsche Klassifizierungen oder E-Mails, die die Plattform nicht sicher klassifizieren kann), sollte jede eingehende E-Mail eine sichere Vorhersage erhalten, die ein übergeordnetes Label und ein übergeordnetes Element hat eine untergeordnete Bezeichnung, d. h. [Prozess X] > [Unterprozess Y].
Da das Ziel darin besteht, jede eingehende E-Mail mit einem [Prozess] und [Unterprozess] zu klassifizieren, sollte jede Beschriftung in der Taxonomie diesem Format entsprechen:
In diesem Anwendungsfall könnte jede E-Mail, die keine sichere Vorhersage sowohl für eine übergeordnete als auch für eine untergeordnete Beschriftung enthält, eine Ausnahme sein, die zur manuellen Überprüfung und Ticketerstellung gesendet wird. Wenn er jedoch eine hochkonfidente Vorhersage der übergeordneten Bezeichnung, aber keine sichere Vorhersage der untergeordneten Bezeichnung hat, könnte dies dennoch verwendet werden, um die E-Mail teilweise weiterzuleiten oder ein Ticket zu erstellen, mit etwas zusätzlicher manueller Arbeit, um den relevanten Unterprozess hinzuzufügen.
Wenn wir uns vorstellen, dass Ersteres der Fall ist und jede E-Mail ohne eine Vorhersage mit hoher Konfidenz in Form von [Prozess] > [Unterprozess] zu einer manuellen Ausnahme wird, möchten wir sicherstellen, dass alle Beispiele, die wir für jede Bezeichnung angeben, wenn zum Trainieren des Modells dieses Format widerspiegeln.
Jede übergeordnete Beschriftung in der Taxonomie sollte sich auf einen umfassenden Prozess beziehen, der für den Inhalt in den E-Mails relevant ist, z. B. die Rechnungsstellung. Jede untergeordnete Beschriftung sollte dann ein spezifischerer Unterprozess sein, der sich unter einer übergeordneten Beschriftung befindet, z. B. Rechnungsstellung > Statusanfrage.
Sehr breite Beschriftungen wie Allgemeine Abfrage oder Alles andere können sehr nicht hilfreich sein, wenn viele verschiedene Themen zusammenfassen werden und es kein klares Muster oder Gemeinsames zwischen den angehefteten Beispielen gibt.
In diesem Anwendungsfall würden sie auch keinen großen Geschäftswert bieten, wenn ein Workflow-Ticket erstellt und als allgemeine Abfrage oder Alles andere klassifiziert wurde. Trotzdem muss jemand es sorgfältig lesen, um zu verstehen, worum es geht und ob es für sein Team relevant ist, bevor es in Maßnahmen ergriffen werden kann.
Dadurch wird der Nutzen der Zeitersparnis zunichte gemacht und das Unternehmen hätte keine nützliche Informationen darüber, welche Arbeit tatsächlich von den Teams erledigt wurde.