- Erste Schritte
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Allgemeine Felder (früher Entitäten)
- Bezeichnungen (Vorhersagen, Konfidenzniveaus, Hierarchie usw.)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Überprüfte und nicht überprüfte Nachrichten
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Verwaltung
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Erstellen Sie eine Datenquelle in der GUI
- Hochladen einer CSV-Datei in eine Quelle
- Ein neues Dataset erstellen
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern Sie die Einstellungen eines Datasets
- Löschen Sie Nachrichten über die Benutzeroberfläche
- Löschen Sie ein Dataset
- Löschen Sie eine Quelle
- Exportieren Sie ein Dataset
- Verwenden von Exchange-Integrationen
- Vorbereiten von Daten für den CSV-Upload
- Modelltraining und -wartung
- Verstehen von Beschriftungen, allgemeinen Feldern und Metadaten
- Bezeichnungshierarchie und bewährte Methode
- Definieren Ihrer Taxonomieziele
- Analyse- vs. Automatisierungsanwendungsfälle
- Konvertieren Ihrer Ziele in Bezeichnungen
- Erstellen Ihrer Taxonomiestruktur
- Best Practices für den Taxonomieentwurf
- Ihre Taxonomie wird importiert
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung (NEU)
- Verstehen des Status Ihres Datasets
- Best Practice für Modelltraining und Anmerkungen
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Trainieren
- Einführung in Verfeinerung
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- Wie funktioniert die Validierung?
- Verstehen und Verbessern der Modellleistung
- Warum kann eine Bezeichnung eine geringe durchschnittliche Genauigkeit haben?
- Training mit Beschriftung „Überprüfen“ und Beschriftung „Verpasst“.
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Abgleichs und Verwendung des Abgleichs
- Wann das Training Ihres Modells beendet werden soll
- Verwenden von allgemeinen Feldern
- Generative Extraktion
- Verwenden von Analyse und Überwachung
- Automatisierungs- und Communications Mining
- Lizenzierungsinformationen
- Häufige Fragen und mehr
Erstellen Ihrer Taxonomiestruktur
Einer der grundlegendsten Faktoren, die bestimmen,wie gut Ihr Modell funktioniert und wie gut es Ihre Geschäftsziele erfüllt, ist die Struktur Ihrer Taxonomie, einschließlich der Informationen, die von den einzelnen Bezeichnungen erfasst werden.
Es ist daher wichtig, dass Sie vor dem Modelltraining über Ihre Zieltaxonomiestruktur denken. Allerdings sollten Sie über ein gewisses Maß an Flexibilität verfügen, um es im Verlauf des Trainings (nach Bedarf) anzupassen, zu erweitern und zu verbessern. Das nennen wir den „datengestützten“ Trainingsansatz.
Letztendlich sollten die Beschriftungen in der Taxonomie und die für jede Beschriftung bereitgestellten Trainingsbeispiele eine genaue und ausgewogene Darstellung des Datasets als Ganzes erzeugen. Jede Beschriftung sollte aber auch nützlich sein, indem sie in irgendeiner Weise die Nachrichten eindeutig darstellt, für die sie vorhergesagt wird.
Wenn Beschriftungen verwendet werden, um sehr umfassende, vage oder unklare Konzepte zu erfassen, ist die Wahrscheinlichkeit nicht nur höher, dass sie schlecht funktionieren, sondern es ist auch weniger wahrscheinlich, dass sie einen Geschäftswert bieten. Dies kann nützliche Einblicke in dieses Konzept geben oder dazu beitragen, dass ein Prozess im Anschluss vollständig oder teilweise automatisiert wird.
Dies ist ein Beispiel für eine Taxonomie auf hoher Ebene mit typischen Bezeichnungen, die für verschiedene Anwendungsfälle/Branchen anwendbar sind. Nicht alle davon sind auf Ihr Modell anwendbar.
Um dies in einen Kontext zu bringen, stellen Sie sich ein Beispiel aus einem echten Anwendungsfall vor:
Ein Unternehmen erhält jedes Jahr Millionen von E-Mails von Kunden in verschiedenen Posteingängen zu einer Vielzahl von Problemen, Fragen, Vorschlägen, Ansprüchen usw.
Dieses Unternehmen beschließt, seine betriebliche Effizienz, Prozessstandardisierung und Transparenz über die Vorgänge in seinem Unternehmen zu erhöhen, indem es diese E-Mails von Kunden automatisch in Workflow-Tickets umwandelt. Diese können dann mithilfe bestimmter Prozesse und innerhalb festgelegter Zeitpläne nachverfolgt und bearbeitet werden.
Dazu entscheiden sie sich dafür, die Plattform zu verwenden, um diese eingehende, unstrukturierte Kommunikation zu interpretieren und eine Klassifizierung in Bezug auf den Prozess und Unterprozess bereitzustellen, auf den sich die E-Mail bezieht. Diese Klassifizierung wird verwendet, um das Workflow-Ticket zu aktualisieren, das automatisch mit einem Automatisierungsdienst erstellt wird, und sicherzustellen, dass es an das richtige Team oder die richtige Person weitergeleitet wird.
Um sicherzustellen, dass dieser Anwendungsfall so erfolgreich wie möglich ist und um die Anzahl der Ausnahmen zu minimieren (falsche Klassifizierungen oder E-Mails, die die Plattform nicht sicher klassifizieren kann), sollte jede eingehende E-Mail eine sichere Vorhersage erhalten, die ein übergeordnetes Label und ein übergeordnetes Element hat eine untergeordnete Bezeichnung, d. h. [Prozess X] > [Unterprozess Y].
Da das Ziel darin besteht, jede eingehende E-Mail mit einem [Prozess] und [Unterprozess] zu klassifizieren, sollte jede Beschriftung in der Taxonomie diesem Format entsprechen:
In diesem Anwendungsfall könnte jede E-Mail, die keine sichere Vorhersage sowohl für eine übergeordnete als auch für eine untergeordnete Beschriftung enthält, eine Ausnahme sein, die zur manuellen Überprüfung und Ticketerstellung gesendet wird. Wenn er jedoch eine hochkonfidente Vorhersage der übergeordneten Bezeichnung, aber keine sichere Vorhersage der untergeordneten Bezeichnung hat, könnte dies dennoch verwendet werden, um die E-Mail teilweise weiterzuleiten oder ein Ticket zu erstellen, mit etwas zusätzlicher manueller Arbeit, um den relevanten Unterprozess hinzuzufügen.
Wenn wir uns vorstellen, dass Ersteres der Fall ist und jede E-Mail ohne eine Vorhersage mit hoher Konfidenz in Form von [Prozess] > [Unterprozess] zu einer manuellen Ausnahme wird, möchten wir sicherstellen, dass alle Beispiele, die wir für jede Bezeichnung angeben, wenn zum Trainieren des Modells dieses Format widerspiegeln.
Jede übergeordnete Bezeichnung in der Taxonomie sollte sich auf einen breiten Prozess beziehen, der für den Inhalt in den E-Mails relevant ist, z. B 'Rechnungsstellung '. Jede untergeordnete Bezeichnung sollte dann ein spezifischerer Unterprozess sein, der sich unter einer übergeordneten Bezeichnung befindet, z. B „Rechnungsstellung“ > „ Statusabfrage“.
Denken Sie daran, dass es wichtig ist, dass jede Bezeichnung eindeutig ist, was sie erfassen möchte. Sehr breite Beschriftungen wie „Allgemeine Abfrage“ oder „Alles andere“ können sehr nicht hilfreich sein , wenn viele verschiedene, unterschiedliche Themen zusammengeführt werden und kein klares Muster oder Gemeinsamkeit zwischen den angehefteten Beispielen besteht.
In diesem Anwendungsfall würden sie auch keinen großen Geschäftswert bieten, wenn ein Workflow-Ticket erstellt und als „Allgemeine Abfrage“ oder „Alles andere“ klassifiziert wurde. Dennoch muss jemand sie sorgfältig lesen, um zu verstehen, worum es geht und ob es für das eigene Team relevant ist, bevor Maßnahmen ergriffen werden können.
Dadurch wird der Nutzen der Zeitersparnis zunichte gemacht und das Unternehmen hätte keine nützliche Informationen darüber, welche Arbeit tatsächlich von den Teams erledigt wurde.
Hinweis: Dies ist nur ein Beispiel dafür, wie Sie eine Taxonomie für einen bestimmten Anwendungsfall strukturieren können. Es handelt sich nicht um einen universellen Ansatz. Jedes Projekt erfordert eine eindeutige Taxonomie von Bezeichnungen, die stark von Ihrem spezifischen Anwendungsfall, Dataset und Ihren Zielen abhängt.