- Erste Schritte
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Entitäten
- Bezeichnungen (Vorhersagen, Konfidenzniveaus, Hierarchie usw.)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Überprüfte und nicht überprüfte Nachrichten
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Verwaltung
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Erstellen Sie eine Datenquelle in der GUI
- Hochladen einer CSV-Datei in eine Quelle
- Ein neues Dataset erstellen
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern Sie die Einstellungen eines Datasets
- Löschen Sie Nachrichten über die Benutzeroberfläche
- Löschen Sie ein Dataset
- Exportieren Sie ein Dataset
- Verwenden von Exchange-Integrationen
- Vorbereiten von Daten für den CSV-Upload
- Modelltraining und -wartung
- Verstehen von Bezeichnungen, Entitäten und Metadaten
- Bezeichnungshierarchie und bewährte Methode
- Definieren Ihrer Taxonomieziele
- Analyse- vs. Automatisierungsanwendungsfälle
- Konvertieren Ihrer Ziele in Bezeichnungen
- Erstellen Ihrer Taxonomiestruktur
- Best Practices für den Taxonomieentwurf
- Ihre Taxonomie wird importiert
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung (NEU)
- Verstehen des Status Ihres Datasets
- Best Practice für Modelltraining und Beschriftung
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Trainieren
- Einführung zu „Verfeinern“
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- Wie funktioniert die Validierung?
- Verstehen und Verbessern der Modellleistung
- Warum kann eine Bezeichnung eine geringe durchschnittliche Genauigkeit haben?
- Training mit „Bezeichnung überprüfen“ und „Bezeichnung fehlen“
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Ausgleichs und Verwendung von „Neuausgleich“
- Wann das Training Ihres Modells beendet werden soll
- Definieren und Einrichten Ihrer Entitäten
- Grundlegendes zu Entitäten
- Welche vortrainierten Entitäten sind verfügbar?
- Aktivieren, Deaktivieren, Aktualisieren und Erstellen von Entitäten
- Entitätsfilterung
- Überprüfen und Anwenden von Entitäten
- Validierung für Entitäten
- Verbesserung der Entitätsleistung
- Erstellen von benutzerdefinierten Regex-Entitäten
- Verwenden von Analytics & Monitoring
- Automatisierungs- und Communications Mining
- Häufige Fragen und mehr
Überprüfen und Anwenden von Entitäten
Benutzerberechtigungen erforderlich: „Quellen anzeigen“ UND „Überprüfen und Beschriften“.
Vorhergesagte Entitäten werden als farblich hervorgehobener Text angezeigt, z. B. in der ersten Zeile der Nachricht unten, wobei für jeden Entitätstyp eine andere Farbe angezeigt wird. Sobald eine Entität von einem Benutzer bestätigt wurde, indem sie entweder manuell angewendet oder eine Vorhersage akzeptiert wurde, wird die Entität als hervorgehobener Text mit einer fetten, dunkleren Umrandung angezeigt, wie unten gezeigt.
Wenn einem Absatz Entitäten zugewiesen, verworfen oder angewendet wurden, wird er grau hervorgehoben, wie im Textkörper der Nachricht unten gezeigt.
Bei der Überprüfung trainierbarer Entitäten sollten Sie sich daran erinnern, dass die Plattform sowohl von den Entitätswerten, die Sie zuweisen, als auch vom Kontext lernt, in dem sie in der Kommunikation erscheinen, d. h. von der anderen Sprache, die um die Werte selbst herum verwendet wird.
Die Plattform berücksichtigt den Kontext der Sprache im selben Absatz wie der Entitätswert sowie die einzelnen Absätze (gekennzeichnet durch eine neue getrennte Zeile) direkt vor und nach dem Absatz, in dem sich die Entität befindet.
Hinweis: Bei Entitäten, die nicht auf „trainierbar“ festgelegt sind, basieren die Vorhersagen der Plattform vollständig auf den Regeln, die in der Plattform für diese Entität definiert wurden. Dies kann von Vorteil sein, wenn eine Entität unbedingt einem festgelegten Format für eine nachgelagerte Automatisierung folgen muss und falsche Werte einen Fehler oder eine Ausnahme verursachen.
Wenn die Plattform vorhersagt, welche Entitäten auf eine Kommunikation zutreffen, weist sie jeder Vorhersage einen Konfidenzwert (%) zu, um zu zeigen, wie sicher die Entität auf den hervorgehobenen Textabschnitt zutrifft. Sie können die Konfidenzbewertung einer Entität anzeigen, indem Sie mit dem Mauszeiger auf die Entität zeigen.
Diese Konfidenzpunktzahl wird auch über die API zur Verfügung gestellt, sodass sie in automatisierte Aktionen im nachgelagerten Bereich einfließt.
Sobald Entitäten aktiviert sind (siehe hier), beginnt die Plattform automatisch, sie in den Nachrichten in Ihrem Dataset vorherzusagen. Benutzer können dann die Vorhersagen akzeptieren, die richtig sind, oder sie ablehnen, wenn sie falsch sind. Jede dieser Aktionen sendet Trainingszeichen, die verwendet werden, um das Verständnis der Plattform über diese Entität zu verbessern.
Für die vortrainierten Entitäten, die offline trainiert werden (z. B monetäre Menge, URL usw.), ist es aus Sicht der Verbesserung wichtiger, dass Benutzer falsche Vorhersagen ablehnen oder korrigieren, als dass sie korrekte Vorhersagen akzeptieren.
Für die Entitäten, die live in der Plattform trainieren, ist es ebenso wichtig, korrekte Vorhersagen zu akzeptieren als auch falsche Vorhersagen abzulehnen. Sie müssen jedoch nicht ständig viele korrekte Beispiele für jede eindeutige Entität für diese Arten akzeptieren (z. B ist eine eindeutige Organisationsentität), wenn Sie keine falsch vorhergesagten finden.
Der wichtigste Nachteil dabei ist, dass Sie, wenn Sie eine Entität in einem Absatz überprüfen, alle anderen Entitäten in diesem Absatz überprüfen müssen.
Um eine Entitätsvorhersage zu überprüfen, zeigen Sie mit der Maus auf die Vorhersage. Das modale Element zur Entitätsüberprüfung wird angezeigt, wie im folgenden Beispiel gezeigt. Um sie zu akzeptieren, klicken Sie auf „Bestätigen“. Um sie abzulehnen, klicken Sie auf „Verwerfen“.
Entitäten und Bezeichnungen können unabhängig voneinander trainiert werden. Das Überprüfen von Beschriftungen für eine Nachricht bedeutet nicht, dass Sie die Entitäten in derselben Nachricht überprüfen müssen. Es empfiehlt sich jedoch, beides gleichzeitig zu tun, um Ihre Zeit beim Modelltraining am effizientesten zu nutzen.
Bitte beachten Sie: Es ist sehr wichtig , beim Training von Entitäten die unten erläuterten bewährten Methoden zu befolgen – insbesondere, wenn Absätze nicht teilweise beschriftet werden.
Informationen dazu, wie gut die Plattform in der Lage ist, jede Entität vorherzusagen, die für ein Dataset aktiviert ist ( insbesondere die trainierbaren), lesen Sie hier.
Es ist wichtig, dass Sie falsche Entitätsvorhersagen ablehnen, aber wenn es sich bei dem hervorgehobenen Text tatsächlich um eine andere Entität handelt (dies wäre häufiger bei datumsbezogenen Entitäten), wenden Sie anschließend die richtige Entität an (siehe unten zum Anwenden von Entitäten).
Um eine Entität auf einen Text anzuwenden, den die Plattform möglicherweise nicht vorhergesagt hat, müssen Benutzer lediglich den Testabschnitt markieren, wie beim Kopieren.
Es wird ein Dropdownmenü angezeigt, das alle Entitäten enthält, die Sie für Ihr Dataset aktiviert haben, wie unten gezeigt. Klicken Sie einfach auf die richtige Option, um sie anzuwenden, oder drücken Sie die entsprechende Tastenkombination.
Die Standard-Tastenkombination für jede Entität ist der Buchstabe, mit dem begonnen wird. Wenn mehr als eine Entität mit demselben Buchstaben beginnt, wird eine der anderen zufällig zugewiesen.
Sobald eine Entität angewendet wurde, wird sie farblich mit einer fetten Kontur hervorgehoben (siehe unten). Jeder Entitätstyp hat eine eigene spezifische Farbe.
Ein Wert für einen bestimmten Entitätstyp kann nicht auf mehrere Absätze aufgeteilt werden. Der vollständige Wert muss innerhalb eines Absatzes enthalten sein, damit er als ein Entitätswert extrahiert wird.
Beim Akzeptieren, Ablehnen oder Anwenden von Entitäten in Nachrichten sind zwei sehr wichtige Best Practices zu beachten:
1. Wörter nicht aufteilen
Es ist wichtig, Wörter nicht aufzuteilen – die hervorgehobene Entität sollte das gesamte fragliche Wort (oder mehrere) abdecken, nicht nur einen Teil davon (siehe das falsche Beispiel auf der linken Seite und die richtige Anwendung auf der rechten Seite).
2. Absätze nicht teilweise beschriften
Wenn ein Benutzer bei der Beschriftung einer Nachricht eine Beschriftung zuweist, sollte er ALLE Beschriftungen anwenden, die auf diese Nachricht zutreffen könnten. Andernfalls bringen Sie dem Modell bei, dass diese anderen Beschriftungen nicht angewendet werden sollen. Für Entitäten gilt das Gleiche, mit der Ausnahme, dass Entitäten auf Absatzebene und nicht auf der gesamten Nachricht überprüft oder angewendet werden.
Absätze in einer Nachricht werden durch neue Zeilen getrennt. Die Betreffzeile einer E-Mail-Nachricht wird als eigener einzelner Absatz betrachtet.
Stellen Sie sicher, dass Sie alle Entitäten innerhalb eines Absatzes über alleEntitätstypen hinweg überprüfen oder anwenden, wenn Sie eine von ihnen überprüfen oder anwenden. Das Anwenden, Akzeptieren oder Ablehnen von Entitäten in einem Absatz bedeutet, dass der Absatz von der Plattform aus der Sicht der Entität als „überprüft“ behandelt wird. Daher ist es wichtig, ALLE Vorhersagen in diesem Absatz zu akzeptieren oder abzulehnen.
Das folgende Beispiel zeigt die verschiedenen Absätze, die in der E-Mail-Nachricht überprüft wurden.
Die unten angezeigte Meldung zeigt dasselbe Beispiel, bei dem der Benutzer nicht alle Entitätsvorhersagen in einem einzelnen Absatz akzeptiert oder abgelehnt hat. Das ist falsch, da das Modell die Entität „Geldmenge“ fälschlicherweise als falsche Vorhersage behandelt.