- Erste Schritte
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Entitäten
- Bezeichnungen (Vorhersagen, Konfidenzniveaus, Hierarchie usw.)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Überprüfte und nicht überprüfte Nachrichten
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Verwaltung
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Erstellen Sie eine Datenquelle in der GUI
- Hochladen einer CSV-Datei in eine Quelle
- Ein neues Dataset erstellen
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern Sie die Einstellungen eines Datasets
- Löschen Sie Nachrichten über die Benutzeroberfläche
- Löschen Sie ein Dataset
- Exportieren Sie ein Dataset
- Verwenden von Exchange-Integrationen
- Vorbereiten von Daten für den CSV-Upload
- Modelltraining und -wartung
- Verstehen von Bezeichnungen, Entitäten und Metadaten
- Bezeichnungshierarchie und bewährte Methode
- Definieren Ihrer Taxonomieziele
- Analyse- vs. Automatisierungsanwendungsfälle
- Konvertieren Ihrer Ziele in Bezeichnungen
- Erstellen Ihrer Taxonomiestruktur
- Best Practices für den Taxonomieentwurf
- Ihre Taxonomie wird importiert
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung (NEU)
- Verstehen des Status Ihres Datasets
- Best Practice für Modelltraining und Beschriftung
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Trainieren
- Einführung zu „Verfeinern“
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- Wie funktioniert die Validierung?
- Verstehen und Verbessern der Modellleistung
- Warum kann eine Bezeichnung eine geringe durchschnittliche Genauigkeit haben?
- Training mit „Bezeichnung überprüfen“ und „Bezeichnung fehlen“
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Ausgleichs und Verwendung von „Neuausgleich“
- Wann das Training Ihres Modells beendet werden soll
- Definieren und Einrichten Ihrer Entitäten
- Grundlegendes zu Entitäten
- Welche vortrainierten Entitäten sind verfügbar?
- Aktivieren, Deaktivieren, Aktualisieren und Erstellen von Entitäten
- Entitätsfilterung
- Überprüfen und Anwenden von Entitäten
- Validierung für Entitäten
- Verbesserung der Entitätsleistung
- Erstellen von benutzerdefinierten Regex-Entitäten
- Verwenden von Analytics & Monitoring
- Automatisierungs- und Communications Mining
- Häufige Fragen und mehr
Grundlegendes zu Entitäten
Was sind Entitäten?
Entitäten sind zusätzliche Elemente strukturierter Daten, die aus den Nachrichten in Ihrem Dataset extrahiert werden können. Zu den Entitäten gehören Datenpunkte wie Geldmengen, Datumsangaben, Währungscodes, E-Mail-Adressen, URLs sowie viele andere branchenspezifische Kategorien (ein Beispiel finden Sie unten).
Im Gegensatz zu Labels kann die Plattform die meisten Entitäten (mit Ausnahme der von Grund auf trainierten) vorhersagen, sobald sie aktiviert sind, da sie basierend auf ihrem typischen oder in einigen Fällen sehr spezifischen Format und einem Trainingssatz ähnlicher Entitäten identifiziert werden kann .
Wie bei Beschriftungen können Benutzer Entitäten akzeptieren oder ablehnen, die korrekt oder falsch vorhergesagt wurden, wodurch die Fähigkeit des Modells verbessert wird, sie in Zukunft zu identifizieren.
Entitätstypen
Derzeit gibt es zwei Haupttypen von Entitäten:
- Vortrainierte Entitäten , die in der Regel auf einem Satz von Standard- oder benutzerdefinierten Regeln basieren – z. B Monetäre Menge, URL und Datum
- Entitäten, die von einem Benutzer von Grund auf trainiert wurden (wie sie Beschriftungen trainieren würden), die auf Machine Learning basieren
Trainierbare und nicht trainierbare Entitäten
Alle Entitäten sind entweder von vornherein „trainierbar“(Entitäten, die von Grund auf trainiert wurden) oder können „trainierbar“ gemacht werden, wenn sie aktiviert sind (alle anderen Entitätsarten).
„Trainierbare“ Entitäten sind solche, die basierend auf den von den Benutzern bereitgestellten Trainings live in der Plattform aktualisiert werden. Weitere Informationen zu Trainingsentitäten finden Sie hier.
Wenn Sie das Training für eine vortrainierte Entität aktivieren , die in der Regel auf einem Satz von Standard- oder benutzerdefinierten Regeln basiert, können Sie das Verständnis der Plattform für diese Entität innerhalb der Parameter dieser Regeln verfeinern. Im Wesentlichen werden weitere Trainings zu diesen Optionen den Umfang der Informationen, die die Plattform als diese Entität betrachten kann, reduzieren, aber nicht erweitern.
Dies liegt daran, dass viele dieser Entitäten, wie Datumsangaben (z. B 'Morgen') und Geldmengen (z. B 20 Pfund) in ein strukturiertes Datenformat für nachgelagerte Systeme normalisiert werden müssen. Auch für Entitäten wie ISINs oder CUSIPs müssen diese ein festgelegtes Format haben. Die Plattform sollte also nicht trainiert werden, um etwas vorherzusagen, das nicht ihren definierten Formaten entspricht.
Wenn trainierbare Entitäten zugewiesen werden, betrachtet die Plattform sowohl den Text der Entität als auch den Kontext der Entität innerhalb der restlichen Kommunikation, d. h. was vor und nach dem Entitätswert geschieht (im selben Absatz und das oben und unten). Es lernt, die Entität basierend auf den Werten selbst besser vorherzusagen sowie darauf, wie der Wert im Kontext der Kommunikation erscheint.
Wenn eine vortrainierte Entität nicht als trainierbar festgelegt ist (siehe Details zum Aktivieren von Entitäten in einem Dataset hier), können Benutzer die Entitätsvorhersagen, die sie in ihrem Dataset sehen, dennoch akzeptieren oder ablehnen. Sie werden offline mit diesem plattforminternen Feedback der Benutzer aktualisiert und verfeinert. Daher ist es für Benutzer weiterhin hilfreich, diese Entitäten beim Überprüfen von Nachrichten zu akzeptieren oder abzulehnen.