- Erste Schritte
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Entitäten
- Bezeichnungen (Vorhersagen, Konfidenzniveaus, Hierarchie usw.)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Überprüfte und nicht überprüfte Nachrichten
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Verwaltung
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Erstellen Sie eine Datenquelle in der GUI
- Hochladen einer CSV-Datei in eine Quelle
- Ein neues Dataset erstellen
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern Sie die Einstellungen eines Datasets
- Löschen Sie Nachrichten über die Benutzeroberfläche
- Löschen Sie ein Dataset
- Exportieren Sie ein Dataset
- Verwenden von Exchange-Integrationen
- Vorbereiten von Daten für den CSV-Upload
- Modelltraining und -wartung
- Verstehen von Bezeichnungen, Entitäten und Metadaten
- Bezeichnungshierarchie und bewährte Methode
- Definieren Ihrer Taxonomieziele
- Analyse- vs. Automatisierungsanwendungsfälle
- Konvertieren Ihrer Ziele in Bezeichnungen
- Erstellen Ihrer Taxonomiestruktur
- Best Practices für den Taxonomieentwurf
- Ihre Taxonomie wird importiert
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung (NEU)
- Verstehen des Status Ihres Datasets
- Best Practice für Modelltraining und Beschriftung
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Trainieren
- Einführung zu „Verfeinern“
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- Wie funktioniert die Validierung?
- Verstehen und Verbessern der Modellleistung
- Warum kann eine Bezeichnung eine geringe durchschnittliche Genauigkeit haben?
- Training mit „Bezeichnung überprüfen“ und „Bezeichnung fehlen“
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Ausgleichs und Verwendung von „Neuausgleich“
- Wann das Training Ihres Modells beendet werden soll
- Definieren und Einrichten Ihrer Entitäten
- Grundlegendes zu Entitäten
- Welche vortrainierten Entitäten sind verfügbar?
- Aktivieren, Deaktivieren, Aktualisieren und Erstellen von Entitäten
- Entitätsfilterung
- Überprüfen und Anwenden von Entitäten
- Validierung für Entitäten
- Verbesserung der Entitätsleistung
- Erstellen von benutzerdefinierten Regex-Entitäten
- Verwenden von Analytics & Monitoring
- Automatisierungs- und Communications Mining
- Häufige Fragen und mehr
Mehrsprachige Quellen und Datasets
Communications Mining unterstützt jetzt mehrsprachige Quellen und Datasets. Das bedeutet, dass die Modelle Quellen verstehen können, die mehrere verschiedene unterstützte Sprachen enthalten, ohne sie tatsächlich übersetzen zu müssen.
Die Sprachen, die derzeit in mehrsprachigen Quellen und Datasets „Allgemein verfügbar“ sind, sind: Englisch, Französisch, Deutsch, Spanisch, Italienisch, Portugiesisch und Niederländisch (wir werden diese Liste im Laufe der Zeit erweitern!).
In der Praxis bedeutet dies, dass Benutzer, wenn sie in mehreren Sprachen arbeiten und Aufträge abwickeln, die von der Plattform unterstützt werden, mit Nachrichten in diesen Sprachen trainieren können, anstatt alles in eine einzige Sprache übersetzen zu müssen.
Eine umfangreiche Liste zusätzlicher Sprachen wird in der Vorschau unterstützt (enthalten am unteren Rand dieser Seite), d. h., wir werden daran arbeiten, sie im Laufe der Zeit zu optimieren, wenn unsere Kunden und Partner mit der Verwendung beginnen. Ein großer Teil dieser Sprachen ist sehr erfolgreich und erfordert nur wenig bis gar keine Feinabstimmung durch unsere Teams, um eine hohe Leistung zu erzielen.
Wichtige Hinweise bei der Verwendung von mehrsprachigen Quellen und Datasets:
- Wenn ein Dataset mehrsprachig ist, können Benutzer keine Übersetzungen von Nachrichten sehen (wie für übersetzte Datasets vorgesehen), daher müssen sie in der Lage sein, alle Sprachen im Dataset zu verstehen, um ihr Modell effektiv zu trainieren
- Das Verstehen mehrerer Sprachen ist ein komplexeres Problem des Machine Learning als das Verstehen einer einzelnen Sprache, sodass diese Datasets im Vergleich zu Datasets in einer einzelnen Sprache möglicherweise einen leichten Leistungsverlust erfahren
- Die Plattform kann nur eine der oben aufgeführten unterstützten Sprachen verstehen. Wenn das Dataset noch andere Sprachen enthält, ist das Taggen dieser Nachrichten mit Beschriftungen, die für Nachrichten in unterstützten Sprachen verwendet werden, für die Plattform verwirrend. Es ist besser, sie als eigene spezifische Bezeichnungen zu beschriften, die die Sprache als Bezeichnung erfassen, aber die Plattform kann die Besonderheiten der nicht unterstützten Sprache nicht interpretieren
Wie erstellen Sie mehrsprachige Quellen und Datasets?
Sowohl für Datenquellen- als auch für Datasets wird die Sprachfamilie bei der Erstellung ausgewähltund kann nach der Erstellung nicht mehr geändert werden.
Wählen Sie einfach „mehrsprachig“ aus der Dropdownliste der Sprachfamilie im modalen Element „Quelle erstellen“ oder „Dataset erstellen“ aus (dies ist in der Regel die letzte Einstellung, die ausgewählt werden muss).
Weitere Informationen zum Erstellen einer Quelle in der UI finden Sie auf der Seite Erstellen einer Datenquelle in der GUI .
Weitere Informationen zum Erstellen eines Datasets finden Sie auf der Seite Erstellen eines neuen Datasets .
Sprachen mit allgemeiner Verfügbarkeit
- Englisch
- Niederländisch
- Französisch
- Deutsch
- Italienisch
- Portugiesisch
- Spanisch
- Afrikaans
- Albanisch
- Amharisch
- Arabisch
- Armenisch
- Assamesisch
- Aserbaidschanisch
- Baskisch
- Weißrussisch
- Bengali
- bengalisch (schriftart)
- Bosnisch
- Bretonisch
- Bulgarisch
- Birmanisch
- Birmanisch
- Katalanisch
- Chinesisch (vereinfacht)
- Chinesisch (traditionell)
- Kroatisch
- Tschechisch
- Dänisch
- Esperanto
- Estnisch
- Philippinisch
- Finnisch
- Galizisch
- Georgisch
- Griechisch
- Gujarati
- Hausa
- Hebräisch
- Hindi
- Hindi (romanisiert)
- Ungarisch
- Isländisch
- Indonesisch
- Irisch
- Japanisch
- Javanisch
- Kannada
- Kasachisch
- Xanten
- Koreanisch
- Kurdisch (Kurmandschi)
- Kirgisisch
- Laos
- Latein
- Lettisch
- Litauisch
- Mazedonisch
- Madagassisch
- Malaiisch
- Malaiisch
- Marathi
- Mongolisch
- Nepali
- Norwegisch
- Oria
- OroMo
- Paschtu
- Persisch
- Polnisch
- Punjabi
- Rumänisch
- Russisch
- Los
- schottisch-gälisch
- Serbisch
- Sindhi
- Singapurisch
- Slowakisch
- Slowenisch
- Somalisch
- Sundanesisch
- Swahili
- Schwedisch
- Schweifes Deutsch
- Tamil
- HTML (germanisiert)
- Telugu
- Telugu (romanisiert)
- Thai
- Türkisch
- Ukrainisch
- Urdu
- Urdu (romanisiert)
- Uigur
- Usbekisch
- Vietnamesisch
- Walisisch
- Westfriesisch
- Xhosa
- Jiddisch