- Démarrage
- Équilibre
- Clusters
- Dérive de concept
- Couverture
- Jeux de données
- Entités (Entities)
- Libellés (prédictions, niveaux de confiance, hiérarchie, etc.)
- Modèles
- Flux
- Évaluation du modèle
- Projets
- Précision
- Rappel
- Messages examinés et non examinés
- Sources
- Taxonomies
- Apprentissage
- Prédictions positives et négatives vraies et fausses
- Validation
- Messages
- Administration
- Gérer les sources et les jeux de données
- Comprendre la structure des données et les autorisations
- Créer une source de données dans l'interface graphique
- Téléchargement d’un fichier CSV dans une source
- Créer un nouveau jeu de données
- Sources et jeux de données multilingues
- Activation des sentiments sur un ensemble de données
- Modifier les paramètres d’un jeu de données
- Supprimer des messages via l'interface utilisateur
- Supprimer un jeu de données
- Exporter un jeu de données
- Utilisation des intégrations Exchange
- Préparation des données en vue du téléchargement .CSV
- Entraînement et maintenance du modèle
- Comprendre les libellés, les entités et les métadonnées
- Hiérarchie des libellés et bonnes pratiques
- Définition de vos objectifs de taxonomie
- Cas d'utilisation d'analyse vs d'automatisation
- Transformer vos objectifs en libellés
- Construire votre structure de taxonomie
- Meilleures pratiques de conception de taxonomie
- Importation de votre taxonomie
- Présentation du processus d'entraînement du modèle
- Annotation générative (New)
- Comprendre le statut de votre jeu de données
- Meilleures pratiques d'entraînement et de labellisation des modèles
- Entraînement avec l'analyse des sentiments des libellés activée
- Entraîner
- Vue d'ensemble (Overview)
- Examen des prédictions de libellé
- Entraînement à l'aide de « Mélanger »
- Entraînement à l'aide d'« Ensemble des libellés » (Explore)
- Entraînement à l'aide de l'option 'Faible confiance'
- Entraînement à l'aide de la recherche (Explorer)
- Réduction et réorganisation de votre taxonomie
- Introduction à 'Raffiner'
- Précision et rappel expliqués
- Précision et rappel
- Comment fonctionne la validation ?
- Comprendre et améliorer les performances du modèle
- Pourquoi un libellé peut-il avoir une précision moyenne faible ?
- Entraînement à l'aide de « Vérifier le libellé » et « Libellé manquant »
- Entraînement à l'aide du libellé En savoir plus (Affiner)
- Entraînement à l'aide de la recherche (affiner)
- Comprendre et augmenter la couverture
- Amélioration de l'équilibre et utilisation de « Rééquilibrer »
- Quand arrêter l'entraînement de votre modèle
- Définition et configuration de vos entités
- Comprendre les entités
- Quelles sont les entités pré-entraînées disponibles ?
- Activation, désactivation, mise à jour et création d'entités
- Filtrage des entités
- Examiner et appliquer des entités
- Validation pour les entités
- Amélioration des performances de l'entité
- Création d'entités Regex personnalisées
- Utilisation des analyses de surveillance &
- Automatisations et Communications Mining
- FAQ et plus
Sources et jeux de données multilingues
Communications Mining prend désormais en charge des sources et des ensembles de données multilingues. Cela signifie que les modèles peuvent comprendre des sources qui contiennent plusieurs langues prises en charge différentes, sans avoir à les traduire.
Les langues qui sont actuellement « disponibles généralement » dans les sources et les ensembles de données multilingues sont : l'anglais, le français, l'allemand, l'espagnol, l'italien, le portugais et le néerlandais (nous étendrons cette liste au fil du temps !).
Cela signifie en pratique que si les utilisateurs travaillent et font des affaires dans plusieurs langues prises en charge par la plateforme, ils peuvent s'entraîner sur des messages dans ces langues, plutôt que de tout traduire en une seule langue.
Une grande liste de langues supplémentaires sont prises en charge dans l'aperçu (incluses au bas de cette page), ce qui signifie que nous travaillerons à les affiner au fur et à mesure que nos clients et partenaires commenceront à les utiliser. Une grande partie de ces langues fonctionneront très bien et ne nécessiteront que peu ou pas de peaufinage par nos équipes pour atteindre des performances élevées.
Considérations importantes si vous cherchez à utiliser des sources et des ensembles de données multilingues :
- Si un ensemble de données est multilingue, les utilisateurs ne pourront pas voir les traductions des messages (comme prévu pour les ensembles de données traduits). Ils devront donc pouvoir comprendre toutes les langues de l'ensemble de données pour entraîner efficacement leur modèle
- Comprendre plusieurs langues est un problème d'apprentissage automatique plus complexe que comprendre une seule langue, de sorte que ces ensembles de données peuvent potentiellement connaître une légère baisse des performances par rapport aux ensembles de données dans une seule langue
- La plate-forme ne pourra comprendre la langue qu'à partir de l'une des langues prises en charge répertoriées ci-dessus. S'il y a d'autres langues présentes dans l'ensemble de données, le balisage de ces messages avec des libellés utilisés sur les messages dans les langues prises en charge prêtera à confusion pour la plate-forme. Il est préférable de les labelliser comme leurs propres libellés spécifiques qui capturent la langue sous forme de libellé, mais la plate-forme ne pourra pas interpréter les spécificités de la langue non prise en charge
Comment créez-vous des sources et des ensembles de données multilingues ?
Pour la source de données et les ensembles de données, la famille de langues est sélectionnée lors de leur créationet ne peut pas être modifiée une fois qu'ils sont.
Il suffit de sélectionner « multilingue » dans la liste déroulante de la famille de langues lors de la création de la source ou du modal de création de l’ensemble de données (il s’agit généralement du dernier paramètre à sélectionner).
Pour plus de détails sur la création d'une source dans l'interface utilisateur, consultez la page Créer une source de données dans l'interface graphique .
Pour plus de détails sur la création d'un ensemble de données, consultez la page Créer un nouvel ensemble de données .
Langues de disponibilité générale
- Anglais
- Néerlandais
- Français
- Allemand
- Italien
- Portugais
- Espagnol
- Afrikaans
- Albanais
- amharique
- Arabe
- arménien
- Assamais
- Azerbaïdjanais
- Basque
- Biélorusse
- bengali
- bengali (romanisé)
- Bosniaque
- breton
- Bulgare
- Birman
- Birman
- Catalan
- Chinois (simplifié)
- Chinois (traditionnel)
- croate
- Tchèque
- Danois
- Espéranto
- estonien
- Philippin
- Finnois
- galicien
- géorgien
- Grec
- gujarati
- haoussa
- Hébreu
- Hindi
- Hindi (Automatisé)
- Hongrois
- Islandais
- Indonésien
- Irlandais
- Japonais
- javanais
- kannada
- Kazakh
- khmer
- Coréen
- kurmanji (Kurmanji)
- kirghize
- Lao
- latin
- letton
- lituanien
- macédonien
- Malgache
- malais
- Malayalam
- marathi
- mongol
- népalais
- Norvégien
- Oria
- Orchestrator
- Pashto
- persan
- Polonais
- pendjabi
- Roumain
- Russe
- sanscrit
- gaélique cohérente
- Serbe
- sindhi
- Cingalalen
- slovaque
- slovène
- Somalien
- sundanais
- Swahili
- Suédois
- Suisse allemand
- tamil
- tamil (romanisé)
- telugu
- telugu (romanisé)
- Thaï
- Turque
- Ukrainien
- Ourdou
- Urdu (Automation Suite)
- Uygour
- ouzbek
- Vietnamien
- gallois
- frison occidental
- Xhosa
- yiddish