- Notes de publication
- Avant de commencer
- Démarrage
- Installation d'AI Center
- Migration et mise à niveau
- Projets
- Jeux de données
- Labellisation des données
- À propos de la labellisation des données
- Gestion des libellés de données
- Utilisation de la labellisation des données avec Human in the loop
- Paquets ML
- Paquets prêts à l’emploi
- Pipelines
- Compétences ML
- Journaux ML
- Document UnderstandingTM dans AI Center
- API AI Center
- Comment
- Licences
- Guide de dépannage de base
Gestion des libellés de données
Dans l'onglet Configurer (Configure), vous pouvez configurer les libellés nécessaires à votre session.
Vous pouvez configurer les libellés de deux manières :
- Utiliser une interface utilisateur générale
- Utilisation de l'éditeur avancé
Le panneau de gauche est l'éditeur de configuration de libellé, tandis que le panneau de droite affiche un aperçu de la configuration actuelle. Le panneau de droite affiche également les composants de texte qui font partie du modèle. Dans cet exemple, le modèle d'e-mail est prédéfini avec les champs De, À, CC, Date et Texte. Vous pouvez ajouter/supprimer ces composants de texte à l'aide de l'éditeur avancé.
Vous pouvez ajouter de nouveaux libellés à l'aide de l'interface à partir de l'onglet Général (General).
Pour ajouter un libellé, cliquez sur ➕ à côté de Libellé de l'entité (Entity Label). Ajoutez les informations suivantes au nouveau libellé :
- Nom (Name) : le nom du nouveau libellé.
- Entrée à labelliser (Input to be labelled) : choisissez le composant de texte à labelliser. Dans le cas d'E-mail d'IA, vous avez le choix entre
Date
,From
,To
,cc
ettext
. - Nom de l'attribut (Attribute name) : choisissez les noms de libellé des entités dans vos données. Utilisez cette option pour créer des attributs tels que le nom du client, le nom de la ville, le numéro de téléphone, etc.
- Raccourci (Shartcut) : choisissez un raccourci clavier pour le libellé. Utilisez cette option pour configurer une touche en tant que raccourci. Seules les lettres ou les chiffres sont pris en charge.
- Couleur (Color) : choisissez une couleur pour le libellé afin de le distinguer des autres.
Pour ajouter une classification, cliquez sur ➕ à côté de Classification. Ajoutez les informations suivantes au nouveau libellé :
- Nom (Name) : le nom de la nouvelle classification.
- Type de classification (Classification Type) : choisissez le type de classification. Vous pouvez choisir entre Unique (Single) et Multiple.
- Nom de l'attribut (Attribute name) : choisissez les noms de libellé pour chaque catégorie ou valeur dans vos données. Utilisez-le pour créer des attributs tels que le sentiment (positif ou négatif), le type d'e-mail (client, marketing, spam), etc.
- Raccourci: choisissez un raccourci clavier pour l'attribut. Utilisez cette option pour configurer une touche en tant que raccourci. Seules les lettres ou les chiffres sont pris en charge.
Vous pouvez ajouter de nouveaux libellés à l'aide de l'onglet Éditeur avancé (Advanced Editor).
<Label value="NewLabel" background="color"/>
. Ajoutez les libellés dans la section <Labels name>
. Une fois que vous avez ajouté le nouveau libellé, il s'affichera sur le côté droit de l'écran.
Une fois que vous avez terminé d'ajouter tous les libellés nécessaires, cliquez sur Terminé (Done).
Notez que si vous souhaitez reconfigurer l'étiquetage des données, toutes les données étiquetées qui n'ont pas été exportées seront perdues et devront être à nouveau envoyées aux étiqueteurs.
Dans l'onglet Importer (Import), vous pouvez importer les fichiers nécessaires à la labellisation. L'outil de labellisation prend en charge les fichiers au format JSON. Le fichier JSON doit contenir un objet de données qui contient à son tour la structure configurée à l'étape précédente. Voici un exemple de fichier JSON structuré pour le modèle d'e-mail par défaut, contenant les champs De, À, CC, Date et Texte sous forme de paires nom-valeur dans un objet « data ».
{
"data": {
"date": "1/29/2021 12:29:01 PM",
"from": "abc@xyz.com",
"to": "xyz@abc.com",
"cc": "",
"text": "I currently have 4 separate student loans that I have been paying on for years with Citi,..."
}
}
{
"data": {
"date": "1/29/2021 12:29:01 PM",
"from": "abc@xyz.com",
"to": "xyz@abc.com",
"cc": "",
"text": "I currently have 4 separate student loans that I have been paying on for years with Citi,..."
}
}
Une fois ajouté, cliquez sur Télécharger (Upload).
Vous pouvez vérifier tous vos fichiers téléchargés dans la fenêtre Téléchargement et validation des fichiers (Uploading and Validating Files). S'il y a une erreur dans l'un des fichiers, le message d'erreur vous aidera à modifier le fichier afin de répondre aux exigences.
cc
est manquant dans l'un des fichiers téléchargés.
Une fois que vous avez vérifié les fichiers téléchargés et validés, cliquez sur Terminé (Done).
- Si vous utilisez le chinois ou le japonais,
granularity="word"
doit être supprimé à l'aide de l'éditeur avancé. - Si vous utilisez des langues écrites de droite à gauche, vous pouvez définir
view style
à l'aide de l'éditeur avancé. Pour modifier l'alignement, ajoutezview style="text-align:right"
dans l'éditeur avancé.
Once you imported the files, you can send them to UiPath® Action Center for human in the loop and labeling. There are several ways to do this from AI Center. For more information, see the scenarios below.
Une sélection de fichiers
Pour envoyer uniquement une sélection de fichiers à Action Center, procédez comme suit :
Tous les fichiers
Pour envoyer tous les fichiers à Action Center, suivez les étapes ci-dessous :
Fichiers non transmis
Pour envoyer uniquement les fichiers qui n'ont pas déjà été envoyés à Action Center ou labellisés, suivez les étapes ci-dessous :
Vous pouvez exporter des libellés à partir de l'onglet Exporter (Export).
Pour exporter des fichiers, cliquez sur Exporter les fichiers vers l'ensemble de données (Export files to dataset ) dans l'onglet Exporter (Export).
L'exportation génère des fichiers JSON contenant un objet 'annotations', en plus de l'objet 'data' d'origine.
Une fois l'exportation terminée, vous trouverez les fichiers dans le chemin suivant :
Ensembles de données (Datasets) > Nom de l'ensemble de données (Dataset_name) > fichiersExportés (exportedFiles)