ai-center

2023.4

false

Notes de publication
Avant de commencer
- Installer ou mettre à niveau AI Center
- Matrice de compatibilité
Démarrage
Installation d'AI Center
Migration et mise à niveau
Projets
- À propos des projets
- Gérer des projets
Jeux de données
- À propos des jeux de données
- Gestion des ensembles de données
Labellisation des données
- À propos de la labellisation des données
- Gestion des libellés de données
Paquets ML
Paquets prêts à l’emploi
Pipelines
Compétences ML
- À propos des compétences ML
- Gestion des compétences ML
Journaux ML
- À propos des journaux ML
Document UnderstandingTM dans AI Center
- Document Manager
- Services OCR
API AI Center
- Vue d'ensemble (Overview)
- Liste des autorisations d'API
Comment
- Gestion de la planification des nœuds
- Paquets ML
  - Utilisez le NER personnalisé avec l'apprentissage continu
Licences
- AI Units
- Informations légales
Guide de dépannage de base
- Dépannage d'AI Center

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

AI Center - Guide de l'utilisateur

PRODUIT :

Dernière mise à jour 6 nov. 2025

Classification TPOT AutoML

Packages du système d'exploitation (OS Packages) > Données tabulaires (Tabular Data) > TPOTAutoMLClassification

Ce modèle est un modèle de classification de données tabulaires génériques (valeur numérique uniquement) qui doit être recyclé avant d'être utilisé pour des prédictions. Il s'appuie sur TPOT pour trouver automatiquement le meilleur modèle.

TPOT est un outil d'apprentissage automatique Python qui optimise les pipelines d'apprentissage automatique à l'aide de la programmation génétique. TPOT automatise la partie la plus fastidieuse de l'apprentissage automatique en explorant intelligemment des milliers de pipelines possibles pour trouver celui qui convient le mieux à vos données. Une fois que TPOT a terminé la recherche (ou que vous en avez assez d'attendre), il vous fournit le code Python du meilleur pipeline qu'il a trouvé afin que vous puissiez commencer à ajuster le pipeline. TPOT est construit sur scikit-learn, donc tout le code qu'il génère devrait sembler familier aux utilisateurs de scikit-learn.

Détails du modèle

Type d'entrée

JSON

Description de l'entrée

Fonctionnalités utilisées par le modèle pour faire des prédictions. Par exemple : { « Feature1 » : 12, « Feature2 » : 222, ..., « FeatureN » : 110}

Description de la sortie

JSON avec prévision du nom de classe et niveau de confiance relatif à cette prévision de classe (entre 0 et 1). Les noms de libellé ne sont renvoyés que si l'encodage de labellisation a été effectué par le pipeline dans AI Center. Certains modèles scikit-learn ne prennent pas en charge les scores de confiance. Si la sortie du pipeline d'optimisation est un modèle scikit-learn qui ne prend pas en charge les scores de confiance, la sortie ne contiendra que la classe prédite.

Exemple :

{
  "predictions": 0,
  "confidences": 0.6,
  "labels": "yes"
}{
  "predictions": 0,
  "confidences": 0.6,
  "labels": "yes"
}

Ou si l'encodage de l'étiquette a été fait en dehors du modèle :

{
  "predictions": 0,
  "confidences": 0.6
}{
  "predictions": 0,
  "confidences": 0.6
}

Pipelines

Les trois types de pipelines (complet, entraînement et évaluation) sont pris en charge par ce package.

Lorsque vous entraînez le modèle pour la première fois, les classes seront déduites en examinant l'ensemble de données fourni.

Format d'ensemble de données

Ce paquet ML recherchera les fichiers csv dans votre ensemble de données (pas dans les sous-répertoires)

Les fichiers csv doivent suivre ces deux règles :

la première ligne des données doit contenir les noms d'en-tête et des colonnes.
toutes les colonnes, à l'exception de target_column, doivent être numériques (int, float). Le modèle n'est pas en mesure d'effectuer un encodage de fonctionnalités, mais il est capable d'effectuer un encodage de cible. Si l'encodage de cible est effectué par le modèle à l'heure de prévision, le modèle renvoie également le libellé de la variable cible.

Variables de l'environnement

train_time : temps d'exécution du pipeline (en minutes). Plus le temps d'apprentissage est long, meilleures sont les chances que TPOT trouve un bon modèle. (par défaut : 2)
target_column : nom de la colonne cible (par défaut : "target")
scoring : TPOT utilise sklearn.model_selection.cross_val_score pour évaluer les pipelines, et en tant que tel offre le même support pour les fonctions de scoring (par défaut : « exactitude »). Il utilise les métriques de notation scikit-learn standard (https://scikit-learn.org/stable/modules/model_evaluation.html)
keep_training : les exécutions TPOT typiques prendront des heures, voire des jours, pour se terminer (sauf s'il s'agit d'un petit ensemble de données), mais vous pouvez toujours interrompre l'exécution à mi-chemin et consulter les meilleurs résultats trouvés jusqu'ici. Si keep_training est défini sur True, TPOT continuera l'entraînement là où il l'avait laissé

Remarque : si la colonne cible de votre fichier est différente de la valeur par défaut (target), vous devez mettre à jour manuellement la variable d’environnement target_column . Vous pouvez le faire dans la fenêtre Créer une nouvelle exécution de pipeline (Create new pipeline run) en sélectionnant le bouton + Ajouter un nouveau (Add new ) dans la section Saisir les paramètres (Enter parameters) . Dans le champ Variable d'environnement (Environment variable) , ajoutez la variable (target_column) et dans le champ Valeur (Value) , ajoutez le nom de la colonne de votre fichier.

Artefacts

TPOT exporte le code Python correspondant pour le pipeline optimisé vers un fichier python appelé « TPOT_pipeline.py ». Une fois l'exécution du code terminée, « TPOT_pipeline.py » contiendra le code Python pour le pipeline optimisé.