ai-center

latest

false

Primeros pasos
Notificaciones
- Mis notificaciones
Proyectos
- Acerca de los proyectos
- Gestionar proyectos
Conjuntos de datos
- Acerca de los conjuntos de datos
- Gestión de conjuntos de datos
Etiquetado de datos
Paquetes ML
Paquetes listos para usar
Procesos
Habilidades ML
- Acerca de las habilidades ML
- Gestión de habilidades ML
Logs de ML
- Acerca de los registros ML
Document UnderstandingTM en AI Center
- Administrador de documentos
- Servicios de OCR
API de AI Center
- Información general
- Lista de API
Licencia
Plantillas de soluciones de AI
- Acerca de las plantillas de soluciones de AI
  - Enviar un correo electrónico a AI
Tutorial
- Paquetes ML
  - Utilizar NER personalizado con aprendizaje continuo
- Habilidades ML
Guía básica de resolución de problemas

Importante :

Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Guía del usuario de AI Center

Clasificación TPOT XGBoost

Paquetes del SO > Datos tabulares > TPOTXGBoostClassification

Este modelo es un modelo de clasificación genérico de datos tabulares (solo valores numéricos) que debe reentrenarse antes de utilizarse para las predicciones. Depende de TPOT para encontrar automáticamente el mejor modelo.

TPOT es una herramienta de aprendizaje automático automatizado de Python que optimiza los procesos de aprendizaje automático utilizando programación genética. TPOT automatiza la parte más tediosa del aprendizaje automático explorando de forma inteligente miles de procesos posibles para encontrar el mejor para tus datos. Una vez que TPOT haya terminado de buscar (o te canses de esperar), te proporciona el código Python para el mejor proceso encontrado para que puedas jugar con el proceso a partir de ahí. TPOT se basa en scikit-learn, por lo que todo el código que genera debe resultar familiar para los usuarios de scikit-learn.

Esta versión de TPOT solo utiliza XGBoost y el conjunto estándar de métodos de preprocesamiento para optimizar un proceso de aprendizaje automático.

Detalles del modelo

Tipo de entrada

JSON

Descripción de entrada

Características que utiliza el modelo para hacer predicciones. Por ejemplo: { “Feature1”: 12, “Feature2”: 222, ..., “FeatureN”: 110}

Descripción de salida

JSON con clase predicha, confianza asociada en esa predicción de clase (entre 0 y 1) y nombre de etiqueta. Los nombres de etiqueta solo se devuelven si la codificación de la etiqueta fue realizada por el proceso, dentro de AI Center. Algunos modelos de scikit-learn no admiten puntuaciones de confianza. Si la salida del proceso de optimización es un modelo de scikit-learn que no admite puntuaciones de confianza, la salida solo contendrá la clase predicha.

Ejemplo:

{
  "predictions": 0,
  "confidences": 0.6,
  "labels": "yes"
}
{
  "predictions": 0,
  "confidences": 0.6,
  "labels": "yes"
}

O, si se ha realizado la codificación de etiquetas fuera del modelo:

{
  "predictions": 0,
  "confidences": 0.6
}
{
  "predictions": 0,
  "confidences": 0.6
}

Procesos

Este paquete es compatible con los tres tipos de procesos (entrenamiento completo, entrenamiento y evaluación).

Mientras entrenas el modelo por primera vez, se inferirán clases viendo todo el conjunto de datos proporcionado.

Formato del conjunto de datos

Este paquete ML buscará archivos .csv en tu conjunto de datos (no en los subdirectorios).

Los archivos .csv deben seguir estas dos reglas:

La primera fila de los datos debe contener los nombres de encabezado/columna.
Todas las columnas, excepto la de target_column, deben ser numéricas (int, float). El modelo no es capaz de realizar la codificación de características; sin embargo, puede realizar la codificación del target. Si el modelo lleva a cabo la codificación del target, en el momento de la predicción, el modelo también devuelve la etiqueta de la variable de destino.

Variables de entorno

max_time_mins: tiempo de ejecución del proceso (en minutos). Cuanto mayor sea el tiempo de entrenamiento, mayores serán las posibilidades de que TPOT encuentre un buen modelo. (valor predeterminado: 2).
target_column: nombre de la columna de destino (valor predeterminado: "target").
puntuación: TPOT hace uso de sklearn.model_selection.cross_val_score para evaluar procesos y, como tal, ofrece el mismo soporte para funciones de puntuación (predeterminado: "precisión"). Utiliza métricas de puntuación estándar de scikit-learn.
keep_training: las ejecuciones de TPOT típicas tardarán de horas a días en terminar (a menos que se trate de un conjunto de datos pequeño), pero siempre puedes interrumpir la ejecución en medio y ver los mejores resultados hasta el momento. Si keep_training está establecido en true, TPOT continuará el entrenamiento en el que se detuvo.

Nota:

Si la columna de destino de tu archivo es diferente al valor predeterminado (target), debes actualizar la variable de entorno target_column manualmente. Puedes hacerlo en la ventana Crear nueva ejecución de proceso seleccionando el botón + Añadir nuevo en la sección Introducir parámetros . En el campo Variable de entorno , añade la variable (target_column) y en el campo Valor , añade el nombre de la columna de tu archivo.

Artefactos

TPOT exporta el código Python correspondiente para el proceso optimizado a un archivo python llamado "TPOT_pipeline.py". Una vez que el código haya terminado de ejecutarse, "TPOT_pipeline.py." contendrá el código Python para el proceso optimizado.

Papel

El modelo se basa en dos publicaciones:

En esta página

Tipo de entrada
Descripción de entrada
Descripción de salida
Formato del conjunto de datos
Variables de entorno
Artefactos

¿Te ha resultado útil esta página?

AnteriorRegresión TPOT AutoML

Sig.Regresión TPOT XGBoost

Guía del usuario de AI Center

Tipo de entrada​

Descripción de entrada​

Descripción de salida​

Formato del conjunto de datos​

Variables de entorno​

Artefactos​