AI Center
Más reciente
False
Imagen de fondo del banner
AI Center
Última actualización 18 de abr. de 2024

Regresión TPOT AutoML

Paquetes del SO > Datos tabulares > TPOTAutoMLRegression

Este modelo es un modelo tabular genérico de regresión de datos (solo valores numéricos) que debe entrenarse antes de utilizarse para las predicciones. Depende de TPOT para encontrar automáticamente el mejor modelo.

TPOT es una herramienta de aprendizaje automático automatizado de Python que optimiza los procesos de aprendizaje automático mediante programación genética. TPOT automatiza la parte más tediosa del aprendizaje automático explorando de forma inteligente miles de posibles procesos para encontrar el mejor para tus datos. Una vez que TPOT haya terminado de buscar (o te canses de esperar), te proporcionará el código Python para el mejor proceso encontrado para que puedas jugar con el proceso a partir de ahí. TPOT se basa en scikit-learn, por lo que todo el código que genera debería resultar familiar para los usuarios de scikit-learn.

Detalles del modelo

Tipo de entrada

JSON

Descripción de entrada

Características que utiliza el modelo para hacer predicciones. Por ejemplo: { “Feature1”: 12, “Feature2”: 222, ..., “FeatureN”: 110}

Descripción de salida

JSON con lista de predicciones:

Ejemplo:

{ "predictions" : "[12, 12, 2, 354, 12, 2] }{ "predictions" : "[12, 12, 2, 354, 12, 2] }

Procesos

Este paquete es compatible con los tres tipos de procesos (entrenamiento completo, entrenamiento y evaluación).

Formato del conjunto de datos

Este paquete ML buscará archivos .csv en tu conjunto de datos (no en los subdirectorios).

Los archivos .csv deben seguir estas dos reglas:

  • La primera fila de los datos debe contener los nombres de encabezado/columna.
  • todas las columnas deben ser numéricas (int, float). El modelo no es capaz de realizar la codificación de características; sin embargo, puede realizar la codificación del target. Si el modelo lleva a cabo la codificación del target, en el momento de la predicción, el modelo también devuelve la etiqueta de la variable de destino.

Variables de entorno

  • max_time_mins: tiempo de ejecución del proceso (en minutos). Cuanto mayor sea el tiempo de entrenamiento, mayores serán las posibilidades de que TPOT encuentre un buen modelo. (valor predeterminado: 2).
  • target_column: nombre de la columna de destino (valor predeterminado: "target").
  • puntuación: TPOT utiliza sklearn.model_selection.cross_val_score para evaluar procesos, y como tal ofrece el mismo soporte para funciones de puntuación (por defecto: "precisión"). Utiliza métricas de puntuación estándar de scikit-learn (https://scikit-learn.org/stable/modules/model_evaluation.html)
  • keep_training: las ejecuciones de TPOT típicas tardarán de horas a días en terminar (a menos que se trate de un conjunto de datos pequeño), pero siempre puedes interrumpir la ejecución en medio y ver los mejores resultados hasta el momento. Si keep_training está establecido en true, TPOT continuará el entrenamiento en el que se detuvo.
Aviso: Si la columna de destino de su archivo es diferente al valor por defecto (target), debes actualizar la variable de entorno target_column manualmente. Puedes hacerlo en la ventana Crear proceso nuevo haciendo clic en el botón + Añadir nuevo en la sección Introducir parámetros. En el campo Variable de entorno añade la variable (target_column), y en el campo Valor añade el nombre de la columna de su archivo. Cuando hayas finalizado, haz clic en el símbolo.


Artefactos

TPOT exporta el código Python correspondiente para el proceso optimizado a un archivo python llamado "TPOT_pipeline.py". Una vez que el código haya terminado de ejecutarse, "TPOT_pipeline.py." contendrá el código Python para el proceso optimizado.

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.