ai-center

latest

false

Primeros pasos
Notificaciones
- Mis notificaciones
Proyectos
- Acerca de los proyectos
- Gestionar proyectos
Conjuntos de datos
- Acerca de los conjuntos de datos
- Gestión de conjuntos de datos
Etiquetado de datos
Paquetes ML
Paquetes listos para usar
Procesos
- Acerca de los procesos
  - Procesos de entrenamiento
  - Procesos de evaluación
  - Procesos completos
- Gestionar procesos
- Cerrar el bucle
Habilidades ML
- Acerca de las habilidades ML
- Gestión de habilidades ML
Logs de ML
- Acerca de los registros ML
Document UnderstandingTM en AI Center
- Administrador de documentos
- Servicios de OCR
API de AI Center
- Información general
- Lista de API
Licencia
Plantillas de soluciones de AI
- Acerca de las plantillas de soluciones de AI
  - Enviar un correo electrónico a AI
Tutorial
- Paquetes ML
  - Utilizar NER personalizado con aprendizaje continuo
- Habilidades ML
Guía básica de resolución de problemas

Importante :

Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Guía del usuario de AI Center

Procesos de entrenamiento

Se utiliza un proceso de entrenamiento para entrenar un nuevo modelo de aprendizaje automático. Para utilizar este proceso, el paquete debe contener código para entrenar un modelo (la función train() en el archivo train.py) y código para mantener un modelo recién entrenado (la función save() en el archivo train.py). Estos, junto con un conjunto de datos o una subcarpeta dentro de un conjunto de datos, generan una nueva versión de paquete.

Crear procesos de entrenamiento

Crea un nuevo proceso de entrenamiento y asegúrate de proporcionar la siguiente información específica del proceso de entrenamiento:

En el campo Tipo de proceso, selecciona Ejecución de entrenamiento.
En el campo Elegir conjunto de datos de input, selecciona un conjunto de datos o una carpeta desde la que quieres importar datos para el entrenamiento. Todos los archivos en este conjunto de datos/carpeta deben estar disponibles localmente durante el tiempo de ejecución del proceso, ya que se transmiten al primer argumento de tu función train() (es decir, la ruta a los datos montados se transferirá a la variable data_directory en la definición train(self, data_directory)).
En la sección Introducir parámetros, escribe las variables de entorno definidas y utilizadas por tu proceso, si las hubiera. Las variables de entorno que se establecen de forma predeterminada son las siguientes:
- artifacts_directory, con artefactos de valor predeterminado: define la ruta a un directorio que se conserva como datos auxiliares relacionados con este proceso. La mayoría, si no todos los usuarios, nunca tienen la necesidad de anular esto a través de la IU. Se puede guardar cualquier cosa durante la ejecución del proceso, incluidas imágenes, archivos PDF y subcarpetas. En concreto, cualquier dato que tu código escriba en el directorio especificado por la ruta os.environ['artifacts_directory'] se carga al final de la ejecución del proceso y se podrá ver desde la página Detalles del proceso .
- save_training_data, con el valor predeterminado false: si se establece en true, la carpeta elegida en Choose input dataset se carga al final de la ejecución del proceso como una salida del proceso en el directorio data_directory.
  Nota:
  Puede que la ejecución del proceso lleve algún tiempo. Échale un vistazo después de un tiempo para ver su estado.

Una vez ejecutado el proceso, habrá una nueva versión secundaria del paquete disponible, y esta se muestra en la página Paquetes ML > [Nombre del paquete]. En nuestro ejemplo, esta es la versión del paquete 1.1.

En la página Procesos, el estado del proceso cambió a Con éxito. La página Detalles del proceso muestra los archivos y carpetas arbitrarios relacionados con la ejecución del proceso. En nuestro ejemplo, la ejecución creó un archivo llamado my-training-artifact.txt.

Analogía conceptual para crear tu propio proceso de entrenamiento

Nota:

Este es un ejemplo simplificado. Su propósito es ilustrar cómo los conjuntos de datos y los paquetes interactúan en un proceso de entrenamiento. Los pasos son meramente conceptuales y no representan cómo funciona la plataforma.

Copia la versión 1.0 del paquete en ~/mlpackage.
Copia el conjunto de datos de input o la subcarpeta del conjunto de datos seleccionada desde la IU a ~/mlpackage/data.
Ejecuta el siguiente código python:
```
from train import Main 
m = Main() 
m.train(‘./data’) 
m.save()
from train import Main 
m = Main() 
m.train(‘./data’) 
m.save()
```
Mantén el contenido de ~/mlpackage como versión del paquete 1.1. Mantén los artefactos si se escriben, haz una instantánea de los datos si save_data está establecido en true.

Salida de los procesos

El archivo _results.json contiene un resumen de la ejecución del proceso y expone todas los inputs/outputs y los tiempos de ejecución para un proceso de entrenamiento.

{
    "parameters": {
        "pipeline": "< Pipeline_name >",
        "inputs": {
            "package": "<Package_name>",
            "version": "<version_number>",
            "train_data": "<storage_directory>",
            "gpu": "True/False"
        },
        "env": {
            "key": "value",
            ...
        }
    },
    "run_summary": {
     "execution_time": <time>, #in seconds 
     "start_at": <timestamp>, #in seconds 
     "end_at": <timestamp>, #in seconds 
     "outputs": {
        "train_data": "<test_storage_directory>", 
        "artifacts_data": "<artifacts_storage_directory>", 
        "package": "<Package_name>",
        "version": "<new_version>"
            }
    }
}
{
    "parameters": {
        "pipeline": "< Pipeline_name >",
        "inputs": {
            "package": "<Package_name>",
            "version": "<version_number>",
            "train_data": "<storage_directory>",
            "gpu": "True/False"
        },
        "env": {
            "key": "value",
            ...
        }
    },
    "run_summary": {
     "execution_time": <time>, #in seconds 
     "start_at": <timestamp>, #in seconds 
     "end_at": <timestamp>, #in seconds 
     "outputs": {
        "train_data": "<test_storage_directory>", 
        "artifacts_data": "<artifacts_storage_directory>", 
        "package": "<Package_name>",
        "version": "<new_version>"
            }
    }
}

El archivo .zip del paquete ML es la nueva versión del paquete generada automáticamente por el proceso de entrenamiento.

La carpeta Artefactos, visible solo si no está vacía, es una carpeta que reagrupa todos los artefactos generados por el proceso y se guardan en la carpeta artifacts_directory.

La carpeta Conjunto de datos, existente solo si save_data se estableció en el valor true predeterminado, es una copia de la carpeta del conjunto de datos de input.

Control del modelo

La gobernanza en el aprendizaje automático es algo para lo que muy pocas empresas están preparadas. Al permitir que cada modelo tome una instantánea de los datos en los que se entrenó, AI Center permite a las empresas tener trazabilidad de los datos.

Prácticamente, puedes obtener una instantánea de los datos de input si transmites el parámetro save_training_data = true, que realiza una instantánea de los datos que se transmiten como input. A partir de ahí, un usuario siempre puede ir a la página Detalles del proceso correspondiente para ver exactamente qué datos se utilizaron en el momento del entrenamiento.

En esta página

Crear procesos de entrenamiento
Analogía conceptual para crear tu propio proceso de entrenamiento
Salida de los procesos
Control del modelo

¿Te ha resultado útil esta página?

AnteriorAcerca de los procesos

Sig.Procesos de evaluación

Guía del usuario de AI Center

Crear procesos de entrenamiento​

Analogía conceptual para crear tu propio proceso de entrenamiento​

Salida de los procesos​

Control del modelo​

¿Te ha resultado útil esta página?

Crear procesos de entrenamiento

Analogía conceptual para crear tu propio proceso de entrenamiento

Salida de los procesos

Control del modelo