- Notas relacionadas
- Primeros pasos
- Notificaciones
- Proyectos
- Conjuntos de datos
- Etiquetado de datos
- Paquetes ML
- Paquetes listos para usar
- Procesos
- Habilidades ML
- Logs de ML
- Document UnderstandingTM en AI Center
- API de AI Center
- Licencia
- Plantillas de soluciones de AI
- Tutorial
- Utilizar NER personalizado con aprendizaje continuo
- Guía básica de resolución de problemas
Utilizar NER personalizado con aprendizaje continuo
Este ejemplo se utiliza para extraer productos químicos por la categoría mencionada en informes de investigación. Al seguir el siguiente procedimiento, extraerás los productos químicos y los clasificarás como ABBREVIATION, FAMILY, FORMULA, IDENTIFIER, MULTIPLE, SYSTEMATIC, TRIVIAL y NO_CLASS.
Este procedimiento utiliza el paquete Reconocimiento personalizado de entidad con nombre. Para obtener más información sobre cómo funciona este paquete y para qué se puede utilizar, consulta Reconocimiento personalizado de entidades con nombre.
Para este procedimiento, hemos proporcionado archivos de muestra de la siguiente manera:
- Conjunto de datos preetiquetado en formato CoNLL. Puedes descargarlo aquí.
- Conjunto de datos de prueba preetiquetado. Puedes descargarlo aquí.
- Flujo de trabajo de muestra para extraer categorías de productos químicos mencionados en informes de investigación. Puedes descargarlo aquí.
Aviso: Asegúrate de que las siguientes variables se rellenan en el archivo de muestra:
in_emailAdress
: la dirección de correo electrónico a la que se asignará la tarea de Action Center.in_MLSkillEndpoint
: punto de conexión público de la habilidad ML.in_MLSkillAPIKey
: clave API de la habilidad ML.in_labelStudioEndpoint
: (opcional) para habilitar el etiquetado continuo: proporciona la URL de importación de un proyecto de estudio de etiquetas.
Para dar tus primeros pasos en Label Studio y exportar datos a AI Center, sigue las instrucciones que aparecen a continuación.
- Instala Label Studio en tu máquina local o instancia en la nube. Para hacerlo, sigue las instrucciones que aparecen aquí.
- Crea un nuevo proyecto desde Plantilla de reconocimiento de entidades con nombre y define los nombres de etiqueta.
- Asegúrate de que los nombres de etiqueta no tienen caracteres especiales ni espacios. Por ejemplo, en lugar de
Set Date
, utilizaSetDate
. - Asegúrate de que el valor de la etiqueta
<Text>
es"$text"
. - Carga los datos utilizando la API desde aquí.
Ejemplo de solicitud cURL:
curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\) --header 'Content-Type: application/json' \)\) --header 'Authorization: Token <Token>' \)\) --data-raw '[ { "data": { "text": "<Text1>" }, }, { "data": { "text": "<Text2>" } } ]'
curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\) --header 'Content-Type: application/json' \)\) --header 'Authorization: Token <Token>' \)\) --data-raw '[ { "data": { "text": "<Text1>" }, }, { "data": { "text": "<Text2>" } } ]' - Anota tus datos.
- Exporta los datos en el formato CoNLL 2003 y cárgalos en AI Center.
- Proporcionamos la URL de la instancia de Label Studio y la clave API en el flujo de trabajo de muestra proporcionado para capturar predicciones incorrectas y de poca confianza.