ai-center
latest
false
Importante :
Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.
UiPath logo, featuring letters U and I in white

AI Center

Última actualización 2 de may. de 2025

Utilizar NER personalizado con aprendizaje continuo

Información en segundo plano

Este ejemplo se utiliza para extraer productos químicos por la categoría mencionada en los trabajos de investigación. Al seguir este procedimiento, extraerá los productos químicos y los clasificará como ABREVIATURA, FAMILIA, FÓRMULA, IDENTIFICADOR, MÚLTIPLE, SISTEMÁTICO, TRIVIAL y SIN CLASE.

Requisitos previos

Este procedimiento utiliza el paquete Reconocimiento de entidades con nombre personalizado . Para obtener más información sobre cómo funciona este paquete y para qué se puede utilizar, consulta la página Reconocimiento personalizado de entidades con nombre .

Para este procedimiento, hemos proporcionado archivos de muestra de la siguiente manera:

  • Conjunto de datos de entrenamiento preetiquetado en formato CoNLL. Puedes descargar el conjunto de datos de entrenamiento desde el siguiente enlace: conjunto de datos de entrenamiento.
  • Conjunto de datos de prueba preetiquetado. Puedes descargar el conjunto de datos de prueba desde el siguiente enlace: conjunto de datos de prueba.
  • Flujo de trabajo de muestra para extraer categorías de productos químicos mencionados en trabajos de investigación. Puedes descargarlo desde el siguiente enlace: flujo de trabajo de muestra.
    Aviso: Asegúrate de que las siguientes variables se rellenan en el archivo de muestra:
    • in_emailAdress: la dirección de correo electrónico a la que se asignará la tarea de Action Center.
    • in_MLSkillEndpoint: punto de conexión público de la habilidad ML.
    • in_MLSkillAPIKey: clave API de la habilidad ML.
    • in_labelStudioEndpoint: (opcional) para habilitar el etiquetado continuo: proporciona la URL de importación de un proyecto de estudio de etiquetas.

Procedimiento

Utilice los siguientes pasos para extraer productos químicos por categoría de los trabajos de investigación.
  1. Importa el conjunto de datos de muestra en UiPath® AI Center. Para ello, ve al menú Conjuntos de datos y carga las carpetas train y test de la muestra.
  2. Selecciona el paquete personalizado NER de Paquetes ML > Paquetes listos para usar > Análisis de idioma de UiPath y créalo.
  3. Ve al menú Procesos y crea una nueva ejecución de procesos completa para el paquete creado en el paso anterior. Señala al entrenamiento y el conjunto de datos de prueba proporcionado en el archivo de muestra.

    Una vez completado, los resultados del proceso estarán disponibles en Artefactos. Puedes descargar el informe de clasificación para evaluar los resultados de la prueba.

  4. Crea una nueva habilidad ML utilizando el paquete generado por la ejecución del proceso en el paso anterior e impleméntala.
  5. Una vez implementada la habilidad, aprovéchala en el flujo de trabajo de UiPath® Studio proporcionado. Para habilitar la captura de datos con predicciones débiles, implementa una instancia de Label Studio y proporciona la URL de la instancia y la clave API en la actividad de Label Studio en el flujo de trabajo.

Primeros pasos con Label Studio

  1. Instala Label Studio en tu máquina local o instancia en la nube. Para ello, sigue las instrucciones de la página de Label Studio .
  2. Crea un nuevo proyecto desde Plantilla de reconocimiento de entidades con nombre y define los nombres de etiqueta.


  3. Asegúrate de que los nombres de etiqueta no tienen caracteres especiales ni espacios. Por ejemplo, en lugar de Set Date, utiliza SetDate.
  4. Asegúrate de que el valor de la etiqueta <Text> es "$text".


  5. Carga los datos utilizando la API desde la página de la API de Label Studio .

    Ejemplo de solicitud cURL:

    curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\)
    --header 'Content-Type: application/json' \)\)
    --header 'Authorization: Token <Token>' \)\)
    --data-raw '[
        {
          "data": {
            "text": "<Text1>"
          },
        },
        {
          "data": {
            "text": "<Text2>"
           }
        }
    ]'curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\)
    --header 'Content-Type: application/json' \)\)
    --header 'Authorization: Token <Token>' \)\)
    --data-raw '[
        {
          "data": {
            "text": "<Text1>"
          },
        },
        {
          "data": {
            "text": "<Text2>"
           }
        }
    ]'
  6. Anota tus datos.
  7. Exporta los datos en el formato CoNLL 2003 y cárgalos en AI Center.
  8. Proporcionamos la URL de la instancia de Label Studio y la clave API en el flujo de trabajo de muestra proporcionado para capturar predicciones incorrectas y de poca confianza.

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White