ai-center

latest

false

Notes de publication
Démarrage
Notifications
- Mes notifications
Projets
- À propos des projets
- Gérer des projets
Jeux de données
- À propos des jeux de données
- Gestion des ensembles de données
Labellisation des données
Paquets ML
Paquets prêts à l’emploi
Pipelines
Compétences ML
- À propos des compétences ML
- Gestion des compétences ML
Journaux ML
- À propos des journaux ML
Document UnderstandingTM dans AI Center
- Document Manager
- Services OCR
API AI Center
- Vue d'ensemble (Overview)
- Liste des API
Licences
Modèles de solutions d'IA
- À propos des modèles de solutions d'IA
  - E-mail d'IA
Comment
- Paquets ML
  - Utilisez le NER personnalisé avec l'apprentissage continu
- Compétences ML
Guide de dépannage de base

Important :

Veuillez noter que ce contenu a été localisé en partie à l’aide de la traduction automatique. La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

AI Center

PRODUIT :

Dernière mise à jour 2 mai 2025

Utilisez le NER personnalisé avec l'apprentissage continu

Informations d'arrière-plan

Cet exemple est utilisé pour extraire des produits chimiques selon la catégorie mentionnée dans les documents de recherche. En suivant cette procédure, vous extrayez les produits chimiques et les catégorisez en ABRÉVIATION, FAMILLE, FORMULE, IDENTIFIANT, MULTIPLE, SYSTÉMATIQUE, TRITRI Data etNO_CLASS.

Prérequis

Cette procédure utilise le package Reconnaissance d'entités nommées personnalisées (Customer Named Entity Recognition) . Pour plus d'informations sur le fonctionnement de ce package et son utilisation, consultez la page Reconnaissance d'entités nommées personnalisées .

Pour cette procédure, nous avons fourni des exemples de fichiers comme suit :

Ensemble de données d'entraînement pré-labellisé au format CoNLL. Vous pouvez télécharger l'ensemble de données d'entraînement à partir du lien suivant : ensemble de données d'entraînement.
Ensemble de données de test pré-labellisé. Vous pouvez télécharger l'ensemble de données de test à partir du lien suivant : ensemble de données de test.
Exemple de workflow pour l'extraction de catégories de produits chimiques mentionnés dans les documents de recherche. Vous pouvez le télécharger à partir du lien suivant : exemple de workflow.
Remarque : assurez-vous que les variables suivantes sont renseignées dans l'exemple de fichier :
- in_emailAdress - l'adresse e-mail à laquelle la tâche Action Center sera affectée
- in_MLSkillEndpoint - point de terminaison public de la compétence ML
- in_MLSkillAPIKey - Clé API de la compétence ML
- in_labelStudioEndpoint – facultatif, pour activer la labellisation continue : fournissez l'URL d'importation d'un projet Label Studio

Procédure

Utilisez les étapes suivantes pour extraire les produits chimiques des documents de recherche en fonction de leur catégorie.

Importez l’exemple d’ensemble de données dans UiPath® AI Center. Pour ce faire, accédez au menu Ensembles de données ( Datasets ) et téléchargez le dossier train et test à partir de l'échantillon.
Sélectionnez le package NER personnalisé souhaité dans Paquets ML (ML Packages) > Packages prêts à l'emploi (Out of the Box Packages) > UiPath Language Analysis et créez-le.
Accédez au menu Pipelines et créez une nouvelle exécution de pipeline complète pour le package créé à l'étape précédente. Pointez sur l'ensemble de données d'entraînement et de test fourni dans l'exemple de fichier.

Une fois terminé, les résultats du pipeline sont disponibles sous Artefacts (Artifacts). Vous pouvez télécharger le rapport de classification pour évaluer les résultats des tests.
Créez une nouvelle compétence ML à l'aide du package généré par le pipeline exécuté à l'étape précédente et déployez-la.
Une fois la compétence déployée, exploitez-la dans le workflow UiPath® Studio fourni. Pour activer la capture de données avec des prédictions faibles, déployez une instance Label Studio et fournissez l'URL de l'instance et la clé API dans l'activité Label Studio du workflow.

Premiers pas avec Label Studio

Installez Label Studio sur votre machine locale ou l'instance cloud. Pour ce faire, suivez les instructions de la page Label Studio .
Créez un nouveau projet à partir du modèle de reconnaissance d'entité nommée (Named Entity Recognition Template) et définissez vos noms de libellés (Label Names).
Assurez-vous que les noms de libellés ne comportent pas de caractères spéciaux ou d'espaces. Par exemple, au lieu de Set Date, utilisez SetDate.
Assurez-vous que la valeur de la balise <Text> est "$text".

Importez les données à l'aide de l'API à partir de la page API de Label Studio .

Exemple de requête cURL :

curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\)
--header 'Content-Type: application/json' \)\)
--header 'Authorization: Token <Token>' \)\)
--data-raw '[
    {
      "data": {
        "text": "<Text1>"
      },
    },
    {
      "data": {
        "text": "<Text2>"
       }
    }
]'curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\)
--header 'Content-Type: application/json' \)\)
--header 'Authorization: Token <Token>' \)\)
--data-raw '[
    {
      "data": {
        "text": "<Text1>"
      },
    },
    {
      "data": {
        "text": "<Text2>"
       }
    }
]'

Annotez vos données.
Exportez les données au format CoNLL 2003 et téléchargez-les sur AI Center.
Fournit l'URL de l'instance Label Studio et la clé API dans l'exemple de workflow fourni afin de capturer des prédictions incorrectes et peu fiables.