document-understanding

2022.10

false

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Guide de l'utilisateur de Document Understanding

PRODUIT :

Dernière mise à jour 6 nov. 2025

Utiliser le gestionnaire de documents

Cette page décrit comment utiliser Data Manager pour labelliser un nouvel ensemble de données et recycler un modèle ML.

Access and configure Document Manager

Lancez la session de labellisation de données créée dans Première expérience d'exécution (First Run Experience) et accédez aux paramètres pour configurer l'OCR.

Choisissez l'OCR que vous souhaitez utiliser dans le menu déroulant de la méthode OCR. Pour UiPathDocumentOCR, collez la clé de licence Document UnderstandingTM (récupérez la clé API Document Understanding depuis la page Admin > Licence), puis collez l'URL OCR que vous avez générée lorsque vous avez déployé UipathDocumentOCR.

Configurez l'étiquetage préalable avec les modèles que vous avez déployés en suivant les instructions fournies ici. Collez le point de terminaison public du modèle Compétence ML et la clé de licence Document Understanding, puis sélectionnez Enregistrer.

Pour plus de détails, veuillez consulter la documentation ici : Utiliser un schéma prédéfini.

Importer des documents

Cliquez sur le bouton Importer (Import) depuis une session Data Manager.
Donnez un nom à l’ensemble de données et cliquez sur Parcourir les fichiers à télécharger (Browse files to upload).
Sélectionnez le document que vous souhaitez télécharger.
Sélectionnez Oui.

Créer des champs d'extraction

Sélectionnez Icône Plus pour créer les champs à extraire.

Vous pouvez créer jusqu'à 40 champs.

Pour cet exercice de validation, vous pouvez créer des champs de facture courants tels que date, nom, numero-de-facture et total. Veuillez vous assurer de modifier le type de contenu en conséquence : date (date), nom (string), numéro de facture (string) et total (nombre).

Labelliser des documents

Vous pouvez maintenant commencer à labelliser les documents.

Sélectionnez le bouton Prédire Icône Prédire en haut pour utiliser le modèle de facture de base pour prédire les étiquettes des champs définis et corrigez-le si la prédiction est inexacte.

Pour modifier l'étiquette, faites glisser la souris sur le champ et appuyez sur le raccourci clavier pour l'étiqueter.

Utilisez la flèche du haut pour passer au document suivant jusqu'à ce que vous ayez terminé la validation des libellés pour toutes les factures téléchargées.

Remarque : étant donné que le modèle de base Factures (Invoices) a déjà très bien fonctionné et que l'exemple de facture est simple sans présenter trop de variations différentes, la précision de la prédiction est proche de 100 % dans ce cas et vous n'aurez peut-être pas besoin de corriger les étiquettes.

Exporter des documents

Veillez à sélectionner l'ensemble de données correct dans le filtrage des ensembles de données et sélectionnez le bouton Exporter .
Sélectionnez Exporter(Export) .
Accédez à la section Ensembles de données du même projet AI Center, où vous pourrez voir l'ensemble de données d'entraînement exporté.

Former un modèle personnalisé sur AI Center

Accédez à Pipelines > Créer un nouveau fichier (Create new). Veuillez sélectionner le type d'exécution d'évaluation, sélectionner le package de modèle et l'ensemble de données d'entrée.
Sélectionnez le sous-dossier sous Exporter (Export) comme ensemble de données d’entrée.
Sélectionnez Créer (Create) pour démarrer le pipeline. L’exécution du pipeline sur les machines à processeur peut prendre 1 à 2 heures.

Déployer le modèle ML recyclé en tant que compétence ML

Accédez à Compétences ML (ML Skills) et créez une nouvelle compétence ML.

Choisissez le même package de modèle de facture créé auparavant. Comme nous avons reformé le modèle, il existe maintenant une nouvelle version mineure du package (1 vs 0). Assurez-vous de sélectionner le dernier.

Une fois que la compétence ML est créée, accédez à la section Modifier le déploiement actuel pour publier la compétence ML. Cliquez sur le bouton bascule et sélectionnez Confirmer.

Copiez l'URL de la compétence ML publique pour une utilisation ultérieure.

Félicitations ! Vous avez maintenant recyclé un modèle Facture (Invoice) avec votre propre ensemble de données et créé le point de terminaison pour accéder au modèle.

Sommaire de la page