document-understanding
latest
false
UiPath logo, featuring letters U and I in white

Guide de l'utilisateur de Document Understanding

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Dernière mise à jour 12 déc. 2024

IA des formulaires

Forms AI est désormais disponible dans le cadre de Document UnderstandingTM et peut être utilisé pour télécharger et traiter des formulaires structurés avec des mises en page et des champs standard.

Créer des formulaires AI

Forms AI est la première méthode d’extraction disponible dans Document Understanding. Obtenir davantage d’informations sur la création d’un nouveau projet dans Document Understanding.

Une fois le projet créé, vous devez suivre les étapes suivantes pour créer un type de document à l’aide de Forms AI dans le projet.

  1. Ouvrez votre projet.
  2. Sélectionnez le bouton Nouveau type de document (New Document Type).
  3. Ajoutez un nom à votre type de document.

Si vous souhaitez entraîner vos classifieurs de documents directement à partir de Document Understanding, vous pouvez utiliser la fonctionnalité Classification en un clic .

Remarque : les formulaires à mise en page fixe utilisés avec Forms AI peuvent avoir chacun une longueur maximale de cinq pages.

Convertir un Forms AI en type de document semi-structuré

Vous pouvez convertir un type de document Forms AI en type de document semi-structuré.

Lorsque vous convertissez un type de document Forms AI en type de document Semi-structuré (Document Manager), vous pouvez utiliser toutes les fonctionnalités disponibles dans Document Manager

L'option de conversion est idéale pour les scénarios complexes afin d'entraîner un modèle d'apprentissage automatique en profondeur plus puissant.

Comment convertir une session Forms AI

Vous avez le choix entre deux options si vous décidez de convertir une session Forms AI en session Document Manager.

À partir de la liste des types de documents du projet

Vous pouvez convertir un type de document directement à partir de la liste Types de documents du projet.

Accédez au menu Ouvrir l'accès (Open access) du type de document que vous souhaitez convertir et cliquez sur l'option Convertir en semi-structuré (Convert to Semi-Structured ). Une fenêtre contextuelle s'affiche vous demandant de confirmer les Actions.

Attention :

Une fois qu'un type de document a été converti, vous ne pouvez pas annuler les Actions.

À partir d'une session Forms AI ouverte

Ouvrez une session Forms AI déjà créée afin de la convertir en session semi-structurée.

Depuis la session ouverte, cliquez sur le menu Accèspuis cliquez sur l'option Convertir en semi-structuré (Convert to Semi-Structured ).

Attention : une fois qu’un type de document a été converti, vous ne pouvez plus annuler cette action.

Le bouton Convertir en semi-structuré ne s’affiche pas lorsque le projet ne dispose pas d’un lien AI Center.

Importer des documents

Une fois que le nouveau Forms AI est créé, une nouvelle fenêtre s’ouvre, vous demandant d’importer des données. Vous pouvez importer un minimum de deux documents et un maximum de vingt documents, chacun avec un maximum de cinq pages. Faites glisser et déposez ou recherchez les fichiers pour les télécharger.

Importer des documents est un autre moyen de convertir les documents Forms AI en documents AI semi-structurés. Une option apparaît si vous essayez de télécharger plus de 20 documents ou si l'un des documents comporte plus de 20 pages. Une fenêtre contextuelle s'affiche à l'écran, vous demandant si vous souhaitez convertir la session FormsAI en session semi-structurée.

Les champs extraits automatiquement doivent également être vérifiés pour la précision du type de contenu . Par exemple, si un champ de date a été automatiquement extrait, le Type de contenu (Content Type) doit être date. Toute inexactitude doit être corrigée manuellement.

Management bar

En haut de la page, vous trouverez la barre de gestion. Elle vous permet d’effectuer plusieurs opérations : naviguer entre les documents, supprimer/restaurer un document, rechercher/filtrer des documents, exécuter des prédictions de modèle d’IA, importer et exporter des documents.

Voici les éléments disponibles dans la barre de gestion :

Elément

Icon

Description

Navigation

Naviguez entre les documents qui correspondent au filtre actif.

Entre les deux flèches, un compteur s'affiche. Il représente le numéro du document actuel sur le nombre total de documents qui correspondent au filtre ou à la recherche active.

Rechercher (Search) et Rechercher dans le document (Search in document)

Rechercher (Search) - lancez une recherche ou filtrez les documents. Un filtre est également appliqué lors de l'exportation de documents. Vous pouvez également filtrer par mots d'un document ou par noms de documents.

Rechercher dans le document (Search in document) : lancez une recherche de texte dans le document en cliquant sur le bouton ou en utilisant le raccourci Ctrl + Shift + F

Supprimer / Restaurer

/

Supprime ou restaure un document. Les documents supprimés peuvent être trouvés sous le filtre supprimé (deleted).

Importer (Import)

Ouvrez la boîte de dialogue Importer des données (Import data).

Exporter (Export)

Ouvrez la boîte de dialogue Exporter les fichiers (Export files).

Nom et type de document

s/o

Le nom et le type du document actuellement actif.

Télécharger

L'option est disponible dans le menu déroulant à côté du nom du document.

Cliquez sur l'icône pour télécharger un fichier zip contenant le document original. Outre le document d'origine, toutes les pages converties en interne par Document Manager en images .jpeg sont également téléchargées.

Permanently delete

docs image

L'option est disponible dans la liste déroulante à côté du nom du document.

Supprime définitivement les fichiers individuels. Le .pdf et toutes ses images .jpeg sont supprimés de l'ensemble de données AI Center et toutes les métadonnées sont supprimées de la base de données.

Lorsque vous cliquez sur le bouton, un message contextuel apparaît vous demandant si vous êtes sûr de vouloir supprimer définitivement le document. Cliquez sur OK pour continuer ou sur Annuler (Cancel) pour revenir à l'écran précédent.

Prévoir (Predict)

Exécutez les prédictions du modèle d'IA et affichez les résultats.

Après avoir configuré le prébalisage, le bouton est activé dans la barre de gestion. Cliquez dessus pour prébaliser le document actuel.

Pour le moment, l'utilisation de l'option Prévoir (Predict) avec les prébalisages Points de terminaison publics (Public Endpoints) ne prébalise que les 10 premières pages d'un document. Il s'agit d'un problème connu et un correctif est en préparation. Cependant, utiliser l'option Prévoir (Predict) avec des compétences ML dans AI Center n'impose pas une telle limitation.

Publier

Publie l’extracteur Forms AI et crée le lien associé, disponible dans la liste des extracteurs du projet.

Paramètres

Configurez les paramètres d'OCR et de pré-labellisation, ou accédez au panneau Comment... (How to...).

Le bouton Paramètres a deux options disponibles :

  • Paramètres où vous pouvez voir la configuration OCR qui est automatiquement renseignée à partir des paramètres du projet.
  • Lemode d'accessibilité rend les valeurs brutes visibles
  • Comment... où vous pouvez trouver tous les raccourcis et commandes disponibles.

Session

s/o

Le nom de la session actuelle, qui se trouve en haut de la page, à côté du logo UiPath® Document UnderstandingTM .

Allons un peu plus loin pour comprendre la différence entre les options Supprimer (Delete) et Supprimer définitivement (Permanently Delete).

  • L'option Supprimer (Delete) supprime les fichiers sans les supprimer définitivement de votre projet. Vous pouvez toujours trouver les fichiers supprimés sous le filtre supprimé de la barre de recherche et les restaurer à l'aide de l'option Restaurer .
  • L’option Supprimer définitivement (Permanently Delete) supprime les fichiers sélectionnés sans aucune possibilité de les restaurer.

Le bouton Paramètres a deux options disponibles :

  • Paramètres (Settings) - où vous pouvez configurer le service OCR
  • Comment... - qui sert de menu d'aide

Champs de colonnes

Créer un nouveau champ de colonne

  1. Cliquez sur docs image dans la section Table en haut de la page pour ajouter un nouveau champ Colonne (Column). La fenêtre Créer un champ de colonne (Create Column Field) s'affiche.
  2. Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas _ et des tirets -.
  3. Cliquez sur OK.

Modifier un champ de colonne

Cliquez sur le bouton Modifier le champ (Edit field). Les options disponibles pour les champs de colonne se trouvent dans le tableau ci-dessous.

Option

Description

Nom du champ

Nom unique du champ.

Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, et le tiret bas _ et des tirets -.

Type de contenu

Le type de contenu d'un champ :

  • chaîne (string) : approprié pour les noms ou adresses des sociétés, ainsi que les conditions de paiement, ou pour tout autre domaine où le RPA Developer préfère créer la logique d’analyse ou de formatage manuellement, dans le workflow RPA.
  • number : utilisé pour les montants ou les quantités, avec une analyse intelligente des séparateurs décimaux/milliers.
  • date : le modèle analyse, formate et unifie la sortie au format aaaa-mm-jj.
  • phone : approprié pour les numéros de téléphone. Le formatage supprime les lettres et les parenthèses, et remplace les espaces par des tirets.
  • id-no : approprié pour les codes alphanumériques, les nombres d'identifiants, il est similaire au type de contenu de string, mais inclut la suppression de tous les caractères précédant un deux-points :. Si le numéro d'identification que vous devez extraire peut contenir des caractères deux-points :, veuillez utiliser chaîne (string) comme type de contenu à la place, afin d'éviter la perte de données.

Raccourci

Touche de raccourci pour ce champ. Une ou deux clés autorisées.

Fractionner les éléments

Cochez cette case si vous souhaitez que ce champ soit utilisé comme délimiteur entre les éléments de ligne ou les lignes d'un tableau. Toute ligne sur laquelle ce champ apparaît est considérée comme un nouvel élément ou une nouvelle ligne dans le tableau. Le plus souvent, cette fonction est utilisée dans les champs Lignes de montant (Line Amount) des éléments de ligne de la facture.

Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.

Leregroupement des lignes de la table est différent de celui utilisé dans AI Center Document Manager. Ici, les lignes sont automatiquement regroupées en fonction de l’état de la case à cocher Fractionner les éléments ( Split items ) sur chaque champ de colonne. Cela n'est pertinent que pour les tables dont les lignes contiennent plusieurs lignes de texte. Dans ce cas, vous devez cocher la case Fractionner les éléments ( Split items ) sur l'un des champs qui n'ont qu'une seule ligne pour chaque ligne de la table. Par exemple, sur une facture, le montant de l'élément de ligne serait un champ typique sur lequel vous pouvez cocher l'option Fractionner les éléments ( Split items ). Dans le contexte de Forms AI, vous feriez la même chose sur les formulaires.

Supprimer un champ de colonne

Pour supprimer un champ de colonne, procédez comme suit :

  1. Cliquez sur le bouton Modifier le champ docs image correspondant au champ de colonne que vous souhaitez supprimer.
  2. Cliquez sur le bouton Supprimer (Delete).
  3. Cliquez sur OK.
  4. Le champ de colonne et ses données labellisées associées sont supprimés.

Champs

Create a new field

  1. Cliquez sur docs image dans le volet de droite dans la section Champs réguliers (Regular Fields). La fenêtre Créer un champ régulier (Create Regular Field) s'affiche.
  2. Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas _ et des tirets -.
  3. Cliquez sur OK.

Supprimer tous les champs

  1. Cliquez sur docs image dans la section tableau en haut de la page pour supprimer tous les champs créés. Utilisez cette fonction pour supprimer tous les champs, y compris les champs Normal et Colonne, ainsi que tous les libellés des documents de la collection Type de document actuelle. Cette action est irréversible.
  2. Cliquez sur le bouton Supprimer (Delete) dans la boîte de dialogue Supprimer tous les champs (Delete all fields).

Modifier le champ

Cliquez sur le bouton Modifier le champ (Edit field). Les options disponibles pour les champs de colonne se trouvent dans le tableau ci-dessous.

Option

Description

Nom du champ

Nom unique du champ.

Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, et le tiret bas _ et des tirets -.

Type de contenu

Le type de contenu d'un champ :

  • chaîne (string) : approprié pour les noms ou adresses des sociétés, ainsi que les conditions de paiement, ou pour tout autre domaine où le RPA Developer préfère créer la logique d’analyse ou de formatage manuellement, dans le workflow RPA.
  • number : utilisé pour les montants ou les quantités, avec une analyse intelligente des séparateurs décimaux/milliers.
  • date : le modèle analyse, formate et unifie la sortie au format aaaa-mm-jj.
  • phone : approprié pour les numéros de téléphone. Le formatage supprime les lettres et les parenthèses, et remplace les espaces par des tirets.
  • id-no : approprié pour les codes alphanumériques, les nombres d'identifiants, il est similaire au type de contenu de string, mais inclut la suppression de tous les caractères précédant un deux-points :. Si le numéro d'identification que vous devez extraire peut contenir des caractères deux-points :, veuillez utiliser chaîne (string) comme type de contenu à la place, afin d'éviter la perte de données.

Raccourci

Touche de raccourci pour ce champ. Une ou deux clés autorisées.

Multiligne

Général

Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.

Supprimer un champ régulier

Pour supprimer un champ normal, procédez comme suit :

  1. Cliquez sur le bouton Modifier le champ docs image correspondant au champ normal que vous souhaitez supprimer.
  2. Cliquez sur le bouton Supprimer (Delete).
  3. Cliquez sur OK.
  4. Le champ de colonne et ses données labellisées associées sont supprimés.

Affichage du document et labellisation

Pour les documents de plusieurs pages, vous pouvez faire défiler naturellement les pages comme dans n'importe quelle visionneuse PDF. Pour effectuer un zoom avant ou arrière, utilisez Ctrl + molette de la souris.

Vous pouvez labelliser les documents en sélectionnant les zones de mots et en les affectant à un champ en appuyant sur une touche. Vous pouvez également cliquer avec le bouton droit sur la zone de mot et vérifier les informations extraites.

Pour plus de détails sur la labellisation des documents, visitez cette page.

Cases à cocher

Les cases à cocher disponibles dans Forms AI doivent être labellisées manuellement pour chaque champ. Les cases à cocher des tables peuvent également être labellisées à l'aide de l'option Champs de colonne (Column Fields) . Lorsqu’une case à cocher est labellisée dans Forms AI, les cases cochées et non cochées doivent être prises en compte.

Vous trouverezici des informations plus détaillées sur la façon de labelliser les cases à cocher.

Vous pouvez choisir d'intégrer votre projet Document Understanding dans un workflow RPA en suivant les étapes présentées ici.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.