- Vue d'ensemble (Overview)
- Démarrage
- Activités (Activities)
- Tableaux de bord Insights.
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Limitations du trafic
- Configuration OCR
- Pipelines
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Licences
Guide de l'utilisateur de Document Understanding
IA des formulaires
Forms AI est désormais disponible dans le cadre de Document UnderstandingTM et peut être utilisé pour télécharger et traiter des formulaires structurés avec des mises en page et des champs standard.
Forms AI est la première méthode d’extraction disponible dans Document Understanding. Obtenir davantage d’informations sur la création d’un nouveau projet dans Document Understanding.
Une fois le projet créé, vous devez suivre les étapes suivantes pour créer un type de document à l’aide de Forms AI dans le projet.
- Ouvrez votre projet.
- Sélectionnez le bouton Nouveau type de document (New Document Type).
- Ajoutez un nom à votre type de document.
Si vous souhaitez entraîner vos classifieurs de documents directement à partir de Document Understanding, vous pouvez utiliser la fonctionnalité Classification en un clic .
Vous pouvez convertir un type de document Forms AI en type de document semi-structuré.
Lorsque vous convertissez un type de document Forms AI en type de document Semi-structuré (Document Manager), vous pouvez utiliser toutes les fonctionnalités disponibles dans Document Manager
L'option de conversion est idéale pour les scénarios complexes afin d'entraîner un modèle d'apprentissage automatique en profondeur plus puissant.
Vous avez le choix entre deux options si vous décidez de convertir une session Forms AI en session Document Manager.
Vous pouvez convertir un type de document directement à partir de la liste Types de documents du projet.
Accédez au menu Ouvrir l'accès (Open access) du type de document que vous souhaitez convertir et cliquez sur l'option Convertir en semi-structuré (Convert to Semi-Structured ). Une fenêtre contextuelle s'affiche vous demandant de confirmer les Actions.
Une fois qu'un type de document a été converti, vous ne pouvez pas annuler les Actions.
Ouvrez une session Forms AI déjà créée afin de la convertir en session semi-structurée.
Depuis la session ouverte, cliquez sur le menu Accèspuis cliquez sur l'option Convertir en semi-structuré (Convert to Semi-Structured ).
Le bouton Convertir en semi-structuré ne s’affiche pas lorsque le projet ne dispose pas d’un lien AI Center.
Une fois que le nouveau Forms AI est créé, une nouvelle fenêtre s’ouvre, vous demandant d’importer des données. Vous pouvez importer un minimum de deux documents et un maximum de vingt documents, chacun avec un maximum de cinq pages. Faites glisser et déposez ou recherchez les fichiers pour les télécharger.
Importer des documents est un autre moyen de convertir les documents Forms AI en documents AI semi-structurés. Une option apparaît si vous essayez de télécharger plus de 20 documents ou si l'un des documents comporte plus de 20 pages. Une fenêtre contextuelle s'affiche à l'écran, vous demandant si vous souhaitez convertir la session FormsAI en session semi-structurée.
Les champs extraits automatiquement doivent également être vérifiés pour la précision du type de contenu . Par exemple, si un champ de date a été automatiquement extrait, le Type de contenu (Content Type) doit être date. Toute inexactitude doit être corrigée manuellement.
En haut de la page, vous trouverez la barre de gestion. Elle vous permet d’effectuer plusieurs opérations : naviguer entre les documents, supprimer/restaurer un document, rechercher/filtrer des documents, exécuter des prédictions de modèle d’IA, importer et exporter des documents.
Voici les éléments disponibles dans la barre de gestion :
Elément |
Icon |
Description |
---|---|---|
Navigation |
|
Naviguez entre les documents qui correspondent au filtre actif. Entre les deux flèches, un compteur s'affiche. Il représente le numéro du document actuel sur le nombre total de documents qui correspondent au filtre ou à la recherche active. |
Rechercher (Search) et Rechercher dans le document (Search in document) |
|
Rechercher (Search) - lancez une recherche ou filtrez les documents. Un filtre est également appliqué lors de l'exportation de documents. Vous pouvez également filtrer par mots d'un document ou par noms de documents. Rechercher dans le document (Search in document) : lancez une recherche de texte dans le document en cliquant sur le bouton ou en utilisant le raccourci Ctrl + Shift + F |
Supprimer / Restaurer |
/ |
Supprime ou restaure un document. Les documents supprimés peuvent être trouvés sous le filtre supprimé (deleted). |
Importer (Import) |
|
Ouvrez la boîte de dialogue Importer des données (Import data). |
Exporter (Export) |
|
Ouvrez la boîte de dialogue Exporter les fichiers (Export files). |
Nom et type de document |
s/o |
Le nom et le type du document actuellement actif. |
Télécharger |
|
L'option est disponible dans le menu déroulant à côté du nom du document. Cliquez sur l'icône pour télécharger un fichier zip contenant le document original. Outre le document d'origine, toutes les pages converties en interne par Document Manager en images
.jpeg sont également téléchargées.
|
Permanently delete |
L'option est disponible dans la liste déroulante à côté du nom du document. Supprime définitivement les fichiers individuels. Le
.pdf et toutes ses images .jpeg sont supprimés de l'ensemble de données AI Center et toutes les métadonnées sont supprimées de la base de données.
Lorsque vous cliquez sur le bouton, un message contextuel apparaît vous demandant si vous êtes sûr de vouloir supprimer définitivement le document. Cliquez sur OK pour continuer ou sur Annuler (Cancel) pour revenir à l'écran précédent. | |
Prévoir (Predict) |
|
Exécutez les prédictions du modèle d'IA et affichez les résultats. Après avoir configuré le prébalisage, le bouton est activé dans la barre de gestion. Cliquez dessus pour prébaliser le document actuel. Pour le moment, l'utilisation de l'option Prévoir (Predict) avec les prébalisages Points de terminaison publics (Public Endpoints) ne prébalise que les 10 premières pages d'un document. Il s'agit d'un problème connu et un correctif est en préparation. Cependant, utiliser l'option Prévoir (Predict) avec des compétences ML dans AI Center n'impose pas une telle limitation. |
Publier |
|
Publie l’extracteur Forms AI et crée le lien associé, disponible dans la liste des extracteurs du projet. |
Paramètres |
|
Configurez les paramètres d'OCR et de pré-labellisation, ou accédez au panneau Comment... (How to...). Le bouton Paramètres a deux options disponibles :
|
Session |
s/o |
Le nom de la session actuelle, qui se trouve en haut de la page, à côté du logo UiPath® Document UnderstandingTM . |
Allons un peu plus loin pour comprendre la différence entre les options Supprimer (Delete) et Supprimer définitivement (Permanently Delete).
- L'option Supprimer (Delete) supprime les fichiers sans les supprimer définitivement de votre projet. Vous pouvez toujours trouver les fichiers supprimés sous le filtre supprimé de la barre de recherche et les restaurer à l'aide de l'option Restaurer .
- L’option Supprimer définitivement (Permanently Delete) supprime les fichiers sélectionnés sans aucune possibilité de les restaurer.
Le bouton Paramètres a deux options disponibles :
- Paramètres (Settings) - où vous pouvez configurer le service OCR
- Comment... - qui sert de menu d'aide
- Cliquez sur dans la section Table en haut de la page pour ajouter un nouveau champ Colonne (Column). La fenêtre Créer un champ de colonne (Create Column Field) s'affiche.
- Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas
_
et des tirets-
. - Cliquez sur OK.
Cliquez sur le bouton Modifier le champ (Edit field). Les options disponibles pour les champs de colonne se trouvent dans le tableau ci-dessous.
Option |
Description |
---|---|
Nom du champ |
Nom unique du champ. Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, et le tiret bas
_ et des tirets - .
|
Type de contenu |
Le type de contenu d'un champ :
|
Raccourci |
Touche de raccourci pour ce champ. Une ou deux clés autorisées. |
Fractionner les éléments |
Cochez cette case si vous souhaitez que ce champ soit utilisé comme délimiteur entre les éléments de ligne ou les lignes d'un tableau. Toute ligne sur laquelle ce champ apparaît est considérée comme un nouvel élément ou une nouvelle ligne dans le tableau. Le plus souvent, cette fonction est utilisée dans les champs Lignes de montant (Line Amount) des éléments de ligne de la facture. |
Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.
Leregroupement des lignes de la table est différent de celui utilisé dans AI Center Document Manager. Ici, les lignes sont automatiquement regroupées en fonction de l’état de la case à cocher Fractionner les éléments ( Split items ) sur chaque champ de colonne. Cela n'est pertinent que pour les tables dont les lignes contiennent plusieurs lignes de texte. Dans ce cas, vous devez cocher la case Fractionner les éléments ( Split items ) sur l'un des champs qui n'ont qu'une seule ligne pour chaque ligne de la table. Par exemple, sur une facture, le montant de l'élément de ligne serait un champ typique sur lequel vous pouvez cocher l'option Fractionner les éléments ( Split items ). Dans le contexte de Forms AI, vous feriez la même chose sur les formulaires.
Pour supprimer un champ de colonne, procédez comme suit :
- Cliquez sur le bouton Modifier le champ correspondant au champ de colonne que vous souhaitez supprimer.
- Cliquez sur le bouton Supprimer (Delete).
- Cliquez sur OK.
- Le champ de colonne et ses données labellisées associées sont supprimés.
- Cliquez sur dans le volet de droite dans la section Champs réguliers (Regular Fields). La fenêtre Créer un champ régulier (Create Regular Field) s'affiche.
- Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas
_
et des tirets-
. - Cliquez sur OK.
- Cliquez sur dans la section tableau en haut de la page pour supprimer tous les champs créés. Utilisez cette fonction pour supprimer tous les champs, y compris les champs Normal et Colonne, ainsi que tous les libellés des documents de la collection Type de document actuelle. Cette action est irréversible.
- Cliquez sur le bouton Supprimer (Delete) dans la boîte de dialogue Supprimer tous les champs (Delete all fields).
Modifier le champ
Cliquez sur le bouton Modifier le champ (Edit field). Les options disponibles pour les champs de colonne se trouvent dans le tableau ci-dessous.
Option |
Description |
---|---|
Nom du champ |
Nom unique du champ. Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, et le tiret bas
_ et des tirets - .
|
Type de contenu |
Le type de contenu d'un champ :
|
Raccourci |
Touche de raccourci pour ce champ. Une ou deux clés autorisées. |
Multiligne |
Général |
Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.
Pour supprimer un champ normal, procédez comme suit :
- Cliquez sur le bouton Modifier le champ correspondant au champ normal que vous souhaitez supprimer.
- Cliquez sur le bouton Supprimer (Delete).
- Cliquez sur OK.
- Le champ de colonne et ses données labellisées associées sont supprimés.
Ctrl
+ molette de la souris.
Vous pouvez labelliser les documents en sélectionnant les zones de mots et en les affectant à un champ en appuyant sur une touche. Vous pouvez également cliquer avec le bouton droit sur la zone de mot et vérifier les informations extraites.
Pour plus de détails sur la labellisation des documents, visitez cette page.
Les cases à cocher disponibles dans Forms AI doivent être labellisées manuellement pour chaque champ. Les cases à cocher des tables peuvent également être labellisées à l'aide de l'option Champs de colonne (Column Fields) . Lorsqu’une case à cocher est labellisée dans Forms AI, les cases cochées et non cochées doivent être prises en compte.
Vous trouverezici des informations plus détaillées sur la façon de labelliser les cases à cocher.
Vous pouvez choisir d'intégrer votre projet Document Understanding dans un workflow RPA en suivant les étapes présentées ici.
- Créer des formulaires AI
- Convertir un Forms AI en type de document semi-structuré
- Comment convertir une session Forms AI
- À partir de la liste des types de documents du projet
- À partir d'une session Forms AI ouverte
- Importer des documents
- Management bar
- Champs de colonnes
- Créer un nouveau champ de colonne
- Modifier un champ de colonne
- Supprimer un champ de colonne
- Champs
- Create a new field
- Supprimer tous les champs
- Supprimer un champ régulier
- Affichage du document et labellisation
- Cases à cocher