- Vue d'ensemble (Overview)
- Démarrage
- Créer des modèles
- Utiliser des modèles
- Détails du modèle
- Points de terminaison publics
- 1040 – Type de document
- 1040 Annexe C – Type de document
- 1040 Annexe D – Type de document
- 1040 Annexe E – Type de document
- 1040x – Type de document
- 3949a - Type de document
- 4506T – Type de document
- 709 – Type de document
- 941x – Type de document
- 9465 – Type de document
- ACORD125 – Type de document
- ACORD126 – Type de document
- ACORD131 – Type de document
- ACORD140 – Type de document
- ACORD25 – Type de document
- Relevés bancaires – Type de document
- Connaissements - Type de document
- Certificat d’incorporation – Type de document
- Certificat d’origine – Type de document
- Vérifications – Type de document
- Certificat de produit pour enfants - Type de document
- CMS 1500 – Type de document
- Déclaration de Conformité UE – Type de document
- Comptes annuels – Type de document
- FM1003 – Type de document
- I9 – Type de document
- Cartes d’identité – Type de document
- Factures – Type de document
- Factures2 : type de document
- Factures Australie – Type de document
- Factures Chine – Type de document
- Factures hébraïques – Type de document
- Factures Inde – Type de document
- Factures Japon – Type de document
- Envoi de factures – Type de document
- Liste de colisage – Type de document
- Bulletins de paie – Type de document
- Passeports – Type de document
- Bons de commande – Type de document
- Reçus – Type de document
- Reçus2 - type de document
- Reçus Japon – Type de document
- Avis de versement – Type de document
- UB04 – Type de document
- Informations de clôture de prêt hypothécaire aux États-Unis - type de document
- Factures de services publics – Type de document
- Cartes grises – Type de document
- W2 – Type de document
- W9 – Type de document
- Langues prises en charge
- Tableaux de bord Insights.
- Données et sécurité
- Licences
- Comment
- Résolution des problèmes

Guide de l'utilisateur pour les projets modernes Document Understanding
- Charger des documents et les classer automatiquement.
- Charger des documents directement dans des types de documents.
- Gérer les fichiers à partir du projet (ajouter, supprimer des fichiers et ajouter, modifier des balises).
- Annoter des documents.
- Ajouter ou supprimer des champs.
- Bénéficier d’une expérience guidée concernant l’entraînement des modèles de classification et d’extraction à l’aide des recommandations.
Une fois que vous avez créé votre projet et chargé vos documents vers un type de document spécifique, ceux-ci sont automatiquement pré-annotés. Cela se fait à l’aide d’une combinaison de modèles génératifs et spécialisés, basée sur le schéma du type de document. Le schéma permet de définir clairement les champs que vous souhaitez extraire d’un type de document particulier. Pour trouver le schéma du type de document, rendez-vous sur la page Annotation et consultez la section Champs.
Pour des informations plus détaillées sur la façon d’annoter vos documents, consultez la page Annoter des documents.
Vous pouvez utiliser des documents qui ont été validés dans la Station de validation pour améliorer encore les performances de vos modèles.
Si des modifications sont apportées après l’étape de validation, le bouton Exceptions pour révision s’affiche pour le type de document concerné.
Pour obtenir des informations plus détaillées sur la façon de réentraîner vos modèles, consultez le tutoriel Réentraîner des extracteurs.
Une fois que vous avez chargé vos documents, vous pouvez y ajouter des balises.
Vous pouvez ajouter une balise d’un maximum de 100 caractères pour chaque document.
Pour ajouter une balise à vos documents, sélectionnez les documents que vous souhaitez ajouter, puis sélectionnez le bouton Balises dans le menu situé au-dessus de la liste des types de documents.
Vous pouvez rechercher plus facilement dans vos documents en filtrant avec des balises. Vous pouvez également vérifier les résultats par balise dans le fichier de configuration avancée lorsqu’un modèle est entraîné.
Vous pouvez modifier les paramètres de plusieurs champs à partir du Gestionnaire de type de document.
Pour y accéder, sélectionnez l’icône à trois points ⋮ située à côté du type de document que vous souhaitez modifier, puis sélectionnez Gestionnaire de type de document dans le menu.
Champs d’extraction
Modifier et ajouter de nouveaux champs
- Nom du champ : le nom unique du champ.
- Type de contenu : le type de contenu du champ :
- Chaîne (string) : utilisé pour les noms ou adresses des sociétés, ainsi que les conditions de paiement, ou pour tout autre domaine où vous souhaitez créer la logique d’analyse ou de formatage manuellement, dans le workflow RPA.
- Nombre (number) : utilisé pour les montants ou les quantités, avec une analyse intelligente des séparateurs décimaux/milliers.
- Date : analysez, formatez et unifiez la sortie en utilisant le format AAAA-MM-JJ.
- Téléphone (Phone) : utilisé pour le numéro de téléphone. Le formatage supprime les lettres et les parenthèses, et remplace les espaces par des tirets.
- Numéro d’identification (ID Number) : utilisé pour les codes alphanumériques et les numéros d’identification. Similaire au type de contenu de la chaîne de caractères (string), mais supprime tous les caractères précédant le caractère
:
. Si le numéro d’identification que vous devez extraire peut contenir le caractère:
, choisissez plutôtstring
comme type de contenu afin d’éviter toute perte de données.
- Raccourci : la touche de raccourci de ce champ. Il est possible d’utiliser une seule clé ou une combinaison de deux clés.
- Paramètres avancés : les options disponibles diffèrent en fonction du Type de contenu du champ sélectionné. Sélectionnez le bouton Paramètres avancés du champ que vous souhaitez modifier :
Image 3. Paramètres avancés du type de document
- ID de champ : l’identifiant unique du champ.
- Traitement ultérieur :
- first_span : si le modèle prévoit plus d’une instance d’un champ dans un document, faites en sorte que le modèle renvoie la première.
- longest_value : si le modèle prévoit plus d’une instance d’un champ dans un document, faites en sorte que le modèle renvoie la valeur composée du plus grand nombre de caractères.
- highest_confidence : si le modèle prévoit plus d’une instance d’un champ dans un document, faites en sorte que le modèle renvoie la valeur avec le degré de confiance le plus élevé.
- exact_match : la prédiction sera considérée comme correcte (note de 1) uniquement si elle correspond exactement à la valeur réelle. Si elle diffère ne serait-ce que d’un seul caractère, elle est considérée comme incorrecte (note de 0). C’est le paramètre par défaut pour tous les champs, sauf pour les champs de type String.
- levenshtein : une prédiction sera considérée comme partiellement correcte en fonction de la distance de Levenshtein entre la prédiction et la valeur réelle. Par exemple, si une valeur de 10 lettres est prédite correctement sauf pour les 2 derniers caractères, alors la note de cette prédiction sera de 0,8.
- Format de date : ce champ, disponible uniquement pour les champs dont le type de contenu est Date, indique comment les dates ambiguës seront analysées et renvoyées :
- Auto
- Style américain : AAAA-JJ-MM
- Style non américain : AAAA-MM-JJ
- Multiligne : cette option doit être cochée pour les champs couvrant plusieurs lignes de texte (adresses ou descriptions), sinon seule la première ligne sera renvoyée.
- Valeurs multiples : le champ renverra une liste avec toutes les valeurs détectées dans le document.
Cette vue vous permet également de réorganiser les champs.
Les modifications apportées aux paramètres de type de document ne seront pas reflétées dans la nouvelle version du projet lorsque vous publiez une nouvelle version du projet avant qu’un nouvel entraînement soit déclenché.
Solution: pour éviter cela, entraînez à nouveau le type de document après avoir apporté des modifications aux champs relatifs au type de document. Vous pouvez procéder à cela en identifiant ou en confirmant d’autres documents de ce type avant de publier la nouvelle version.
Rechercher des noms de champ
Vous pouvez recherchez parmi les noms de champs disponibles. Pour cela, utilisez la barre de recherche située en haut à gauche de l’interface du Gestionnaire de type de document. Pour une recherche plus efficace, utilisez la fonction Filtre afin de filtrer par Type de contenu.
Supprimer les champs
Sélectionnez le bouton Supprimer en regard du champ que vous souhaitez supprimer.
Champs de classification
Les champs de classification sont des points de données qui font référence à un document dans son ensemble. Par exemple, le type de dépense d’un reçu (nourriture, hôtel, billet d’avion ou transport) ou la devise d’une facture (USD, EUR, JPY) sont des champs de classification.
- Lorsque vous utilisez l’activité Extraire les données du document, les champs de classification sont pris en charge pour les extracteurs de projets modernes et les modèles prêts à l’emploi, mais pas pour les extracteurs de projets classiques.
- Les champs de classification sont extraits des types de documents personnalisés uniquement après une formation réussie.
Modifier ou ajouter des champs de classification
Pour ajouter un nouveau champ de classification, sélectionnez Ajouter un champ et nommez-le.
Cette vue vous permet également de réorganiser les champs.
Pour vérifier l’ID du champ de classification, sélectionnez Paramètres avancés en regard du champ de classification nécessaire.
Modifier ou ajouter des classes
Pour ajouter une nouvelle classe à un champ de classification, sélectionnez Ajouter une classe, saisissez un nom de classe et une description facultative.
Vous pouvez modifier le nom et la description de chaque classe.
Vous pouvez également réorganiser les classes à partir de cette vue.
Pour supprimer une classe, sélectionnez Supprimer en regard de la classe que vous souhaitez supprimer.
Paramètres
Vous pouvez modifier les paramètres du type de document à partir de l’onglet Paramètres.
Vous pouvez modifier les paramètres suivants :
- Modèle de base : les estimations de la taille de l’ensemble de données utilisées dans les actions recommandées dépendent du modèle de base utilisé pour l’entraînement. L’utilisation du modèle de base le plus similaire à votre type de document permettra de réduire la quantité de travail d’annotation requise.
- Nombre de langues : l’estimation de la taille de l’ensemble de données utilisée dans les actions recommandées dépend du nombre de langues dans l’ensemble de données. Un plus grand nombre de langues nécessite généralement d’annoter plus de données.
- Type de document : choisissez le type de document souhaité dans la liste déroulante.
- Date de chargement : choisissez un intervalle de dates de chargement du document.
- Statut : choisissez le statut du document.
- Balise : choisissez les balises que vous souhaitez filtrer.
Vous pouvez vérifier le score global de votre projet en haut à droite. Ce score tient compte des scores du classifieur et de l’extracteur pour tous les types de documents. Sélectionnez Score du projet pour afficher la section Mesurer (Measure ). Vous pourrez accéder à des mesures de performances plus détaillées dans cette section.
Vous pouvez vérifier le score de chaque type de document séparément à partir de la section Type de document. Ce score prend en compte les performances globales du modèle, ainsi que la taille et la qualité de l’ensemble de données.
- Faible (0-49)
- Moyen (50-69)
- Bon (70-89)
- Excellent (90-100)
Sélectionnez Scores détaillés du modèle pour accéder à la section Mesure et obtenir des informations détaillées.
- Construire
- Annoter des documents
- Exceptions pour révision
- Baliser des documents
- Gestionnaire des types de documents
- Champs d’extraction
- Modifier et ajouter de nouveaux champs
- Rechercher des noms de champ
- Supprimer les champs
- Champs de classification
- Modifier ou ajouter des champs de classification
- Modifier ou ajouter des classes
- Paramètres
- Rechercher des documents
- Score du projet et du modèle