- Vue d'ensemble (Overview)
- Démarrage
- Créer des modèles
- Utiliser des modèles
- Détails du modèle
- Points de terminaison publics
- 1040 – Type de document
- 1040 Annexe C – Type de document
- 1040 Annexe D – Type de document
- 1040 Annexe E – Type de document
- 1040x – Type de document
- 3949a - Type de document
- 4506T – Type de document
- 709 – Type de document
- 941x – Type de document
- 9465 – Type de document
- ACORD125 – Type de document
- ACORD126 – Type de document
- ACORD131 – Type de document
- ACORD140 – Type de document
- ACORD25 – Type de document
- Relevés bancaires – Type de document
- Connaissements - Type de document
- Certificat d’incorporation – Type de document
- Certificat d’origine – Type de document
- Vérifications – Type de document
- Certificat de produit pour enfants - Type de document
- CMS 1500 – Type de document
- Déclaration de Conformité UE – Type de document
- Comptes annuels – Type de document
- FM1003 – Type de document
- I9 – Type de document
- Cartes d’identité – Type de document
- Factures – Type de document
- Factures2 : type de document
- Factures Australie – Type de document
- Factures Chine – Type de document
- Factures hébraïques – Type de document
- Factures Inde – Type de document
- Factures Japon – Type de document
- Envoi de factures – Type de document
- Liste de colisage – Type de document
- Bulletins de paie – Type de document
- Passeports – Type de document
- Bons de commande – Type de document
- Reçus – Type de document
- Reçus2 : type de document
- Reçus Japon – Type de document
- Avis de versement – Type de document
- UB04 – Type de document
- Déclaration de clôture de prêt hypothécaire aux États-Unis◊ : type de document
- Factures de services publics – Type de document
- Cartes grises – Type de document
- W2 – Type de document
- W9 – Type de document
- Langues prises en charge
- Tableaux de bord Insights.
- Document Understanding déployé dans Automation Suite
- Journalisation
- Logique d’attribution de licences et de charge
- Comment
- Résolution des problèmes

Document Understanding modern projects user guide
Types de documents
Un type de document est la définition d’un type logique de document que différents processus métier doivent gérer.
Qu’est-ce qu’un type de document et que peut-il contenir ?
Les types de documents incluent les factures, les dossiers médicaux, les formulaires IRS W-2, les contrats et autres. Les types de document, en plus de comprendre un nom, un groupe et une catégorie, contiennent généralement une collection de champs.
Par exemple, les factures contiennent généralement les informations suivantes :
- Nom du fournisseur, adresse du fournisseur, nom de facturation, adresse de facturation
- Numéro de facture, numéro de bon de commande, conditions de paiement, date d’échéance
- Montant net, montant des taxes, remise, montant total
- Numéro de TVA, taux de TVA
- Numéro de compte bancaire, nom de la banque, SWIFT, IBAN
Figure 1. Invoice example

Formats de types de documents
Les types de documents peuvent être classés en fonction de leur format. Certains types de documents ont un contenu très structuré, tandis que d’autres sont principalement composés de texte libre.
Les documents sont classés en trois formats principaux :
- Structured
- Document semi-structuré
- Non structuré
Documents can often be a combination of these three categories. A file can have a structured heading, followed by an unstructured, free-form content. They can also contain unstructured content with specific information that always appears in a very structured or repeating context.
Documents structurés
Les documents structurés comprennent :
- Enquêtes
- Questionnaire
- Formulaires fiscaux
- Passeports
- Licences (Licenses)
- Feuilles de temps
Ces documents sont conçus pour collecter des informations dans un format spécifique. Ils contiennent généralement des paires clé-valeur, des tables, du texte manuscrit, des signatures et des cases à cocher. Ces documents guident l’utilisateur en fournissant des zones précises pour la saisie de chaque donnée. Ces documents sont communément appelés formulaires et sont utilisés pour collecter des données à faible diversité.
Figure 2. Driver license, an example of a structured document

Documents semi-structurés
Les documents semi-structurés sont des documents qui ne suivent pas un format strict comme les formulaires structurés et ne sont pas liés aux champs de données spécifiés. Ceux-ci n’ont pas de forme fixe mais suivent un format suffisamment courant. Ils contiennent des parties fixes et variables, comme des tables. Ils peuvent également contenir des paragraphes, mais les données se trouvent principalement dans les paires clé-valeur. Les documents semi-structurés comprennent :
- Factures
- Reçus
- Bons de commande
- Rapports d’analyse de laboratoire
- Relevés bancaires
- Factures
Figure 3. Invoice, an example of a semi-structured document

Documents non structurés
Les documents non structurés sont des fichiers qui ne suivent pas un modèle spécifique ou organisé. Ils n’ont pas de format fixe et les informations qu’ils contiennent sont souvent présentées de manière non structurée, ce qui rend le traitement des robots difficile. Bien que les humains puissent facilement comprendre ces documents, les données peuvent être difficiles à interpréter pour les machines. Les documents non structurés peuvent prendre de nombreuses formes, notamment :
- Contrats
- Baux de locations
- Rapports annuels
- Accords
- Articles de presse
Figure 4. License agreement, an example of an unstructured document
