document-understanding
latest
false
UiPath logo, featuring letters U and I in white
Guide de l'utilisateur pour les projets modernes Document Understanding
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 14 nov. 2024

Types de documents

Un type de document est la définition d’un type logique de document que différents processus métier doivent gérer.

Qu’est-ce qu’un type de document et que peut-il contenir ?

Les types de documents incluent les factures, les dossiers médicaux, les formulaires IRS W-2, les contrats et autres. Les types de document, en plus de comprendre un nom, un groupe et une catégorie, contiennent généralement une collection de champs.

Par exemple, les factures contiennent généralement les informations suivantes :
  • Nom du fournisseur, adresse du fournisseur, nom de facturation, adresse de facturation
  • Numéro de facture, numéro de bon de commande, conditions de paiement, date d’échéance
  • Montant net, montant des taxes, remise, montant total
  • Numéro de TVA, taux de TVA
  • Numéro de compte bancaire, nom de la banque, SWIFT, IBAN
Graphique 1. Exemple de facture

Formats de types de documents

Les types de documents peuvent être classés en fonction de leur format. Certains types de documents ont un contenu très structuré, tandis que d’autres sont principalement composés de texte libre.

Les documents sont classés en trois formats principaux :
  • Structured
  • Document semi-structuré
  • Non structuré
Remarque : les documents peuvent souvent être une combinaison de ces trois catégories. Un fichier peut avoir un en-tête structuré, suivi d’un contenu de forme libre non structuré. Ils peuvent également contenir du contenu non structuré avec des informations spécifiques qui apparaissent toujours dans un contexte très structuré ou répétitif.

Documents structurés

Les documents structurés comprennent :
  • Enquêtes
  • Questionnaire
  • Formulaires fiscaux
  • Passeports
  • Licences (Licenses)
  • Feuilles de temps

Ces documents sont conçus pour collecter des informations dans un format spécifique. Ils contiennent généralement des paires clé-valeur, des tables, du texte manuscrit, des signatures et des cases à cocher. Ces documents guident l’utilisateur en fournissant des zones précises pour la saisie de chaque donnée. Ces documents sont communément appelés formulaires et sont utilisés pour collecter des données à faible diversité.

Graphique 2. Permis de conduire, exemple de document structuré docs image

Documents semi-structurés

Les documents semi-structurés sont des documents qui ne suivent pas un format strict comme les formulaires structurés et ne sont pas liés aux champs de données spécifiés. Ceux-ci n’ont pas de forme fixe mais suivent un format suffisamment courant. Ils contiennent des parties fixes et variables, comme des tables. Ils peuvent également contenir des paragraphes, mais les données se trouvent principalement dans les paires clé-valeur. Les documents semi-structurés comprennent :
  • Factures
  • Reçus
  • Bons de commande
  • Rapports d’analyse de laboratoire
  • Relevés bancaires
  • Factures
Graphique 3. Facture, exemple de document semi-structuré docs image

Documents non structurés

Les documents non structurés sont des fichiers qui ne suivent pas un modèle spécifique ou organisé. Ils n’ont pas de format fixe et les informations qu’ils contiennent sont souvent présentées de manière non structurée, ce qui rend le traitement des robots difficile. Bien que les humains puissent facilement comprendre ces documents, les données peuvent être difficiles à interpréter pour les machines. Les documents non structurés peuvent prendre de nombreuses formes, notamment :
  • Contrats
  • Baux de locations
  • Rapports annuels
  • Accords
  • Articles de presse
Graphique 4. Contrat de licence, exemple de document non structuré docs image

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.