- Vue d'ensemble (Overview)
- Démarrage
- Créer des modèles
- Utiliser des modèles
- Détails du modèle
- Public endpoints for Automation Cloud and Test Cloud
- Public endpoints for Automation Cloud and Test Cloud Public Sector
- 1040 – Type de document
- 1040 Annexe C – Type de document
- 1040 Annexe D – Type de document
- 1040 Annexe E – Type de document
- 1040x – Type de document
- 3949a - Type de document
- 4506T – Type de document
- 709 – Type de document
- 941x – Type de document
- 9465 – Type de document
- ACORD125 – Type de document
- ACORD126 – Type de document
- ACORD131 – Type de document
- ACORD140 – Type de document
- ACORD25 – Type de document
- Relevés bancaires – Type de document
- Connaissements - Type de document
- Certificat d’incorporation – Type de document
- Certificat d’origine – Type de document
- Vérifications – Type de document
- Certificat de produit pour enfants - Type de document
- CMS 1500 – Type de document
- Déclaration de Conformité UE – Type de document
- Comptes annuels – Type de document
- FM1003 – Type de document
- I9 – Type de document
- Cartes d’identité – Type de document
- Factures – Type de document
- Factures2 : type de document
- Factures Australie – Type de document
- Factures Chine – Type de document
- Factures hébraïques – Type de document
- Factures Inde – Type de document
- Factures Japon – Type de document
- Envoi de factures – Type de document
- Liste de colisage – Type de document
- Bulletins de paie – Type de document
- Passeports – Type de document
- Bons de commande – Type de document
- Reçus – Type de document
- Reçus2 : type de document
- Reçus Japon – Type de document
- Avis de versement – Type de document
- UB04 – Type de document
- Déclaration de clôture de prêt hypothécaire aux États-Unis◊ : type de document
- Factures de services publics – Type de document
- Cartes grises – Type de document
- W2 – Type de document
- W9 – Type de document
- Langues prises en charge
- Tableaux de bord Insights.
- Données et sécurité
- Journalisation
- Licences
- Comment
- Résolution des problèmes

Guide de l'utilisateur de Document Understanding
Concepts clés
Familiarize yourself with the core concepts around UiPath® Document UnderstandingTM.
Apprentissage actif
Active learning is our modern approach to creating models for Document UnderstandingTM.
L’apprentissage actif offre une expérience interactive dans laquelle l’algorithme d’apprentissage peut interroger l’utilisateur pour labelliser les données avec les sorties souhaitées. Ce processus permet de réduire jusqu’à 80 % le temps et les données nécessaires pour entraîner un modèle d’apprentissage automatique. L’IA est utilisée pour guider le processus, qui comprend l’annotation automatique, généralement la tâche la plus longue. Le modèle fournit également des recommandations d’experts pour améliorer la précision en utilisant les ensembles de données les plus informatifs.
Figure 1. How does Active Learning work 
Grâce à l’apprentissage actif, vous pouvez également surveiller vos automatisations grâce à des fonctionnalités d’analyse.
Types de documents
Un type de document fait référence à la classification ou à la catégorisation d’un document en fonction de son contenu, de son format, de son objectif ou d’autres facteurs distinctifs. Certains exemples peuvent inclure des factures, des reçus, des contrats, des rapports, des dossiers médicaux, des documents juridiques et autres.
Certains types de documents ont un contenu très structuré, tandis que d’autres sont principalement composés de texte libre. Sur cette base, les documents sont classés en trois formats principaux :
- Structured: documents designed to collect information in a specific format. For example, surveys, tax forms, passports, or licenses are all structured documents.
- Semi-structured: documents that do not follow a strict format and are not bound to specified data fields. Semi-structured documents include invoices, receipts, uility bills, bank statements, and others.
- Unstructured: documents that do not follow a specific or organized model. For example, contracts, leases, or news articles are all unstructured documents.
To learn more about document types, check the Document types section.
IA générative
Feature availability depends on the cloud platform that you use. For details, refer to the Choosing the deployment type page.
L’IA générative est une forme de technologie d’IA qui exploite les modèles d’apprentissage automatique (ML) pour créer et générer de nouveaux contenus, données ou informations.
Les Grands modèles de langage (LLM) sont essentiels aux tâches d’IA les plus génératives. Il s’agit de modèles ML entraînés sur une grande quantité de données textuelles, conçus pour générer du texte de type humain. Les LLM peuvent également comprendre et répondre aux invites en complétant des phrases ou des paragraphes à la manière d’un humain.
In the context of Document UnderstandingTM, generative AI helps with:
- Information extraction: generative AI models can be used to extract specific information from unstructured or semi-structured documents. For example, it can go through an invoice to retrieve details like date, billed amount, and company name.
- Document classification: ML models are used to auto-categorize documents based on their content. These algorithms 'read' the document, understand its context, and can classify it into predefined categories.
- Data validation: generative AI can check the output of the ML model whenever the confidence score is too low. If both the ML models (generative and specialized) have the same output, a human can skip validating that document. This can improve time spending validating documents, as well as improving the performing of your models by checking the output with the help of a second generative model.
Modèles ML
Les modèles ML sont comme des assistants virtuels qui ont été entraînés pour apprendre à partir des données et faire des prédictions ou des décisions. Ces modèles sont essentiellement des algorithmes qui apprennent à reconnaître des modèles basés sur des données historiques. Plus ils sont exposés à des données, mieux ils peuvent améliorer leurs prédictions ou leurs décisions au fil du temps.
You can find several out of the box ML models in Document UnderstandingTM. These models help you classify and extract any commonly occurring data points from semi-structured or unstructured documents, with no setup required.
Check the Pre-trained document types page for the full list of pre-trained models and their fields.
Les modèles ML peuvent être entraînés dans la majorité des langues tant que l’OCR reconnaît le document et le texte avec une grande confiance.
OCR (reconnaissance optique de caractères)
La reconnaissance optique de caractères (OCR) est une technologie spéciale utilisée pour convertir différents types de documents, tels que des documents papier numérisés, des fichiers PDF ou des images prises par un appareil photo numérique, en données modifiables et consultables.
La précision d’un moteur OCR dépend le plus souvent de la qualité du document d’origine. Un texte clair et bien formaté dans une police lisible produit généralement le meilleur résultat.
For more information on the languages supported by the OCR engines options provided by UiPath®, check the OCR Supported Languages page.