UiPath Documentation
document-understanding
2.2510
true
Important :
La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.
UiPath logo, featuring letters U and I in white

Guide de l’utilisateur de Document Understanding pour les projets modernes

Dernière mise à jour 15 avr. 2026

Concepts clés

Familiarisez-vous avec les concepts de base autour de UiPath® Document UnderstandingTM.

Apprentissage actif

L’apprentissage actif est notre approche moderne de création de modèles pour Document UnderstandingTM.

L’apprentissage actif offre une expérience interactive dans laquelle l’algorithme d’apprentissage peut interroger l’utilisateur pour labelliser les données avec les sorties souhaitées. Ce processus permet de réduire jusqu’à 80 % le temps et les données nécessaires pour entraîner un modèle d’apprentissage automatique. L’IA est utilisée pour guider le processus, qui comprend l’annotation automatique, généralement la tâche la plus longue. Le modèle fournit également des recommandations d’experts pour améliorer la précision en utilisant les ensembles de données les plus informatifs.

Graphique 1. Fonctionnement de l’apprentissage actif Diagramme illustrant un workflow d'apprentissage actif pour améliorer un modèle ML (apprentissage automatique). Le processus commence par le modèle ML, où les performances sont évaluées. L'apprentissage actif identifie les points de données les plus informatifs pour améliorer les performances du modèle. Ces points de données sont envoyés à l'étape d'annotation humaine pour une révision manuelle. Les annotations sont ensuite utilisées pour réentraîner et redéployer le modèle ML, créant une boucle de rétroaction à des fins d'amélioration continue. Les flèches indiquent le flux entre le modèle ML, l'apprentissage actif et l'annotation humaine.

Grâce à l’apprentissage actif, vous pouvez également surveiller vos automatisations grâce à des fonctionnalités d’analyse.

Types de documents

Un type de document fait référence à la classification ou à la catégorisation d’un document en fonction de son contenu, de son format, de son objectif ou d’autres facteurs distinctifs. Certains exemples peuvent inclure des factures, des reçus, des contrats, des rapports, des dossiers médicaux, des documents juridiques et autres.

Certains types de documents ont un contenu très structuré, tandis que d’autres sont principalement composés de texte libre. Sur cette base, les documents sont classés en trois formats principaux :

  • Structuré : documents conçus pour collecter des informations dans un format spécifique. Par exemple, les enquêtes, les formulaires fiscaux, les passeports ou les licences sont tous des documents structurés.
  • Semi-structuré : documents qui ne suivent pas un format strict et qui ne sont pas liés à des champs de données spécifiés. Les documents semi-structurés incluent les factures, les reçus, les factures de services publics, les relevés bancaires et autres.
  • Non structuré : documents qui ne suivent pas un modèle spécifique ou organisé. Par exemple, les contrats, les baux de location ou les articles de presse sont tous des documents non structurés.

Pour en savoir plus sur les types de documents, consultez la section Types de documents (Document Types).

Modèles ML

Les modèles ML sont comme des assistants virtuels qui ont été entraînés pour apprendre à partir des données et faire des prédictions ou des décisions. Ces modèles sont essentiellement des algorithmes qui apprennent à reconnaître des modèles basés sur des données historiques. Plus ils sont exposés à des données, mieux ils peuvent améliorer leurs prédictions ou leurs décisions au fil du temps.

Vous pouvez trouver plusieurs modèles ML prêts à l’emploi dans Document UnderstandingTM. Ces modèles permettent de classer et extraire tous les points de données les plus courants à partir de documents semi-structurés ou non structurés, sans qu'une configuration soit requise.

Consultez la page Types de documents pré-entrainés pour obtenir la liste complète des modèles pré-entrainés et de leurs champs.

Les modèles ML peuvent être entraînés dans la majorité des langues tant que l’OCR reconnaît le document et le texte avec une grande confiance.

OCR (reconnaissance optique de caractères)

La reconnaissance optique de caractères (OCR) est une technologie spéciale utilisée pour convertir différents types de documents, tels que des documents papier numérisés, des fichiers PDF ou des images prises par un appareil photo numérique, en données modifiables et consultables.

La précision d’un moteur OCR dépend le plus souvent de la qualité du document d’origine. Un texte clair et bien formaté dans une police lisible produit généralement le meilleur résultat.

Pour plus d’informations sur les langues prises en charge par les options de moteur OCR proposées par UiPath®, consultez la page Langues prises en charge par l’OCR .

Cette page vous a-t-elle été utile ?

Connecter

Besoin d'aide ? Assistance

Vous souhaitez apprendre ? UiPath Academy

Vous avez des questions ? UiPath Forum

Rester à jour