UiPath Documentation
document-understanding
2.2510
true
Important :
La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.
UiPath logo, featuring letters U and I in white

Guide de l'utilisateur de Document Understanding

Dernière mise à jour 15 avr. 2026

Introduction

The UiPath® Document UnderstandingTM framework facilitates the processing of incoming files, from file digitization to extracted data validation, all in an open, extensible, and versatile environment.

Document Understanding est conçu pour vous aider à combiner différentes approches d'extraction d'informations de plusieurs types de documents. Son principal objectif consiste à rendre le processus d'extraction de données aussi simple que possible : créer un workflow unique qui extraie les données de plusieurs documents.

Avant d'utiliser l'infrastructure Document Understanding, il est recommandé de comprendre les composants suivants de l'infrastructure Document Understanding :

  • Taxonomie Quels documents doivent être traités et quelles données leur sont demandées ? Permet de définir les types de documents et les informations ciblées aux fins de l'extraction de données (champs) pour chaque type de document, et formalise ces informations dans une structure de taxonomie dédiée. Ces informations de métadonnées sont gérées par le biais de Taxonomy Manager.
  • Numérisation Que contient ce fichier ? Utilisé pour obtenir le contenu textuel et la structure du document entrant, transformant un fichier en contenu lisible par machine afin qu'il puisse être traité ultérieurement en aval.
  • Classification de document Quels types de documents de taxonomie se trouvent dans ce fichier ? Utilisé pour déterminer automatiquement les types de documents localisés dans un fichier numérisé.
  • Administrateur de la classification de document La classification prévue est-elle correcte ? C'est ainsi que je peux l'examiner et la corriger. Utilisé pour assister la validation manuelle et la correction des résultats de la classification automatique ainsi que du fractionnement des documents.
  • Apprentissage de la classification L'humain a-t-il examiné les données ? C'est ainsi que le robot peut en tirer des leçons. Utilisé pour transmettre les informations validées par l'homme aux classificateurs afin de les utiliser en vue d'améliorer leurs prédictions futures.
  • Extraction de données Quelles données peuvent être trouvées dans ce document ? Sert à capturer les informations requises relatives au type de document identifié dans le document d'entrée et la plage de pages de classification donnés.
  • Validation de l'extraction de données Les informations extraites sont-elles correctes ? C'est ainsi que je peux les examiner et les corriger. Sert à assister la validation humaine et la correction des résultats de données extraits automatiquement.
  • Apprentissage de l'extraction de données L'humain a-t-il examiné les données ? C'est ainsi que le robot peut en tirer des leçons. Sert à transmettre les données extraites validées par l'homme aux extracteurs en vue de les utiliser pour améliorer leurs prévisions d'extraction.
  • Consommation de données Permet d'exporter les données validées en vue de les utiliser.
  • Logique de mesure et de charge Utilisée pour expliquer la consommation d'unités par page pour chaque service disponible.

Le diagramme suivant présente les composants de l'infrastructure de Document Understanding et leurs relations mutuelles :

Diagramme décrivant l'infrastructure de Document Understanding.

L’infrastructure Document Understanding se trouve dans le package UiPath.IntelligentOCR.Activities. Une fois le package UiPath.IntelligentOCR.Activities installé, l'assistant Taxonomy Manager apparaît dans le ruban supérieur de UiPath Studio. Ce même package contient toutes les activités de l’infrastructure Document Understanding de base.

Les activités d'étendue (Classer l'étendue du document (Classify Document Scope), Étendue de l'extraction de données (Data Extraction Scope), Tester l'étendue des classifieurs (Train Classifiers Scope), Tester l'étendue des extracteurs (Train Extractors Scope) qui font partie de l'infrastructure Document Understanding vous permettent d'utiliser tous les algorithmes de classification de documents et d'extraction de données qui correspondent à votre cas d'utilisation, puis d'entraîner ces algorithmes.

The Document Understanding framework can be used not only with the out-of-the-box classifiers and extractors but also with any custom-built ones. These can be created using the abstract classes from the UiPath.DocumentProcessing.Contracts package and can be implemented as classification or data extraction activities. Custom-built OCR engines can also be created using the abstract classes from the UiPath.OCR.Contracts package.

Ressources

Des cours dédiés à Document Understanding sont disponibles dans l'UiPath Academy.

Le forum de la communauté UiPath permet d'obtenir le soutien de notre communauté d'utilisateurs toujours croissante.

  • Ressources

Cette page vous a-t-elle été utile ?

Connecter

Besoin d'aide ? Assistance

Vous souhaitez apprendre ? UiPath Academy

Vous avez des questions ? UiPath Forum

Rester à jour