UiPath Documentation
document-understanding
2.2510
true
Important :
La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.
UiPath logo, featuring letters U and I in white

Document Understanding modern projects user guide

Dernière mise à jour 6 avr. 2026

Fonctionnalités fondamentales

Pour automatiser le traitement des documents, quatre capacités fondamentales sont requises : numérisation, classification, extraction et validation.

Figure 1. Fundamental capabilities Un diagramme décrivant les fonctionnalités fondamentales de Document Understanding. Un document est d'abord numérisé, puis classé, et enfin extrait. Il existe une étape de validation supplémentaire pour la classification et l'extraction.

Numérisation

La numérisation convertit un document physique en texte lisible par machine, qui peut ensuite être traité numériquement. Bien que la reconnaissance optique de caractères (OCR) soit une partie importante de la numérisation, le processus de numérisation est plus complexe et implique diverses étapes, y compris l’OCR.

Par exemple, dans le cas de documents au format PDF, l’algorithme de numérisation peut faire la distinction entre les PDF numérisés et natifs ou les PDF hybrides contenant des images numérisées et du texte natif. La majeure partie du texte peut être extraite directement d’un document PDF natif, mais dans certains cas, quelques logos peuvent avoir besoin d’être lus à l’aide de l’OCR. Le processus de numérisation peut gérer toutes ces situations pour garantir une précision maximale dans la détection de texte tout en s’exécutant rapidement et efficacement.

You can change the OCR used in your project from Project settings. For more information, check the Configure project settings page. You can check the available OCR engines and the supported languages from the Supported languages section of the user guide.

You can check the Known limitations page for more information on the supported files, image size limits, and more specifications.

Classification

L’objectif d’une classification est de numériser un document et de décider à quel type de document il appartient. Connaître le type d’un document est important car différents types de documents nécessitent différentes techniques de traitement. Par exemple, une facture doit être traitée par un modèle d’extraction de factures pour garantir que tous les champs pertinents sont extraits.

Figure 2. Document classifier Une image décrivant comment un document avec un type de document inconnu passe par le classifieur de documents. Après cela, le document est classé en tant que facture.

Extraction

Data extraction is the process of selecting and retrieving only the relevant information from a document. Extracting specific data from a lengthy document using string manipulation can be challenging. However, Document UnderstandingTM provides various extraction methodologies for different document types and formats. For example, we only want to extract the Vendor Name, Billing Name, Due Date, and Total fields from an invoice.

Figure 3. Data extraction Une image décrivant comment les données sont extraites d'une facture. Les champs extraits sont Nom du fournisseur (Vendor Name), Nom de facturation (Billing Name), Date d'échéance (Due Date) et Total (Total).

Validation

Dans la classification et l’extraction, les robots logiciels utilisent le concept de confiance, qui mesure le niveau de confiance qu’une tâche particulière a été correctement effectuée. La tâche peut consister à reconnaître un type de document, à identifier un champ ou à lire les données qu’il contient. Dans ces cas, l’infrastructure Document Understanding vous permet d’engager un utilisateur humain pour examiner et valider la sortie du robot. Dans le meilleur scénario, l’intervention humaine est utilisée pour entraîner la précision du robot via l’apprentissage automatique.

  • Numérisation
  • Classification
  • Extraction
  • Validation

Cette page vous a-t-elle été utile ?

Connecter

Besoin d'aide ? Assistance

Vous souhaitez apprendre ? UiPath Academy

Vous avez des questions ? UiPath Forum

Rester à jour