document-understanding
latest
false
Important :
La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.
UiPath logo, featuring letters U and I in white

Guide de l'utilisateur pour les projets modernes Document Understanding

Dernière mise à jour 17 déc. 2025

UiPath® DocPath

The DocPath large language model (LLM) is our latest data extraction model technology, designed to replace current generation models used within UiPath® Document UnderstandingTM. While DocPath operates similarly to previous models, it was trained using a wide variety of documents. This enables it to process common document types with little to no training needed. What sets DocPath LLM apart is its generative architecture, which significantly improves accuracy and simplifies extraction. Additionally, you can also fine-tune the model with your unique datasets.

To gain further insights into the DocPath architecture and the techniques used for training, check the DocPath page from our AI blog.

Disponibilité

Currently, UiPath DocPath is only available for US-based tenants (excluding GxP and Government Cloud) in Document Understanding modern projects.

UiPath DocPath is available for both classic and modern projects when using public endpoints in the following regions:
  • Public endpoints for extraction models in Europe are based on DocPath, except for Financial Statements.
  • The following public endpoints for extraction models are based on DocPath in the Japan region:
    • Factures Chine
    • Factures, Japon
    • Reçus Japon (Receipts Japan)

Améliorations par rapport à la génération précédente

DocPath LLM offers numerous enhancements over previous models. It improves accuracy, especially with tables, adapts to various document layouts to reduce annotation efforts, and boosts automation rates.

Les principales améliorations sont les suivantes :
  • Improved accuracy: DocPath LLM delivers a higher accuracy rate and superior F1 score for semi-structured documents such as invoices, receipts, and purchase orders. This ensures precise and consistent data extraction.
  • Annotation simplifiée : le modèle réduit le travail manuel en ne nécessitant qu'une seule annotation par document, éliminant ainsi le besoin d'annoter chaque instance de champ sur chaque page.
  • Enhanced automation: With a greater correlation between confidence level and accuracy, DocPath LLM enhances automation rates while reducing the number of documents sent to Action Center for the same accuracy level.

From our internal tests, DocPath outperformed its predecessor in performance. It reduced the false positive rate by around 15%, and the false negative rate dropped by nearly 17%.

How to use DocPath

The DocPath LLM is available exclusively for Document Understanding modern projects. Despite the introduction of DocPath, all existing project versions will still use current model versions. This ensures a seamless transition without any disruption to ongoing production workflows.

To start training an exisiting document type on DocPath, unconfirm and confirm all fields in a few documents.

  1. Choose the document type you want to train on DocPath.
  2. Sélectionnez un document.
  3. Sélectionnez tous les champs du document et choisissez Supprimer (Delete).


  4. Annotez tous les champs du document et sélectionnez Confirmer (Confirmer).
    Remarque : répétez les étapes 3 et 4 jusqu'à ce que l'entraînement soit lancé sur le type de document choisi.


How to check if DocPath is enabled

After training your models on DocPath, check the model version to make sure that DocPath is enabled.
  1. Accédez à la page Publier (Publish) et créez une nouvelle version de projet.
  2. Sélectionnez l'icône à trois points située à côté de la version du projet, puis choisissez Modifier la version (Edit version) pour vérifier la version du modèle.
    Note: All models version 24.7 and above are UiPath DocPath models.


Optimisation des résultats

Les noms de champ que vous choisissez peuvent avoir un impact considérable sur les performances du modèle. Afin de garantir des résultats optimaux, utilisez le langage naturel et une grammaire appropriée pour les noms de champ. Vous ne devez utiliser que des acronymes largement reconnus tels que Numéro (No), Compte (Cpt), Adresse (Adr) et Appartement (Apt). Actuellement, seules les langues d’Europe occidentale sont prises en charge. Assurez-vous donc que les noms de champ choisis s’alignent sur ces langues. Évitez d’utiliser des noms non descriptifs, tels que « Colonne 3 », sauf si le document utilise spécifiquement cette terminologie.

Choosing between DocPath and legacy model type

UiPath DocPath currently supports only Latin script languages. If you need to train a model in non-Latin script languages, choose the legacy model type. If the legacy model is selected, choose the appropriate base model for your document type.

To choose between DocPath or legacy model type, navigate to the Settings tab in Document Type Manager and select the needed model type from the Model type drop-down list.



Important : il est nécessaire de publier une nouvelle version du projet après le déploiement des modifications.

UiPath® DocPath known limitations

The following limitations currently apply for UiPath DocPath:
  • Les champs extraits doivent correspondre exactement au texte des documents. Ce processus n’inclut pas le résumé ou d’autres types d’analyse de texte.
  • The following document types are not currently based on DocPath and still work on the previous generation:
    • États financiers
    • Factures Chine
    • Factures hébreu
    • Factures, Japon
Tip: Document types that are not currently supported by the DocPath model have the following message in the Add document type drop-down list:

Le type de document sera entraîné à l’aide du modèle hérité.



UiPath DocPath does not currently support non-Latin script languages.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo
Confiance et sécurité
© 2005-2025 UiPath Tous droits réservés.