document-understanding
latest
false
UiPath logo, featuring letters U and I in white
Guide de l'utilisateur de Document Understanding
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 7 nov. 2024

Chemin d’accès au document UiPath®

Le modèle LLM (Large Language Model) DocPath est notre dernière technologie de modèle d’extraction de données, conçue pour remplacer les modèles de la génération actuelle utilisés dans UiPath® Document UnderstandingTM. Bien que DocPath fonctionne de la même manière que les modèles précédents, il a été formé à l'aide d'une grande variété de documents. Cela lui permet de traiter les types de documents courants avec peu ou pas de besoin de formation. Ce qui permet à DocPath LLM de se distinguer par son architecture générative, qui améliore considérablement la précision et simplifie l’extraction. De plus, vous pouvez également affiner le modèle en intégrant vos ensembles de données uniques.

Pour davantage d'informations sur l'architecture de DocPath et les techniques utilisées pour l'entraînement, consultez la page DocPath de notre blog sur l'IA.

Disponibilité

Actuellement, UiPath DocPath n'est disponible que pour les locataires basés aux États-Unis. La prise en charge d'autres régions devrait être déployée au début de 2025.

Améliorations par rapport à la génération précédente

DocPath LLM offre de nombreuses améliorations par rapport aux modèles précédents. Il améliore la précision, en particulier avec les tables, s’adapte à différentes mises en page de document pour réduire les efforts d’annotation et augmente les taux d’automatisation.

Les principales améliorations sont les suivantes :
  • Précision améliorée: DocPath LLM fournit un taux de précision plus élevé et un score F1 supérieur pour les documents semi-structurés tels que les factures, les reçus et les bons de commande. Cela garantit une extraction de données précise et cohérente.
  • Annotation facile: le modèle réduit le travail manuel en ne nécessitant qu’une seule annotation par document, éliminant ainsi le besoin d’annoter chaque instance de champ sur chaque page.
  • Automatisation améliorée: avec une plus grande corrélation entre le niveau de confiance et la précision, DocPath LLM améliore les taux d'automatisation tout en réduisant le nombre de documents envoyés à Action Center pour le même niveau de précision.

D’après nos tests internes, DocPath a dépassé son prédécesseur en termes de performances. Cela a réduit le taux de faux positifs d'environ 15 % et le taux de faux négatifs de près de 17 %.

Comment utiliser DocPath

Le LLM DocPath est disponible exclusivement pour les projets modernes Document Understanding. Malgré l'introduction de DocPath, toutes les versions de projet existantes utiliseront toujours les versions de modèle actuelles. Cela garantit une transition transparente sans aucune interruption des workflows de production en cours.

Pour commencer à entraîner un type de document existant sur DocPath, annulez et confirmez tous les champs dans certains documents.

  1. Choisissez le type de document que vous souhaitez entraîner sur DocPath.
  2. Sélectionner un document.
  3. Sélectionnez tous les champs du document et choisissez Supprimer ( Delete).


  4. Annotez tous les champs du document et sélectionnez Confirmer.
    Remarque : répétez les étapes 3 et 4 jusqu’à ce que l’apprentissage soit lancé sur le type de document choisi.


Comment vérifier si DocPath est activé

Après avoir entraîné vos modèles sur DocPath, vérifiez la version du modèle pour vous assurer que DocPath est activé.
  1. Accédez à la page Publier (Publish) et créez une nouvelle version de projet.
  2. Sélectionnez l’icône à trois points ⋮ située à côté de la version du projet, puis choisissez Modifier la version pour vérifier la version du modèle.
    Remarque : Tous les modèles version 24.7 et supérieures sont des modèles UiPath DocPath.


Optimisation des résultats

Les noms de champ que vous choisissez peuvent avoir un impact considérable sur les performances du modèle. Afin de garantir des résultats optimaux, utilisez le langage naturel et une grammaire appropriée pour les noms de champ. Vous ne devez utiliser que des acronys largement reconnus tels que Numéro (Numéro), Compte (Acct), Adresse (Addr) et Locataire (Apt). Actuellement, seules les langues d'Europe occidentale sont prises en charge. Assurez-vous donc que les noms de champ choisis s'alignent sur ces langues. Évitez d'utiliser des noms non descriptifs, tels que « Colonne 3 », sauf si le document utilise spécifiquement cette terminologie.

Limitations connues de UiPath® DocPath

Les limitations suivantes s'appliquent actuellement à UiPath DocPath :
  • Les champs extraits doivent correspondre exactement au texte des documents. Ce processus n'inclut pas le résumé ou d'autres types d'analyse de texte.
  • L'entraînement personnalisé n'est pas applicable pour les types de documents suivants. Si vous essayez d'utiliser DocPath pour ceux-ci, une erreur sera générée :
    • Factures Chine
    • Factures hébreu
    • Factures, Japon

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.