- Vue d'ensemble (Overview)
- Démarrage
- Créer des modèles
- Utiliser des modèles
- Détails du modèle
- Points de terminaison publics
- 1040 – Type de document
- 1040 Annexe C – Type de document
- 1040 Annexe D – Type de document
- 1040 Annexe E – Type de document
- 1040x – Type de document
- 3949a - Type de document
- 4506T – Type de document
- 709 – Type de document
- 941x – Type de document
- 9465 – Type de document
- ACORD125 – Type de document
- ACORD126 – Type de document
- ACORD131 – Type de document
- ACORD140 – Type de document
- ACORD25 – Type de document
- Relevés bancaires – Type de document
- Connaissements - Type de document
- Certificat d’incorporation – Type de document
- Certificat d’origine – Type de document
- Vérifications – Type de document
- Certificat de produit pour enfants - Type de document
- CMS 1500 – Type de document
- Déclaration de Conformité UE – Type de document
- Comptes annuels – Type de document
- FM1003 – Type de document
- I9 – Type de document
- Cartes d’identité – Type de document
- Factures – Type de document
- Factures2 : type de document
- Factures Australie – Type de document
- Factures Chine – Type de document
- Factures hébraïques – Type de document
- Factures Inde – Type de document
- Factures Japon – Type de document
- Envoi de factures – Type de document
- Liste de colisage – Type de document
- Bulletins de paie – Type de document
- Passeports – Type de document
- Bons de commande – Type de document
- Reçus – Type de document
- Reçus2 : type de document
- Reçus Japon – Type de document
- Avis de versement – Type de document
- UB04 – Type de document
- Déclaration de clôture de prêt hypothécaire aux États-Unis◊ : type de document
- Factures de services publics – Type de document
- Cartes grises – Type de document
- W2 – Type de document
- W9 – Type de document
- Langues prises en charge
- Tableaux de bord Insights.
- Document Understanding déployé dans Automation Suite
- Données et sécurité
- Journalisation
- Licences
- Comment
- Résolution des problèmes

Guide de l'utilisateur pour les projets modernes Document Understanding
Le modèle LLM DocPath est notre dernière technologie de modèle d’extraction de données, conçue pour remplacer les modèles de la génération actuelle utilisés dans UiPath® Document UnderstandingTM. Bien que DocPath fonctionne de la même manière que les modèles précédents, il a été formé à l'aide d'une grande variété de documents. Cela lui permet de traiter les types de documents courants avec peu voire pas d'entraînement. DocPath LLM se distingue par son architecture générative, qui améliore considérablement la précision et simplifie l'extraction. De plus, vous pouvez également affiner le modèle à l'aide de vos ensembles de données uniques.
Pour obtenir plus d'informations sur l'architecture DocPath et les techniques utilisées pour la formation, consultez la page DocPath de notre blog sur l'IA.
Actuellement, UiPath DocPath n’est disponible que pour les locataires basés aux États-Unis (excluant GxP et Government Cloud) dans les projets modernes Document Understanding.
- Les points de terminaison publics pour les modèles d’extraction en Europe sont basés sur DocPath, à l'exception des états financiers.
- Les points de terminaison publics suivants pour les modèles d’extraction sont basés sur DocPath dans la région du Japon :
- Factures Chine
- Factures, Japon
- Reçus Japon (Receipts Japan)
DocPath LLM offre de nombreuses améliorations par rapport aux modèles précédents améliorant la précision, en particulier avec les tables, s'adapte à diverses mises en page de document de document pour réduire les efforts d'annotation, et augmente les taux d'automatisation.
- Précision améliorée: DocPath LLM fournit un taux de précision plus élevé et un score F1 supérieur pour les documents semi-structurés tels que les factures, les reçus et les bons de commande. Cela garantit une extraction de données précise et cohérente.
- Annotation simplifiée : le modèle réduit le travail manuel en ne nécessitant qu'une seule annotation par document, éliminant ainsi le besoin d'annoter chaque instance de champ sur chaque page.
- Automatisation améliorée: avec une plus grande corrélation entre le niveau de confiance et la précision, DocPath LLM améliore les taux d'automatisation tout en réduisant le nombre de documents envoyés à Action Center pour le même niveau de précision.
D'après nos tests internes, DocPath a dépassé son prédécesseur en termes de performances permettant de réduire le taux de faux positifs d'environ 15 % et le taux de faux négatifs de près de 17 %.
DocPath LLM est disponible exclusivement pour les projets modernes Document Understanding. Malgré l'introduction de DocPath, toutes les versions de projet existantes utiliseront toujours les versions de modèle actuelles. Cela garantit une transition transparente sans aucune interruption des workflows de production en cours.
Pour commencer à entraîner un type de document existant sur DocPath, ne confirmez pas et confirmez tous les champs de quelques documents.
Les noms de champ que vous choisissez peuvent avoir un impact considérable sur les performances du modèle. Afin de garantir des résultats optimaux, utilisez le langage naturel et une grammaire appropriée pour les noms de champ. Vous ne devez utiliser que des acronymes largement reconnus tels que Numéro (No), Compte (Cpt), Adresse (Adr) et Appartement (Apt). Actuellement, seules les langues d’Europe occidentale sont prises en charge. Assurez-vous donc que les noms de champ choisis s’alignent sur ces langues. Évitez d’utiliser des noms non descriptifs, tels que « Colonne 3 », sauf si le document utilise spécifiquement cette terminologie.
UiPath DocPath ne prend actuellement en charge que les langues en script latin. Si vous devez entraîner un modèle dans des langues de script non latines, choisissez le type de modèle hérité. Si le modèle hérité est sélectionné, choisissez le modèle de base approprié pour votre type de document.
Pour choisir entre le type de modèle DocPath ou hérité, accédez à l'onglet Paramètres dans le gestionnaire de type de document et sélectionnez le type de modèle nécessaire dans la liste déroulante Type de modèle .
- Les champs extraits doivent correspondre exactement au texte des documents. Ce processus n’inclut pas le résumé ou d’autres types d’analyse de texte.
- Les types de documents suivants ne sont actuellement pas basés sur DocPath et continuent à fonctionner sur la génération précédente :
- États financiers
- Factures Chine
- Factures hébreu
- Factures, Japon
Le type de document sera entraîné à l’aide du modèle hérité.
UiPath DocPath ne prend actuellement pas en charge les langues en script non latines.