- Vue d'ensemble (Overview)
- Créer des modèles
- Utiliser des modèles
- Paquets ML
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 9465
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Points de terminaison publics
- Langues prises en charge
- Données et sécurité
- Logique d’attribution de licences et de charge
- Comment
Concepts clés
Familiarize yourself with the core concepts around UiPath® Document UnderstandingTM.
Active learning is our modern approach to creating models for Document UnderstandingTM.
L’apprentissage actif offre une expérience interactive dans laquelle l’algorithme d’apprentissage peut interroger l’utilisateur pour labelliser les données avec les sorties souhaitées. Ce processus permet de réduire jusqu’à 80 % le temps et les données nécessaires pour entraîner un modèle d’apprentissage automatique. L’IA est utilisée pour guider le processus, qui comprend l’annotation automatique, généralement la tâche la plus longue. Le modèle fournit également des recommandations d’experts pour améliorer la précision en utilisant les ensembles de données les plus informatifs.
Grâce à l’apprentissage actif, vous pouvez également surveiller vos automatisations grâce à des fonctionnalités d’analyse.
Un type de document fait référence à la classification ou à la catégorisation d’un document en fonction de son contenu, de son format, de son objectif ou d’autres facteurs distinctifs. Certains exemples peuvent inclure des factures, des reçus, des contrats, des rapports, des dossiers médicaux, des documents juridiques et autres.
- Structuré : documents conçus pour collecter des informations dans un format spécifique. Par exemple, les enquêtes, les formulaires fiscaux, les passeports ou les licences sont tous des documents structurés.
- Semi-structuré : documents qui ne suivent pas un format strict et qui ne sont pas liés à des champs de données spécifiés. Les documents semi-structurés incluent les factures, les reçus, les factures de services publics, les relevés bancaires et autres.
- Non structuré : documents qui ne suivent pas un modèle spécifique ou organisé. Par exemple, les contrats, les baux de location ou les articles de presse sont tous des documents non structurés.
Pour en savoir plus sur les types de documents, consultez la section Types de documents (Document Types).
Cette fonctionnalité fait actuellement partie d'un processus d'audit et ne doit pas être considérée comme faisant partie de l'autorisation FedRAMP tant que la révision n'est pas finalisée. Consultez ici la liste complète des fonctionnalités en cours de révision.
L’IA générative est une forme de technologie d’IA qui exploite les modèles d’apprentissage automatique (ML) pour créer et générer de nouveaux contenus, données ou informations.
Les Grands modèles de langage (LLM) sont essentiels aux tâches d’IA les plus génératives. Il s’agit de modèles ML entraînés sur une grande quantité de données textuelles, conçus pour générer du texte de type humain. Les LLM peuvent également comprendre et répondre aux invites en complétant des phrases ou des paragraphes à la manière d’un humain.
- Extraction d’informations : les modèles d’IA générative peuvent être utilisés pour extraire des informations spécifiques de documents non structurés ou semi-structurés. Par exemple, elle peut parcourir une facture pour récupérer des détails tels que la date, le montant facturé et le nom de l’entreprise.
- Classification des documents : les modèles ML sont utilisés pour catégoriser automatiquement les documents en fonction de leur contenu. Ces algorithmes « lisent » le document, comprennent son contexte et peuvent le classer dans des catégories prédéfinies.
- Validation des données : l’IA générative peut vérifier la sortie du modèle ML chaque fois que le score de confiance est trop bas. Si les deux modèles ML (génératifs et spécialisés) ont la même sortie, un humain peut ignorer la validation de ce document. Cela peut gagner du temps à valider des documents, ainsi qu’à améliorer les performances de vos modèles en vérifiant la sortie à l’aide d’un deuxième modèle génératif.
Les modèles ML sont comme des assistants virtuels qui ont été entraînés pour apprendre à partir des données et faire des prédictions ou des décisions. Ces modèles sont essentiellement des algorithmes qui apprennent à reconnaître des modèles basés sur des données historiques. Plus ils sont exposés à des données, mieux ils peuvent améliorer leurs prédictions ou leurs décisions au fil du temps.
You can find several out of the box ML models in Document UnderstandingTM. These models help you classify and extract any commonly occurring data points from semi-structured or unstructured documents, with no setup required.
Consultez la page Modèles prêts à l’emploi pour obtenir la liste complète des modèles pré-entraînés, ainsi que leurs champs.
Les modèles ML peuvent être entraînés dans la majorité des langues tant que l’OCR reconnaît le document et le texte avec une grande confiance.
La reconnaissance optique de caractères (OCR) est une technologie spéciale utilisée pour convertir différents types de documents, tels que des documents papier numérisés, des fichiers PDF ou des images prises par un appareil photo numérique, en données modifiables et consultables.
La précision d’un moteur OCR dépend le plus souvent de la qualité du document d’origine. Un texte clair et bien formaté dans une police lisible produit généralement le meilleur résultat.
For more information on the languages supported by the OCR engines options provided by UiPath®, check the OCR Supported Languages page.