- Vue d'ensemble (Overview)
- Démarrage
- Créer des modèles
- Utiliser des modèles
- Détails du modèle
- Points de terminaison publics pour Automation Cloud et Test Cloud
- Points de terminaison publics pour Automation Cloud et Test Cloud pour le secteur public
- 1040 – Type de document
- 1040 Annexe C – Type de document
- 1040 Annexe D – Type de document
- 1040 Annexe E – Type de document
- 1040x – Type de document
- 3949a - Type de document
- 4506T – Type de document
- 709 – Type de document
- 941x – Type de document
- 9465 – Type de document
- ACORD125 – Type de document
- ACORD126 – Type de document
- ACORD131 – Type de document
- ACORD140 – Type de document
- ACORD25 – Type de document
- Relevés bancaires – Type de document
- Connaissements - Type de document
- Certificat d’incorporation – Type de document
- Certificat d’origine – Type de document
- Vérifications – Type de document
- Certificat de produit pour enfants - Type de document
- CMS 1500 – Type de document
- Déclaration de Conformité UE – Type de document
- Comptes annuels – Type de document
- FM1003 – Type de document
- I9 – Type de document
- Cartes d’identité – Type de document
- Factures – Type de document
- Factures2 : type de document
- Factures Australie – Type de document
- Factures Chine – Type de document
- Factures hébraïques – Type de document
- Factures Inde – Type de document
- Factures Japon – Type de document
- Envoi de factures – Type de document
- Liste de colisage – Type de document
- Bulletins de paie – Type de document
- Passeports – Type de document
- Bons de commande – Type de document
- Reçus – Type de document
- Reçus2 : type de document
- Reçus Japon – Type de document
- Avis de versement – Type de document
- UB04 – Type de document
- Déclaration de clôture de prêt hypothécaire aux États-Unis◊ : type de document
- Factures de services publics – Type de document
- Cartes grises – Type de document
- W2 – Type de document
- W9 – Type de document
- Langues prises en charge
- Tableaux de bord Insights.
- Données et sécurité
- Journalisation
- Licences
- Comment
- Résolution des problèmes
Guide de l'utilisateur de Document Understanding
La disponibilité des fonctionnalités dépend de la plate-forme cloud que vous utilisez. Pour de plus amples informations, consultez la page Choisir le type de déploiement.
L’IA générative est une forme de technologie d’IA qui exploite les modèles d’apprentissage automatique (ML) pour créer et générer de nouveaux contenus, données ou informations.
Les Grands modèles de langage (LLM) sont essentiels aux tâches d’IA les plus génératives. Il s’agit de modèles ML entraînés sur une grande quantité de données textuelles, conçus pour générer du texte de type humain. Les LLM peuvent également comprendre et répondre aux invites en complétant des phrases ou des paragraphes à la manière d’un humain.
Annotation générative
Principalement appliqués lors du processus d’annotation automatique de documents à l’étape de création, ces modèles génératifs accélèrent la conception de la taxonomie et accélèrent l’entraînement des modèles.
La pré-annotation dans Document Understanding se fait à l’aide d’une combinaison de modèles génératifs et spécialisés, basée sur le schéma du type de document. Le schéma permet de définir clairement les champs que vous souhaitez extraire d’un type de document particulier.
Pour mieux comprendre le fonctionnement de l’annotation générative et comment l’utiliser efficacement dans vos projets, consultez la page Annoter des documents.
Extraction générative
L’extraction générative est une fonctionnalité cruciale de Document UnderstandingTM qui utilise la puissance des modèles d’IA générative. Ces modèles sont configurés à l’aide d’activités et sont principalement utilisés au moment de l’exécution pour l’extraction de données.
L’extraction générative est capable de déchiffrer et d’extraire des informations spécifiques de documents non structurés ou semi-structurés. Par exemple, elle peut numériser une facture et récupérer avec précision des détails tels que la date, le montant facturé et le nom de l’entreprise. Cela permet une collecte d’informations rapide, efficace et très précise à partir de différents types de documents.
Activités connexes
Pour plus d’informations sur l’utilisation plus efficace des activités d’extraction générative, consultez la page Extracteur génératif - Bonnes pratiques .
Veillez à bien utiliser les versions minimales d’activités suivantes lorsque vous utilisez Document Understanding dans les environnements Automation Cloud et Test Cloud pour le secteur public :
- IntelligentOCR.Activities 6.22 et versions ultérieures
- DocumentUnderstanding.ML.Activities 1.31.1 et versions ultérieures
Plusieurs activités ont été mises en place pour vous aider à bénéficier des fonctionnalités d’extraction générative :
- Package d’activités Document Understanding :
- Extraire les données du document (Extract Document Data), paramètre Invite (Prompt) après avoir choisi l’extracteur génératif.
- Package d’activités ML Document Understanding :
- Package d’activités IntelligentOCR :
- Étendue de l’extraction de données (Data Extraction Scope), paramètre AppliquerValidationAutomatique (ApplyAutoValidation).
Vous pouvez également utiliser les API Document Understanding pour tirer parti des fonctionnalités d’extraction générative.
Modèles pris en charge
Les extracteurs génératifs disponibles sous le projet Génératif prédéfini peuvent être utilisés pour les documents décrits dans le tableau suivant :
Les extracteurs Long Document Complex Layout et Short Document Complex Layout ne sont pas disponibles actuellement dans Automation CloudTM pour les environnements du secteur public (FedRamp).
Tableau 1. Scénarios pris en charge pour les extracteurs génératifs
| Extracteur | Scénario recommandé | Fournisseur | Disponibilité régionale | Prise en charge multimodale1 |
|---|---|---|---|---|
| Extracteur de mise en page simple de document long | Recommandée pour les documents longs contenant principalement du texte et des titres. Par exemple, utilisez l’extracteur de mise en page simple pour documents longs sur des documents tels que des contrats de bail, des accords-cadres ou d’autres documents similaires. | Azure OpenAI | Australie, Union européenne, Inde, Japon, Singapour, Royaume-Uni, États-Unis, Canada | ❌ |
| Extracteur de mise en page complexe de documents longs (aperçu) | Recommandé pour les documents longs avec une mise en page complexe, tels que les images, le texte manuscrit, les éléments de formulaire ou les mises en page distinctives telles que les encadrés flottants. Vous pouvez utiliser cet extracteur sur des documents volumineux tels que les polices d’assurance, qui possèdent généralement une mise en page complexe. | Azure OpenAI | États-Unis, Union européenne, Japon, Singapour | ✅ |
| Extracteur de mise en page complexe de documents courts (aperçu) | Recommandé pour les documents plus courts (20 pages maximum) contenant des images, du texte manuscrit, des éléments de formulaire ou des mises en page complexes, telles que les encadrés flottants. Utiliser cet extracteur sur des documents tels que des pièces d’identité officielles ou des formulaires médicaux dont les mises en page sont généralement plus courtes, mais plus complexes. | Azure OpenAI | États-Unis, Union européenne, Japon, Singapour | ✅ |
1 La prise en charge multimodale fait référence à la capacité d’extraire différents types d’entrées de données, tels que du texte, des images, du texte manuscrit, etc.
Classification générative
La classification générative utilise des modèles d’IA pour classer automatiquement les documents immédiatement après leur téléchargement.
Ce processus de classification automatique exploite les modèles ML pour « lire » le contenu d’un document, comprendre son contexte et, par conséquent, le classer dans des catégories prédéfinies. De cette façon, le système peut gérer et organiser efficacement plusieurs types de documents.
En classant avec précision les documents non structurés ou semi-structurés, la classification générative améliore le workflow de traitement des documents, fait gagner du temps et améliore la gestion globale des documents.
Activités connexes
Pour plus d’informations sur l’utilisation plus efficace des activités de classification générative, consultez la page Classifieur génératif - Bonnes pratiques .
Veillez à bien utiliser les versions minimales d’activités suivantes lorsque vous utilisez Document Understanding dans les environnements Automation Cloud et Test Cloud pour le secteur public :
- IntelligentOCR.Activities 6.22 et versions ultérieures
- DocumentUnderstanding.ML.Activities 1.31.1 et versions ultérieures
Plusieurs activités ont été mises en place pour vous aider à bénéficier des fonctionnalités de classification générative :
- Package d’activités Document Understanding :
- Package d’activités ML Document Understanding :
Vous pouvez également utiliser les API Document Understanding pour exploiter les fonctionnalités de classification générative.
Validation générative
La validation générative est une fonctionnalité distincte de Document Understanding qui joue un rôle important pendant le processus de validation. Cette fonctionnalité est principalement utilisée après l’étape d’extraction pour valider le score de confiance de l’extraction effectuée à l’aide de modèles spécialisés.
Lorsque le score de confiance d’un modèle ML pour une extraction de document est faible, la validation générative est utilisée pour vérifier la sortie. Ce processus de validation nécessite que les modèles ML spécialisés et génératifs travaillent ensemble pour garantir l’exactitude.
Si les deux modèles produisent la même sortie, la validation humaine peut être ignorée, ce qui permet une amélioration significative de l’efficacité de la validation. Ce processus permet non seulement de gagner du temps au cours de l’étape de validation des documents, mais également d’améliorer les performances de vos modèles en utilisant un modèle génératif secondaire pour vérifier la sortie, garantissant un niveau de précision plus élevé.
Activités connexes
Veillez à bien utiliser les versions minimales d’activités suivantes lorsque vous utilisez Document Understanding dans les environnements Automation Cloud et Test Cloud pour le secteur public :
- IntelligentOCR.Activities 6.22 et versions ultérieures
- DocumentUnderstanding.ML.Activities 1.31.1 et versions ultérieures
Plusieurs activités ont été mises en place pour vous aider à bénéficier des fonctionnalités de validation générative :
- Package d’activités Document Understanding :
- Extraire les données du document, paramètre Validation automatique (Auto-validation)
- Package d’activités IntelligentOCR :
- Étendue de l’extraction de données, paramètres AppliquerValidationAutomatique (ApplyAutoValidation) et SeuilConfianceValidationAutomatique (AutoValidationConfidenceThreshold)
Vous pouvez également utiliser les API Document Understanding pour tirer parti des fonctionnalités de validation générative.