- Vue d'ensemble (Overview)
- Démarrage
- Créer des modèles
- Utiliser des modèles
- Paquets ML
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 941x
- Paquet ML 9465
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- Reçus Japon (Receipts Japan) - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Points de terminaison publics
- Langues prises en charge
- Tableaux de bord Insights.
- Données et sécurité
- Licences
- Comment
Guide de l'utilisateur pour les projets modernes Document Understanding
Fonctionnalités génératives
L’IA générative est une forme de technologie d’IA qui exploite les modèles d’apprentissage automatique (ML) pour créer et générer de nouveaux contenus, données ou informations.
Les Grands modèles de langage (LLM) sont essentiels aux tâches d’IA les plus génératives. Il s’agit de modèles ML entraînés sur une grande quantité de données textuelles, conçus pour générer du texte de type humain. Les LLM peuvent également comprendre et répondre aux invites en complétant des phrases ou des paragraphes à la manière d’un humain.
Principalement appliqués lors du processus d’annotation automatique de documents à l’étape de création, ces modèles génératifs accélèrent la conception de la taxonomie et accélèrent l’entraînement des modèles.
La pré-annotation dans Document Understanding se fait à l’aide d’une combinaison de modèles génératifs et spécialisés, basée sur le schéma du type de document. Le schéma permet de définir clairement les champs que vous souhaitez extraire d’un type de document particulier.
Pour mieux comprendre le fonctionnement de l’annotation générative et comment l’utiliser efficacement dans vos projets, consultez la page Annoter des documents.
L’extraction générative est une fonctionnalité essentielle de Document UnderstandingTM qui utilise la puissance de modèles d’IA générative. Ces modèles sont configurés à l’aide d’activités et sont principalement utilisés au moment de l’exécution pour l’extraction de données.
L’extraction générative est capable de déchiffrer et d’extraire des informations spécifiques de documents non structurés ou semi-structurés. Par exemple, elle peut numériser une facture et récupérer avec précision des détails tels que la date, le montant facturé et le nom de l’entreprise. Cela permet une collecte d’informations rapide, efficace et très précise à partir de différents types de documents.
- Package d’activités Document Understanding :
- Extraire les données du document (Extract Document Data), paramètre Invite (Prompt) après avoir choisi l’extracteur génératif.
- Package d’activités ML Document Understanding :
- Package d’activités IntelligentOCR :
- Étendue de l’extraction de données (Data Extraction Scope), paramètre AppliquerValidationAutomatique (ApplyAutoValidation).
Vous pouvez également utiliser les API Document Understanding pour tirer parti des fonctionnalités d’extraction générative.
La classification générative utilise des modèles d’IA pour classer automatiquement les documents immédiatement après leur téléchargement.
Ce processus de classification automatique exploite les modèles ML pour « lire » le contenu d’un document, comprendre son contexte et, par conséquent, le classer dans des catégories prédéfinies. De cette façon, le système peut gérer et organiser efficacement plusieurs types de documents.
En classant avec précision les documents non structurés ou semi-structurés, la classification générative améliore le workflow de traitement des documents, fait gagner du temps et améliore la gestion globale des documents.
- Package d’activités Document Understanding :
- Package d’activités ML Document Understanding :
Vous pouvez également utiliser les API Document Understanding pour exploiter les fonctionnalités de classification générative.
La validation générative est une fonctionnalité distincte de Document Understanding qui joue un rôle important pendant le processus de validation. Cette fonctionnalité est principalement utilisée après l’étape d’extraction pour valider le score de confiance de l’extraction effectuée à l’aide de modèles spécialisés.
Lorsque le score de confiance d’un modèle ML pour une extraction de document est faible, la validation générative est utilisée pour vérifier la sortie. Ce processus de validation nécessite que les modèles ML spécialisés et génératifs travaillent ensemble pour garantir l’exactitude.
Si les deux modèles produisent la même sortie, la validation humaine peut être ignorée, ce qui permet une amélioration significative de l’efficacité de la validation. Ce processus permet non seulement de gagner du temps au cours de l’étape de validation des documents, mais également d’améliorer les performances de vos modèles en utilisant un modèle génératif secondaire pour vérifier la sortie, garantissant un niveau de précision plus élevé.
- Package d’activités Document Understanding :
- Extraire les données du document, paramètre Validation automatique (Auto-validation)
- Package d’activités IntelligentOCR :
- Étendue de l’extraction de données, paramètres AppliquerValidationAutomatique (ApplyAutoValidation) et SeuilConfianceValidationAutomatique (AutoValidationConfidenceThreshold)
Vous pouvez également utiliser les API Document Understanding pour tirer parti des fonctionnalités de validation générative.