- Vue d'ensemble (Overview)
- Créer des modèles
- Utiliser des modèles
- Paquets ML
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 9465
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Points de terminaison publics
- Langues prises en charge
- Données et sécurité
- Logique d’attribution de licences et de charge
- Comment
Guide de l'utilisateur de Document Understanding
Annoter des documents
Une fois que vous avez créé votre projet et chargé vos documents vers un type de document spécifique, ceux-ci sont automatiquement pré-annotés. Cela est réalisé à l’aide de modèles spécialisés basés sur le schéma du type de document. Le schéma permet de définir clairement les champs que vous souhaitez extraire d’un type de document particulier. Pour trouver le schéma du type de document, rendez-vous sur la page Annotation et consultez la section Champs.
Les pré-annotations sont indiquées par des soulignements sur le texte du document et ne peuvent pas être supprimées. Si elles sont incorrectes et ne peuvent pas être mises en correspondance avec un champ particulier, vous pouvez les ignorer. Au cours du processus d’entraînement, seuls les champs confirmés seront utilisés pour l’entraînement, tandis que les champs soulignés ne seront pas pris en compte.
Au fur et à mesure que vous ajoutez des annotations, les soulignements pré-annotés s’alignent progressivement sur votre entrée. Il est possible qu’il y ait au début des incohérences entre les soulignements et les champs annotés par l’utilisateur. Cependant, à mesure que vous effectuez d’autres annotations et que le modèle s’améliore, les soulignements devraient s’aligner plus précisément sur les données fournies par l’utilisateur.
Dans l’image suivante, l’adresse de livraison a été pré-annotée de façon incorrecte pour inclure le nom de la personne.
Pour résoudre ce problème, il vous suffit de confirmer l’adresse de livraison. Il n’est pas nécessaire de supprimer le texte souligné associé au nom. Au fur et à mesure que vous annotez et que vous corrigez ces erreurs, les cas où le texte souligné ne s’aligne pas sur le champ confirmé devraient diminuer.
- Les types de documents personnalisés ne sont pas automatiquement annotés. Les documents appartenant à un type de document personnalisé doivent être pré-annotés manuellement.
- Pour déclencher l’entraînement du modèle, un minimum de 40 opérations sont nécessaires. Par exemple, si vous avez 20 documents, vous devrez annoter au moins 2 champs par document, ce qui conduit à un total de 40 opérations.
Une fois tous les documents téléchargés et pré-annotés, votre objectif sera de valider ou de modifier les champs pré-annotés. Pour un document où tous les champs ont été pré-annotés avec précision, sélectionnez Confirmer afin d’approuver tous les champs en même temps. Un document confirmé sera indiqué par un symbole de bouclier vert dans la liste des documents.
Si un document n’est que partiellement confirmé, il sera indiqué par un symbole de bouclier vide dans la liste des documents. Cela indique que le processus d’annotation de ce document est en cours. Votre objectif final doit être de veiller à ce que tous les documents aient été confirmés.
- La pré-annotation est correcte et doit être validée.
- La pré-annotation est incorrecte et le champ est présent dans le document.
- La pré-annotation n’est pas correcte et le champ est manquant dans le document.
- Il n’y a pas de pré-annotation.
Si la pré-annotation est incorrecte, choisissez le texte et le champ appropriés, puis sélectionnez Confirmer.
Vous pouvez modifier les paramètres du type de document à partir de la vue Annoter (Annotate).
Pour cela, cliquez sur l’icône à trois points ⁝ à droite du nom du type de document, puis sélectionnez Paramètres.
- Modèle de base : les estimations de la taille de l’ensemble de données utilisées dans les actions recommandées dépendent du modèle de base utilisé pour l’entraînement. L’utilisation du modèle de base le plus similaire à votre type de document permettra de réduire la quantité de travail d’annotation requise.
- Nombre de langues : l’estimation de la taille de l’ensemble de données utilisée dans les actions recommandées dépend du nombre de langues dans l’ensemble de données. Un plus grand nombre de langues nécessite généralement d’annoter plus de données.