- Vue d'ensemble (Overview)
- Démarrage
- Créer des modèles
- Utiliser des modèles
- Paquets ML
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Points de terminaison publics
- Langues prises en charge
- Tableaux de bord Insights.
- Données et sécurité
- Licences
- Comment
Annoter des documents
After successfully creating your project and uploading your documents to a specific document type, they are automatically pre-annotated. This is done using a combination of generative and specialized models, based on the document type's schema. The schema clearly defines the fields you want to extract from a particular document type. To find the document type's schema, go to the Annotation page and check the Fields section.
Les pré-annotations sont indiquées par des soulignements sur le texte du document et ne peuvent pas être supprimées. Si elles sont incorrectes et ne peuvent pas être mises en correspondance avec un champ particulier, vous pouvez les ignorer. Au cours du processus d’entraînement, seuls les champs confirmés seront utilisés pour l’entraînement, tandis que les champs soulignés ne seront pas pris en compte.
As you continue to add more annotations, the pre-annotated underlines should progressively align with your input. There may be a few inconsistencies between underlines and user-annotated fields at the beginning. However, as you make more annotations and the model improves, the underlines should line up more precisely with the user-supplied data.
Dans l’image suivante, l’adresse de livraison a été pré-annotée de façon incorrecte pour inclure le nom de la personne.
Pour résoudre ce problème, il vous suffit de confirmer l’adresse de livraison. Il n’est pas nécessaire de supprimer le texte souligné associé au nom. Au fur et à mesure que vous annotez et que vous corrigez ces erreurs, les cas où le texte souligné ne s’aligne pas sur le champ confirmé devraient diminuer.
- Les types de documents personnalisés ne sont pas automatiquement annotés. Les documents appartenant à un type de document personnalisé doivent être pré-annotés manuellement.
- Pour déclencher l’entraînement du modèle, un minimum de 40 opérations sont nécessaires. Par exemple, si vous avez 20 documents, vous devrez annoter au moins 2 champs par document, ce qui conduit à un total de 40 opérations.
Une fois tous les documents téléchargés et pré-annotés, votre objectif sera de valider ou de modifier les champs pré-annotés. Pour un document où tous les champs ont été pré-annotés avec précision, sélectionnez Confirmer afin d’approuver tous les champs en même temps. Un document confirmé sera indiqué par un symbole de bouclier vert dans la liste des documents.
Si un document n’est que partiellement confirmé, il sera indiqué par un symbole de bouclier vide dans la liste des documents. Cela indique que le processus d’annotation de ce document est en cours. Votre objectif final doit être de veiller à ce que tous les documents aient été confirmés.
- La pré-annotation est correcte et doit être validée.
- La pré-annotation est incorrecte et le champ est présent dans le document.
- La pré-annotation n’est pas correcte et le champ est manquant dans le document.
- Il n’y a pas de pré-annotation.
Si la pré-annotation est incorrecte, choisissez le texte et le champ appropriés, puis sélectionnez Confirmer.
Vous pouvez modifier les paramètres du type de document à partir de la vue Annoter (Annotate).
Pour cela, cliquez sur l’icône à trois points ⁝ à droite du nom du type de document, puis sélectionnez Paramètres.
- Modèle de base : les estimations de la taille de l’ensemble de données utilisées dans les actions recommandées dépendent du modèle de base utilisé pour l’entraînement. L’utilisation du modèle de base le plus similaire à votre type de document permettra de réduire la quantité de travail d’annotation requise.
- Nombre de langues : l’estimation de la taille de l’ensemble de données utilisée dans les actions recommandées dépend du nombre de langues dans l’ensemble de données. Un plus grand nombre de langues nécessite généralement d’annoter plus de données.