- Vue d'ensemble (Overview)
- Démarrage
- Activités (Activities)
- Tableaux de bord Insights.
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Limitations du trafic
- Configuration OCR
- Pipelines
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Licences
Guide de l'utilisateur de Document Understanding
Form Extractor
L'Extracteur de formulaires (Form Extractor) est une méthode d'extraction qui convient le mieux aux cas d'utilisation dans lesquels des documents de format non variable doivent être traités avec des données qui en sont extraites. En d'autres termes, si la variation de mise en page de vos documents est faible ou nulle, alors vous avez bien fait de choisir l'Extracteur de formulaires (Form Extractor).
L'Extracteur de formulaires (Form Extractor) s'appuie sur des modèles définis en amont, lors de la conception. Un ensemble complexe de règles applique les modèles configurés aux documents entrants qui doivent être traités, identifiant et signalant ainsi les informations attendues.
Vous pouvez utiliser cette activité pour la reconnaissance de l’écriture manuscrite et l’extraction de données manuscrites ou pour la détection de signatures. Ces fonctionnalités font de l’extracteur de formulaires une excellente solution pour le traitement de formulaires imprimés ou manuscrits, ou bien si vous devez vérifier si le formulaire a été signé ou non.
L'activité est livrée avec un assistant de configuration qui vous aide à définir les modèles des types de documents et les champs que vous souhaitez cibler aux fins de l'extraction de données.
L'activité prend en charge à la fois l'extraction de champ simple et l'extraction de champ de table.
Il est recommandé de rechercher d'autres méthodes d'extraction, au cas où :
- beaucoup de mises en page doivent être gérées
- les documents ne sont pas seulement de travers, pivotés ou de tailles différentes, mais également manifestement déformés (courbures dans certaines zones).
Remarque :
Pour l'extraction de forme fixe, afin d'évaluer si les mises en page de deux fichiers sont identiques, essayez de les superposer dans un outil avec une certaine transparence afin de voir si l'intégralité du contenu non variable se chevauche (après rotation inverse, désalignement et rapprochement des deux images à la même échelle).
Si vous remarquez une variabilité (le contenu non variable apparaît plus à gauche/à droite/en haut/en bas pour certaines zones du document), alors les mises en page ne sont pas considérées comme identiques.
L'Extracteur de formulaires (Form Extractor) vous permet de définir plusieurs modèles pour le même type de document et, au moment de l'exécution, il :
- identifie le meilleur modèle correspondant au document entrant et au type de document
- applique l'algorithme de correspondance de modèle basé sur les ancres au niveau de la page à chaque page dont les données doivent être extraites (les pages manquantes ou répétées ne sont pas prises en charge)
- applique tous les paramètres d'ancrage au niveau du champ à chaque page, pour capturer les valeurs associées à toutes les correspondances potentielles
- rapporte les informations identifiées à partir des zones de valeurs cibles.
Il prend également en charge l'ajustement du traitement des cases à cocher/des champs booléens en permettant la configuration de synonymes pour les valeurs « Oui (Yes) » ou « Non (No) », selon votre cas d'utilisation.
Cet extracteur n'a pas de capacités d'apprentissage (entraînement) et nécessite une configuration.
Pour utiliser cet extracteur, vous devez utiliser votre clé d'API Automation Cloud Document Understanding ou héberger votre propre instance de l'Extracteur de formulaires (Form Extractor) dans la version locale d'AI Center.
La fonctionnalité d'ancres est désormais disponible dans l'éditeur de modèles, vous permettant de définir des règles basées sur des ancres pour l'extraction de données, pour des champs simples à partir d'un type de document fixe. Vous trouverez ici plus d'informations sur l'utilisation et la configuration des ancres.