- Vue d'ensemble (Overview)
- Démarrage
- Activités (Activities)
- Tableaux de bord Insights.
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Limitations du trafic
- Configuration OCR
- Pipelines
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Licences
Guide de l'utilisateur de Document Understanding
Intelligent Keyword Classifier
Le classifieur de mots-clés intelligents est un classifieur qui utilise le vecteur de mots qu'il apprend à partir de fichiers de certains types de documents en vue d'effectuer une classification de documents.
L'algorithme a été élaboré autour du concept de répétition du contenu du même type de document et part du principe que les types de documents ont une série de mots qui y apparaissent généralement, permettant ainsi le calcul de similarité vectorielle.
Lors de la classification d'un fichier dans un type de document, le classifieur de mots-clés intelligents (Intelligent Keyword Classifier) :
- trouve le vecteur de mot le plus proche d'un fichier,
- des rapports sur le type de document ayant obtenu le score le plus élevé, avec les principaux mots correspondants sous-jacents.
Le classifieur de mots-clés intelligents a également des capacités de division de fichiers, ce qui signifie qu'il peut signaler plus d'une classe pour un fichier donné et pour des plages de pages distinctes.
Nous vous conseillons d'utiliser ce classifieur si :
- vos fichiers contiennent un ou plusieurs types de documents dans un seul fichier
- vos types de documents sont relativement faciles à différencier au regard du contenu.
Vous devez utiliser votre clé d'API Automation CloudTM Document UnderstandingTM ou héberger votre propre instance du classifieur de mots-clés dans AI Center sur site afin de l'utiliser.
Placez l'activité Outil d'entraînement de classifieur de mots-clés intelligents (Intelligent Keyword Classifier Trainer) dans une activité Tester l'étendue des classifieurs (Train Classifiers Scope) et configurez-la en conséquence.
Nous ne pouvons pas appliquer la cohérence des fichiers d'entraînement entre les entraînements parallèles au niveau de l'activité. Deux solutions possibles à ce problème sont fournies par un Processus de Document Understanding (Document Understanding Process). Les deux consistent en un contrôle du trafic :
- verrouillage des fichiers (implémenté par défaut dans le processus) : renommez le fichier en utilisant l'extension
.lock
, modifiez et enregistrez le fichier, puis renommez le fichier en supprimant l'extension.lock
- configuration manuelle d'une file d'attente spéciale : créez une file d'attente vide dans Orchestrator et intégrez vos deux activités du projet.
Pour plus d'informations sur l'entraînement d'un classifieur, consultez cette page qui décrit le processus d'utilisation de l'assistant Gérer l'apprentissage (Manage Learning wizard).