- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- FlexiCapture Classifier
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- FlexiCapture Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- 4506T - Paquet ML
- 990 - Paquet ML - Aperçu
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Passeports - Paquet ML
- Fiches de paie - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Prérequis matériels
- Pipelines
- Document Manager
- Services OCR
- Apprentissage profond
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Licences
- Activités (Activities)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Vue d’ensemble de classification de document
Document Classification is a component in the Document UnderstandingTM Framework that helps in identifying what types of files the robot is processing.
Un fichier peut être classé en un ou plusieurs types de documents selon son contenu et les méthodes de classement utilisées :
- si un fichier contient un seul type de document logique (par exemple, il s'agit d'une facture ou d'un dossier médical dans son intégralité), alors le composant de classification doit être configuré en conséquence et renvoyer un seul résultat de classification ;
- si un fichier contient plusieurs types de documents logiques (par exemple, il contient une facture de la page 1 à 5, un dossier médical pour les 10 pages suivantes ainsi qu'un contrat d'assurance de la page 16 à la fin), alors le composant de classification devrait renvoyer plusieurs résultats de classification, chacun correspondant à la plage de pages du fichier d'entrée appropriée.
Les types de documents pour lesquels la classification est tentée sont ceux définis dans la taxonomie du projet.
D'une part, si un projet doit traiter des fichiers qui sont tous du même type de document et toujours présents sous la forme d'une instance par fichier (par exemple, une facture dans un fichier), alors la classification n'est pas nécessaire et peut être ignorée dans son intégralité.
D'un autre côté, si le projet traite deux types de documents ou plus (par exemple, le workflow doit traiter des factures et des dossiers médicaux qui ne peuvent pas être distingués avant le traitement), ou si les fichiers contiennent parfois deux ou plusieurs types de documents distincts (par exemple, un fichier contenant 3 factures), alors la classification est fortement recommandée.
La classification est effectuée via l'activité Classer l'étendue du document (Classify Document Scope). Pour classer les documents, vous pouvez utiliser un ou plusieurs classifieurs, car l'activité d'étendue a pour rôle de configurer et d'exécuter un ou plusieurs algorithmes de classification de documents ainsi que d'offrir une option de configuration simple et unifiée qui réponde à vos besoins.
En bref, voici les fonctions de l'activité Classer l'étendue du document (Classify Document Scope) :
- Fournit à tous les classifieurs (algorithmes de classification) les configurations nécessaires à leur exécution.
- Accepte un ou plusieurs classifieurs.
- Rend possible le filtrage du type de document, le mappage de la taxonomie et le réglage des paramètres du seuil de confiance minimum au niveau du classifieur.
- Rapporte les informations de classification de manière unifiée, quelle que soit la source de classification.
Classer l'étendue du document (Classify Document Scope) vous permet de la configurer à l'aide de l'assistant Configurer les classifieurs (Configure Classifiers). Vous pouvez déterminer
- quels types de documents sont acceptés à partir de quel classifieur,
- quel est le seuil de confiance minimum d'un résultat donné jugé acceptable pour chaque classifieur,
- quel est le mappage taxonomique, au niveau du type de document, entre la taxonomie du projet et la taxonomie interne du classifieur (le cas échéant).
Notez que l'ordre des classifieurs dans Classer l'étendue du document (Classify Document Scope) est important :
- les classifieurs sont exécutés en priorité, de gauche à droite ;
- un résultat de classification renvoyé par un classifieur est accepté s'il rapporte l'un des types de documents acceptés et présente un seuil de confiance égal ou supérieur au seuil de confiance minimum défini pour ce classifieur ;
- un classifieur est exécuté avec les plages de pages demeurées non classées par les classifieurs précédents uniquement (il peut donc être appelé plusieurs fois lors d'une seule exécution).
En fonction des exigences du cas d'utilisation, vous pouvez choisir plusieurs méthodes de classification différentes, nommées classifieurs.
Les classifieurs se trouvent dans les packages UiPath.IntelligentOCR.Activities ou UiPath.DocumentUnderstanding.ML.Activities.
Les classifieurs disponibles sont :
- Keyword Based Classifier
- Intelligent Keyword Classifier
- Machine Learning Classifier
- Classifieur génératif
Vous pouvez toujours créer votre propre classifieur à l'aide des contrats de traitement de documents (Document Processing Contrats) publics, vous permettant ainsi de mettre en œuvre n'importe quel algorithme correspondant à votre cas d'utilisation.