- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Keyword Based Classifier
- Intelligent Keyword Classifier
- FlexiCapture Classifier
- Machine Learning Classifier
- Activités liées à la classification des documents
- Vue d’ensemble de l'entraînement de la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Machine Learning Classifier Trainer
- Activités liées à l'entraînement de la classification des documents
- Vue d’ensemble de l’extraction des données
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- FlexiCapture Extractor
- Activités liées à l'extraction de données
- Consommation de données
- Paquets ML
- Pipelines
- Document Manager
- Services OCR
- Document Understanding déployé dans Automation Suite
- Installer et utiliser
- Première expérience d'exécution
- Déployer UiPathDocumentOCR
- Déployer un paquet ML prêt à l'emploi
- Offres groupées hors ligne 2022.10.0
- Offres groupées hors ligne 2022.10.2
- Bundles 2022.10.4 hors ligne
- Bundles hors ligne 2022.10.6
- Bundles 2022.10.9 hors ligne
- Bundles 2022.10.10 hors ligne
- Bundles 2022.10.11 hors ligne
- Bundles 2022.10.12 hors ligne
- Bundles 2022.10.13 hors ligne
- Bundles 2022.10.14 hors ligne
- Utiliser le gestionnaire de documents
- Utiliser l'infrastructure
- Document Understanding déployé dans une version AI Center autonome
- Apprentissage profond
- Licences
- Référence (Reference)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guide de l'utilisateur de Document Understanding
Intelligent Keyword Classifier
Le classifieur de mots-clés intelligents est un classifieur qui utilise le vecteur de mots qu'il apprend à partir de fichiers de certains types de documents en vue d'effectuer une classification de documents.
L'algorithme a été élaboré autour du concept de répétition du contenu du même type de document et part du principe que les types de documents ont une série de mots qui y apparaissent généralement, permettant ainsi le calcul de similarité vectorielle.
Lors de la classification d'un fichier dans un type de document, le classifieur de mots-clés intelligents (Intelligent Keyword Classifier) :
- trouve le vecteur de mot le plus proche d'un fichier,
- des rapports sur le type de document ayant obtenu le score le plus élevé, avec les principaux mots correspondants sous-jacents.
Le classifieur de mots-clés intelligents a également des capacités de division de fichiers, ce qui signifie qu'il peut signaler plus d'une classe pour un fichier donné et pour des plages de pages distinctes.
Nous vous conseillons d'utiliser ce classifieur si :
- vos fichiers contiennent un ou plusieurs types de documents dans un seul fichier
- vos types de documents sont relativement faciles à différencier au regard du contenu.
Vous devez utiliser votre clé d'API Automation Cloud Document Understanding ou héberger votre propre instance du classifieur de mots-clés dans AI Center sur site afin de l'utiliser.
Placez l'activité Outil d'entraînement de classifieur de mots-clés intelligents (Intelligent Keyword Classifier Trainer) dans une activité Tester l'étendue des classifieurs (Train Classifiers Scope) et configurez-la en conséquence.
Nous ne pouvons pas appliquer la cohérence des fichiers d'entraînement entre les entraînements parallèles au niveau de l'activité. Deux solutions possibles à ce problème sont fournies par un Processus de Document Understanding (Document Understanding Process). Les deux consistent en un contrôle du trafic :
- verrouillage des fichiers (implémenté par défaut dans le processus) : renommez le fichier en utilisant l'extension
.lock
, modifiez et enregistrez le fichier, puis renommez le fichier en supprimant l'extension.lock
- configuration manuelle d'une file d'attente spéciale : créez une file d'attente vide dans Orchestrator et intégrez vos deux activités du projet.
Pour plus d'informations sur l'entraînement d'un classifieur, consultez cette page qui décrit le processus d'utilisation de l'assistant Gérer l'apprentissage (Manage Learning wizard).
En savoir plus sur Classifieur de mots clés intelligents (Intelligent Keyword Classifier), en suivant ce lien.