- Vue d'ensemble (Overview)
- Document Processing Contracts
- Notes de publication
- À propos des contrats de traitement de documents
- Classe Zone
- Interface ActivitéIPersisted
- Classe PrettyBoxConverter
- Interface ActivitéIClassifier
- Interface FournisseurIClassifieurCapacités
- Classe TypeDocumentClassifieur
- Classe RésultatClassifieur
- Classe ActivitéCodeClassifieur
- Classe ActivitéClassifieurNatif
- Classe ActivitéClassifieurCodeAsync
- Classe CapacitéClassifieurTypeDocument
- Classe ActivitéExtracteurCodeAsync
- Classe ActivitéExtracteurCode
- Classe ExtracteurTypeDocument
- Classe ExtracteurDocumentTypeCapacités
- Classe ExtracteurChampCapacités
- Classe ActivitéExtracteurNatif
- Classe ExtracteurRésultat
- Interface FournisseurICapabilities
- Interface ActivitéIExtractor
- Classe ChargeUtileExtracteur
- Énumération PrioritéActionDocument
- Classe DocumentActionData
- Énumération StatutActionDocument
- Énumération TypeActionDocument
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe DonnéesUtilisateur
- Classe Documents
- Classe RésultatDivisionDocument
- Classe ExtensionDom
- Classe Page
- Classe SectionPage
- Classe Polygone
- Classe ConvertisseurPolygones
- Classe de métadonnées
- Classe GroupeMot
- Classe Mot
- Énumération SourceTraitement
- Classe CelluleRésultatsTable
- Classe ValeurTableRésultats
- Classe InformationsColonnesTableRésultats
- Classe TableRésultats
- Énumération Rotation
- Énumération TypeSection
- Énumération TypeGroupeMot
- ProjectionTexteIDocument Interface
- Classe RésultatClassification
- Classe RésultatExtraction
- Classe ResultatsDocument
- Classe ResultatsLimitesDocument
- Classe ResultatsDonnéesPoint
- Classe RésultatsValeur
- Classe ResultatsContenuRéference
- Classe ResultatsValeurJetons
- Classe ResultatsChampDérivé
- Énumération ResultatsSourceDonnées
- Classe ResultatsConstantes
- Classe ChampValeurSimple
- Classe ValeurChampTable
- Classe GroupeDocument
- Classe DocumentTaxonomie
- Classe TypeDocument
- Classe Champ
- Énumération TypeChamp
- Classe InfoLangage
- Classe SaisieMétadonnées
- Énumération TypeTexte
- Classe TypeFieldTypeField Class
- Interface ActivitéISuivi
- ITrainableActivity Interface
- Interface ActivitéClassifieurITrainable
- Interface ActivitéExtracteurITrainable
- Classe ActivitéFormationClassifieurCodeAsync
- Classe ActivitéFormationClassifieurCode
- Classe ActivitéFormationClassifieurNatif
- Classe ActivitéFormationExtracteurCodeAsync
- Classe ActivitéFormationExtracteurCode
- Classe ActivitéFormationExtracteurNative
- Numériseur de Document Understanding
- Document Understanding ML
- Serveur local OCR Document Understanding
- Document Understanding
- Notes de publication
- À propos du package d’activités Document Understanding
- Compatibilité du projet
- Définir le mot de passe du PDF
- Merge PDFs
- Get PDF Page Count
- Extraire le texte PDF (Extract PDF Text)
- Extract PDF Images
- Extract PDF Page Range
- Extraire les données du document
- Create Validation Task and Wait
- Attendre la tâche de validation et reprendre
- Create Validation Task
- Classer un document (Classify Document)
- Créer une tâche de validation de classification (Create Classification Validation Task)
- Créer une tâche de validation de classification et attendre (Create Classification Validation Task and Wait)
- Attendre la tâche de validation de la classification et reprendre
- IntelligentOCR
- Notes de publication
- À propos du package d'activités IntelligentOCR
- Compatibilité du projet
- Configuration de l'authentification
- Load Taxonomy
- Digitize Document
- Classify Document Scope
- Keyword Based Classifier
- Classifieur de projet Document Understanding (Document Understanding Project Classifier)
- Intelligent Keyword Classifier
- Create Document Classification Action
- Attendre l'action de classification du document et reprendre
- Tester l'étendue des classifieurs
- Outil d'entraînement de classifieur basé sur des mots-clés
- Intelligent Keyword Classifier Trainer
- Data Extraction Scope
- Extracteur de projet Document Understanding (Document Understanding Project Extractor)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Tester l'étendue des extracteurs
- Export Extraction Results
- Services ML
- OCR
- Contrats OCR
- Notes de publication
- À propos des contrats OCR
- Compatibilité du projet
- Interface ActivitéIOCR
- Classe OCRCodeAsync
- Classe ActivitéCodeOCR
- Classe ActivitéOCRNatif
- Classe Caractère
- Classe RésultatOCR
- Classe Mot
- Énumération StylesPolice
- Énumération RotationOCR
- Classe OCRCapabilities
- Classe BaseCaptureOCR
- Classe UsineCaptureOCR
- Classe BaseContrôleCapture
- Énumération UtilisationCaptureMoteur
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Non listé] Abbyy
- Notes de publication
- À propos du package d'activités Abbyy
- Compatibilité du projet
- Reconnaissance optique des caractères ABBYY (ABBYY OCR)
- Reconnaissance optique des caractères ABBYY Cloud (ABBYY Cloud OCR)
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Classer un document (Classify Document)
- Traiter le document (Process Document)
- Valider le document (Validate Document)
- Exporter le document (Export Document)
- Obtenir le champ (Get Field)
- Obtenir la table (Get Table)
- Prepare Validation Station Data
- [Non listé] Abbyy intégré
Activités Document Understanding
Keyword Based Classifier
UiPath.IntelligentOCR.Activities.DocumentClassification.KeywordBasedClassifier
Les capacités de cette activité sont les suivantes :
- Intègre un algorithme de classification de documents basé sur des mots clés, ciblant la classification des fichiers dont les titres peuvent être répétés.
- Classe un document en fonction d'un ensemble de formation donné, trouvé dans un fichier spécifié, s'il est utilisé dans l'activité Classer l'étendue du document (Classify Document Scope).
Cette activité ne peut être utilisée qu'avec les activités Classer l'étendu du document (Classify Document Scope) et Tester l'étendue des classifieurs (Train Classifiers Scope).
Module Designer
- LearningFilePath : Chemin d'accès complet au fichier contenant les données du classifieur. Ce champ prend uniquement en charge les chaînes et les variables
String
.Remarque :Un seul des paramètres ci-dessus peut être défini à la fois. Vous pouvez utiliser la chaîne LearningData ou la chaîne LearningFilePath .
LearningFilePath spécifie les emplacements à partir desquels récupérer les données du classifieur.
LearningData contient les informations réelles de ce classifieur.
Panneau propriétés
Commun
- NomAffichage (DisplayName) - Nom affiché de l'activité.
Entrée
- LearningData : La chaîne contenant les données sérialisées du classifieur. Ce champ prend uniquement en charge les chaînes et les variables
String
. - LearningFilePath : Chemin d'accès complet au fichier contenant les données du classifieur. Ce champ prend uniquement en charge les chaînes et les variables
String
.Remarque :Un seul des paramètres ci-dessus peut être défini à la fois. Vous pouvez utiliser la chaîne LearningData ou la chaîne LearningFilePath .
LearningFilePath spécifie les emplacements à partir desquels récupérer les données du classifieur.
LearningData contient les informations réelles de ce classifieur.
- Privé (Private) - Si cette option est sélectionnée, les valeurs des variables et des arguments ne sont plus enregistrées au niveau Détaillé (Verbose).
Remarque : une bonne pratique consiste à créer un fichier
.json
vide à cet emplacement, puis à utiliser son nom dans le champ CheminFichierApprentissage.
Vous pouvez configurer le classifieur basé sur les mots-clés (Keyword Based Classifier) au moment de la conception en accédant simplement à l'assistant Gérer l'apprentissage (Manage Learning) de l'activité. Le même assistant peut servir à réviser les données collectées pendant la phase d'entraînement de la classification des documents en ouvrant le même assistant avec un chemin de fichier d'apprentissage mis à jour.
Cet assistant permet de configurer et de gérer les mots-clés utilisés par cette activité pour identifier le type de document. Il a été créé pour répondre au besoin de modifier un chemin de fichier. Si un paramètre Learning Data avec une variable est utilisé à la place, il vous est demandé si vous souhaitez modifier un chemin de fichier spécifique ou abandonner cette opération.
- Ajoutez une activité Classifieur basé sur des mots-clés (Keyword Based Classifier) ou Outil d’entraînement de classifieurs basé sur les mots-clés (Keyword Based Classifier Trainer) à votre workflow.
- Configurez votre activité Classifieur basé sur des mots-clés (Keyword Based Classifier) en ajoutant le chemin d’un fichier
.json
. Prenez en compte les informations suivantes lors de la configuration du classifieur :- Si aucun chemin n’est fourni et que l’option Gérer l’apprentissage est sélectionnée, une fenêtre contextuelle s’affiche, demandant une entrée Chemin d’accès au fichier d’apprentissage. Une fois le chemin fourni, l’assistant s’ouvre.
- Une variable peut être ajoutée à la place d'un fichier
.json
, mais, comme l'assistant ne peut pas appliquer le modèle d'apprentissage à une variable LearningData, il demande un chemin de fichier spécifique qui peut être modifié.
- Sélectionnez Gérer l’apprentissage.
La fenêtre de l’assistant Gérer l’apprentissage du classifieur par mots clés s’ouvre.Image 1. Présentation de l’assistant Gérer l’apprentissage du classifieur par mots clés
- Si aucun chemin n'est fourni et que l'option Gérer l'apprentissage est sélectionnée, une fenêtre contextuelle s'affiche, demandant un CheminFichierApprentissage. Une fois le chemin fourni, l'assistant s'ouvre.
Image 2. La fenêtre contextuelle d’avertissement s’affiche si aucun chemin n’est fourni et que l’option Gérer l’apprentissage est sélectionnée
Remarque : même si aucun fichier.json
n'est disponible, vous pouvez ajouter le nom d'un nouveau fichier.json
directement dans l'activité et le fichier.json
sera automatiquement créé dans le dossier spécifié.
L'assistant contient autant de catégories de types de documents que vous avez définies dans votre taxonomie. Vous pouvez ajouter un ou plusieurs mots clés pour chaque type de document. L'activité apprend les mots-clés d'un document spécifique et est capable plus tard d'identifier et de classer le document dans une catégorie spécifique en fonction de ces règles.
""
(guillemets), et vous pouvez ajouter une ou plusieurs valeurs. Pour ajouter ou supprimer des mots-clés, procédez aux étapes suivantes dans l’assistant :
- Sélectionnez Ajouter un nouvel ensemble de mots-clés pour ajouter un champ supplémentaire à cette catégorie.
- Sélectionnez l’icône de suppression pour supprimer le champ et ses mots clés.
- Sélectionnez Enregistrer pour enregistrer la configuration de votre assistant. Vous pouvez accéder à toutes les valeurs ajoutées dans le fichier
.json
du projet.Remarque : les guillemets doubles entrés pour définir un mot-clé dans l'assistant Gérer les mots-clés (Manage Keywords) sont toujours échappés, conformément à la convention Visual Basic (guillemets doubles), même dans un projet C#.
L’activité Classifieur intelligent de mots clés (Intelligent Keyword Classifier) fait partie des Solutions Document Understanding. Consultez le document Document Understanding Guide pour plus d'informations.