document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white

Guide de l'utilisateur de Document Understanding

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Dernière mise à jour 18 déc. 2024

Intelligent Keyword Classifier

Qu'est-ce que le classificateur intelligent de mots clés

Le classifieur de mots-clés intelligents est un classifieur qui utilise le vecteur de mots qu'il apprend à partir de fichiers de certains types de documents en vue d'effectuer une classification de documents.

L'algorithme a été élaboré autour du concept de répétition du contenu du même type de document et part du principe que les types de documents ont une série de mots qui y apparaissent généralement, permettant ainsi le calcul de similarité vectorielle.

Lors de la classification d'un fichier dans un type de document, le classifieur de mots-clés intelligents (Intelligent Keyword Classifier) :

  • trouve le vecteur de mot le plus proche d'un fichier,
  • des rapports sur le type de document ayant obtenu le score le plus élevé, avec les principaux mots correspondants sous-jacents.

Le classifieur de mots-clés intelligents a également des capacités de division de fichiers, ce qui signifie qu'il peut signaler plus d'une classe pour un fichier donné et pour des plages de pages distinctes.

Remarque : contrairement au classifieur qui s’appuie sur des mots clés, vous n’avez pas besoin de sélectionner manuellement les références dans le document lors de l’apprentissage du classifieur intelligent de mots clés et toutes les références de ce type fournies au moment de l’apprentissage seront ignorées.

Quand l'utiliser

Nous vous conseillons d'utiliser ce classifieur si :

  • vos fichiers contiennent un ou plusieurs types de documents dans un seul fichier
  • vos types de documents sont relativement faciles à différencier au regard du contenu.
Remarque : à partir de la version 6.9.0, les performances de fractionnement de l’activité Classifieur de mots clés intelligent (Intelligent Keyword Classifier) ont été améliorées. Pour des performances de fractionnement optimisées, utilisez la version 6.9.0 ou une version ultérieure.

Exigences spécifiques

You need to use your Automation CloudTM Document UnderstandingTM API Key, or host your own instance of the Intelligent Keyword Classifier in AI Center on-prem, to use this classifier.

Comment entraîner

Nous ne pouvons pas appliquer la cohérence des fichiers d'entraînement entre les entraînements parallèles au niveau de l'activité. Deux solutions possibles à ce problème sont fournies par un Processus de Document Understanding (Document Understanding Process). Les deux consistent en un contrôle du trafic :

  1. verrouillage des fichiers (implémenté par défaut dans le processus) : renommez le fichier en utilisant l'extension .lock, modifiez et enregistrez le fichier, puis renommez le fichier en supprimant l'extension .lock
  2. configuration manuelle d'une file d'attente spéciale : créez une file d'attente vide dans Orchestrator et intégrez vos deux activités du projet.

Pour plus d'informations sur l'entraînement d'un classifieur, consultez cette page qui décrit le processus d'utilisation de l'assistant Gérer l'apprentissage (Manage Learning wizard).

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.