activities
latest
false
UiPath logo, featuring letters U and I in white
Activités Document Understanding
Last updated 14 nov. 2024

Classer un document (Classify Document)

UiPath.IntelligentOCR.StudioWeb.Activities.ClassifyDocument

Description

Vous pouvez utiliser cette activité pour classer les documents en sélectionnant un classifieur et un document que vous souhaitez classer.

Remarque : l'activité Classer un document (Classify Document) utilise des points de terminaison publics.

Les langues prises en charge pour les modèles génératifs sont les mêmes que le moteur OCR utilisé utilisé. Pour plus d'informations, consultez la page Langues prises en charge par l'OCR .

Hormis si cette activité est la première activité Document Understanding d’un workflow Studio, l’entrée doit être Données du document. Le fichier ne doit être utilisé comme entrée que si l’activité est la première activité Document Understanding dans le cadre d’un workflow Studio.

Compatibilité du projet

Windows | Multiplate-forme

Configuration

Module Designer
  • Projet (Project) : vous devez sélectionner votre projet Document Understanding dans le menu déroulant. Les options disponibles sont les suivantes :
    • Prédéfini (Predefined) : le type de projet par défaut
    • Vous pouvez créer un nouveau projet en cliquant sur l'icône +.
    Remarque : si vous avez créé plus de 500 projets sur votre locataire et que vous utilisez l'activité Classer un document (Classify Document), UiPath Studio ou Studio Web n'affichera aucun projet au-delà des 500 valeurs initiales. Par conséquent, ces projets ne peuvent pas être utilisés.
  • Classifieur (Classifier) : vous devez sélectionner votre classifieur Document Understanding dans le menu déroulant.
    Remarque : les données envoyées au classifieur génératif seront envoyées à une instance de modèle LLM qui n'est pas accessible au public, ne la quitteront pas et, une fois traitées, ne seront pas stockées ou utilisées à des fins d'entraînement.
    • Prédéfini (Predefined) : le type de projet par défaut
    • Classifieur génératif (Generative Classifier) : le type de classifieur génératif
      Important :

      Cette fonctionnalité fait actuellement partie d'un processus d'audit et ne doit pas être considérée comme faisant partie de l'autorisation FedRAMP tant que la révision n'est pas finalisée. Consultez ici la liste complète des fonctionnalités en cours de révision.

      • Invite (Prompt) : invite pour identifier les types de documents, fournis sous forme de paires clé-valeur, où la clé représente le nom du type de document et la valeur une description correspondante, ce qui aide le classifieur à identifier ces documents.
        • Type de document (Document Type) : indiquez le nom du type de document à utiliser pour le résultat de la classification (limite de 30 caractères).
        • Invite générative ( Generative invite ) : vous devez fournir l'invite en tant qu'entrée pour le classifieur génératif. Le nombre maximum de caractères autorisés est de 1 000.
  • Entrée (Input) : indiquez le fichier d'entrée ou l'objet Données du document (Document Data).
    Important : un fichier peut avoir au maximum 500 pages. Les fichiers dépassant cette limite ne pourront pas être classifiés.
    Astuce : lorsque vos fichiers ne sont pas stockés en tant que variable de type IResource, il existe une option pour effectuer une conversion. Utilisez pour cela LocalResource.FromPath(<reference_to_the_file>) dans le champ de propriété d’entrée.
    Prenons le cas d’un scénario dans lequel vous allez parcourir une liste de fichiers à l’aide d’une activité Pour chaque (For Each). Supposons que currentItem soit votre variable d’itération. Pour convertir currentItem en IResource, collez LocalResource.FromPath(currentItem) dans le champ Entrée.
Panneau propriétés

Options avancées

  • Confiance minimum (Minimum confidence) : spécifiez le seuil de confiance minimum relatif au type de document attribué au moment de la classification. Si le score de confiance d’un document est inférieur à ce seuil, le Type de document sera défini sur « inconnu ».
    Astuce : la plupart des types de documents génèrent une prédiction associée à un niveau de confiance. Cette propriété empêche les faux positifs en tenant uniquement compte des prédictions avec un niveau de confiance supérieur à certain seuil. Vous pouvez identifier un niveau de confiance optimal en testant divers documents dans votre workflow, en enregistrant les résultats dans une feuille de calcul Excel, par exemple, puis en analysant la valeur la plus adéquate pour définir un seuil.

Entrée

  • Délai d' attente (secondes) (Timeout (seconds) : délai d'exécution maximal (en secondes) pour l'appel vers le modèle génératif. Si l'opération dépasse ce délai, elle est automatiquement arrêtée pour éviter les retards ou les blocages. Cette propriété s'affiche uniquement si le classifieur génératif est sélectionné en tant que classifieur.

Sortie

  • Données du document (Document Data) : toutes les données de champ validées extraites du fichier.

Utilisation du classifieur génératif

Pour commencer rapidement à utiliser les fonctionnalités génératives de l’activité Classer un document (Classify Document), procédez aux étapes suivantes :

  1. Ajouter une activité Classifier un document (Classify Document)
  2. Dans la liste déroulante Projet (Project) , sélectionnez Prédéfini(Predefined).
  3. Pour Classifieur(Classifier), sélectionnez Classifieur génératif ( Generative Classifier).

    La propriété Invite (Prompt) apparaît dans le corps de l'activité.

  4. Dans le champ Invite (Prompt), indiquez vos instructions sous forme de paires clé-valeur de dictionnaire, où :
    • La clé représente le type de document (exemple : CV).
    • La valeur représente l' invite générative: la description utilisée par le classifieur génératif pour identifier les types de documents.

      Par exemple, consultez la table suivante pour un exemple de paires clé-valeur :

      Tableau 1. Paires clé-valeur utilisées comme invite pour le classifieur génératif
      Document typeInvite générative
      CV« Trouvez des mots-clés de CV courants tels que "Formation", "Compétences" et "Expérience". »
      Facture« Trouvez des noms de champs courants tels que « Numéro de facture », « Facturation à » ou « Montant total ». »
    Image 1. Paires clé-valeur utilisées en tant qu’invite pour l’extracteur génératif

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.