activities
latest
false
UiPath logo, featuring letters U and I in white

Activités Document Understanding

Dernière mise à jour 5 déc. 2024

Classify Document Scope

UiPath.IntelligentOCR.Activities.DocumentClassification.ClassifyDocumentScope

Description

Fournit une étendue des activités de classifieurs, offrant tous les fichiers nécessaires à la classification des documents. Accepte au moins un classifieur et des courtiers entre eux. Cela garantit la transmission de tous les paramètres aux activités de classification enfant.

Compatibilité du projet

Windows - Héritage | Windows

Configuration

Panneau propriétés

Commun

  • NomAffichage (DisplayName) - Nom affiché de l'activité.

Entrée

  • ModèleObjetDocument (DocumentObjectModel) : le modèle d'objet de document (DOM) que vous souhaitez utiliser pour valider le document. Ce modèle est stocké dans une variable Document et peut être récupéré à partir de l'activité Numériser le document (Digitize Document). Consultez la page Numériser le document pour apprendre à utiliser l'activité. Ce champ ne prend en charge que les variables Document.
  • DocumentPath (DocumentPath) - Chemin d'accès au document que vous souhaitez valider. Ce champ prend uniquement en charge les chaînes et les variables String.
    Remarque : les types de fichiers pris en charge pour ce champ de propriété sont les suivants : .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp et .pdf.
  • TexteDocument (DocumentText) : le texte du document lui-même, stocké dans une variable String. Vous pouvez récupérer cette valeur à partir de l'activité Numériser le document (Digitize Document). Consultez la page Numériser le document pour apprendre à utiliser l'activité. Ce champ ne prend en charge que les chaînes et les variables String.
  • Taxonomie - La taxonomie par rapport à laquelle le document doit être traité, stockée dans une variable DocumentTaxonomy. Ce champ prend uniquement en charge les variables DocumentTaxonomy.

Divers

  • Privé (Private) - Si cette option est sélectionnée, les valeurs des variables et des arguments ne sont plus enregistrées au niveau Détaillé (Verbose).
Sortie
  • ClassificationResults : les résultats de l'exécution des fichiers du classifieur sur le fichier spécifié, stockés dans un objet IReadOnlyList<ClassificationResult>. Ce champ prend uniquement en charge les variables IReadOnlyList<ClassificationResult>.

L’objet RésultatClassification (ClassificationResult) contient les informations suivantes :

  • IDTypeDocument : l'ID correspondant au type de document correspondant depuis la taxonomie.
  • DocumentId : nom de fichier du document traité.
  • ContentType : type de contenu inclus dans le document traité.
  • Confiance (Confidence) : confiance de la classification, affichée sous la forme d'une valeur numérique entre 0 et 1.
  • ConfianceOCR (OcrConfidence) : confiance d'OCR pour les caractères qui font partie de la référence indiquée, affichée sous la forme d'une valeur numérique entre 0 et 1.
  • Référence : preuves de la classification, dans la version textuelle du document (via TextStartIndex et TextLength), et dans le Modèle d'objet document (Document Object Model) (via Tokens et les zones de surbrillance pour chaque page à partir de laquelle les preuves sont sélectionnées).
  • DocumentBounds : informations sur la partie du document à laquelle se rapporte le document, avec StartPage (Int32, basé sur 0), PageCount (Int32), TextStartIndex (Int32, basé sur 0), TextLength (Int32).
  • ClassifierName : rempli automatiquement par l'activité Classify Document Scope avec le nom complet du classifieur indiquant l'élément ClassificationResult actuel.

    Remarque : tout le contenu de ClassificationResults est trié par ordre croissant par score de confiance, impliquant que celui en haut a la confiance la plus élevée.

Utilisation de l'assistant Configurer les classifieurs

L' assistant Configurer les classifieurs (Configure Classifiers) vous permet de configurer la façon dont les classifieurs sont appliqués à chaque type de document, et quels résultats sont acceptables.

Suivez les étapes ci-dessous pour configurer l'assistant :

  1. Ajoutez une activité Classifier la portée du document (Classify Document Scope) à votre workflow.
  2. Ajoutez une ou plusieurs activités de classifieur dans l'activité Classer l'étendue du document (Classify Document Scope).
    1. Nommez vos classifieurs de façon pertinente.
    2. Classez les classifieurs dans l'étendue, de gauche à droite, dans l'ordre de priorité d'acceptation.
    3. Configurez vos classifieurs en sélectionnant Configurer les classifieurs (Configure Classifiers).
      Vous pouvez maintenant voir l'assistant
      Image 1. Présentation de l’assistant de configuration des classifieurs

  3. Sélectionnez les cases à cocher des paires de classifieur et du type de document que vous souhaitez activer. Vous pouvez laisser un type de document de classifieur non coché dans l’une des situations suivantes :
    • Le classifieur n’est pas entraîné ou configuré pour identifier ce type de document spécifique.
    • Le classifieur ne fonctionne pas comme prévu pour ce type de document spécifique, et si de tels résultats sont renvoyés par le classifieur, ils doivent être ignorés.
  4. Si un classifieur a sa propre taxonomie, utilisez les zones de texte à côté de chaque case à cocher pour définir le mappage de taxonomie correct entre les deux taxonomies. Par exemple, si le classifieur 1 a été configuré pour renvoyer la classe INV pour une facture, mais que votre taxonomie de projet contient un type de document appelé "Incoming Invoice", alors la case correspondant à "Incoming Invoice" et ce classifieur 1 doit contenir la chaîne INV.
  5. Définissez un seuil de confiance minimum de 0 à 100 pour chaque classifieur dans l’activité Classer l’étendue du document (Classify Document Scope). Tout résultat de classification avec un niveau de confiance inférieur à ce seuil ne sera pas stocké dans la sortie de l’activité Classer l’étendue du document (Classify Document Scope).
    Astuce : la plupart des types de documents génèrent une prédiction associée à un niveau de confiance. Cette propriété empêche les faux positifs en tenant uniquement compte des prédictions avec un niveau de confiance supérieur au seuil. Vous pouvez identifier un niveau de confiance optimal en testant divers documents dans votre workflow, en enregistrant les résultats dans une feuille de calcul Excel, par exemple, puis en analysant la valeur la plus adéquate pour définir un seuil. Appliquez le seuil en ajustant la propriété Confiance minimum (Minimum Confidence) dans votre étendue actuelle.
  6. Sélectionnez Enregistrer (Save) une fois tous les classifieurs configurés.
    Image 2. L’assistant Configurer les classifieurs (Configure Classifiers) est configuré pour utiliser un classifieur différent pour chaque type de document.

Intégration de Document Understanding

L'activité Classify Document Scope fait partie des Document Understanding Solutions. Consultez le document Document Understanding Guide pour plus d'informations.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.