- Vue d'ensemble (Overview)
- Document Processing Contracts
- Notes de publication
- À propos des contrats de traitement de documents
- Classe Zone
- Interface ActivitéIPersisted
- Classe PrettyBoxConverter
- Interface ActivitéIClassifier
- Interface FournisseurIClassifieurCapacités
- Classe TypeDocumentClassifieur
- Classe RésultatClassifieur
- Classe ActivitéCodeClassifieur
- Classe ActivitéClassifieurNatif
- Classe ActivitéClassifieurCodeAsync
- Classe CapacitéClassifieurTypeDocument
- Classe ActivitéExtracteurCodeAsync
- Classe ActivitéExtracteurCode
- Classe ExtracteurTypeDocument
- Classe ExtracteurDocumentTypeCapacités
- Classe ExtracteurChampCapacités
- Classe ActivitéExtracteurNatif
- Classe ExtracteurRésultat
- Interface FournisseurICapabilities
- Interface ActivitéIExtractor
- Classe ChargeUtileExtracteur
- Énumération PrioritéActionDocument
- Classe DocumentActionData
- Énumération StatutActionDocument
- Énumération TypeActionDocument
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe DonnéesUtilisateur
- Classe Documents
- Classe RésultatDivisionDocument
- Classe ExtensionDom
- Classe Page
- Classe SectionPage
- Classe Polygone
- Classe ConvertisseurPolygones
- Classe de métadonnées
- Classe GroupeMot
- Classe Mot
- Énumération SourceTraitement
- Classe CelluleRésultatsTable
- Classe ValeurTableRésultats
- Classe InformationsColonnesTableRésultats
- Classe TableRésultats
- Énumération Rotation
- Énumération TypeSection
- Énumération TypeGroupeMot
- ProjectionTexteIDocument Interface
- Classe RésultatClassification
- Classe RésultatExtraction
- Classe ResultatsDocument
- Classe ResultatsLimitesDocument
- Classe ResultatsDonnéesPoint
- Classe RésultatsValeur
- Classe ResultatsContenuRéference
- Classe ResultatsValeurJetons
- Classe ResultatsChampDérivé
- Énumération ResultatsSourceDonnées
- Classe ResultatsConstantes
- Classe ChampValeurSimple
- Classe ValeurChampTable
- Classe GroupeDocument
- Classe DocumentTaxonomie
- Classe TypeDocument
- Classe Champ
- Énumération TypeChamp
- Classe InfoLangage
- Classe SaisieMétadonnées
- Énumération TypeTexte
- Classe TypeFieldTypeField Class
- Interface ActivitéISuivi
- ITrainableActivity Interface
- Interface ActivitéClassifieurITrainable
- Interface ActivitéExtracteurITrainable
- Classe ActivitéFormationClassifieurCodeAsync
- Classe ActivitéFormationClassifieurCode
- Classe ActivitéFormationClassifieurNatif
- Classe ActivitéFormationExtracteurCodeAsync
- Classe ActivitéFormationExtracteurCode
- Classe ActivitéFormationExtracteurNative
- Numériseur de Document Understanding
- Document Understanding ML
- Serveur local OCR Document Understanding
- Document Understanding
- Notes de publication
- À propos du package d’activités Document Understanding
- Compatibilité du projet
- Définir le mot de passe du PDF
- Merge PDFs
- Get PDF Page Count
- Extraire le texte PDF (Extract PDF Text)
- Extract PDF Images
- Extract PDF Page Range
- Extraire les données du document
- Create Validation Task and Wait
- Attendre la tâche de validation et reprendre
- Create Validation Task
- Classer un document (Classify Document)
- Créer une tâche de validation de classification (Create Classification Validation Task)
- Créer une tâche de validation de classification et attendre (Create Classification Validation Task and Wait)
- Attendre la tâche de validation de la classification et reprendre
- IntelligentOCR
- Notes de publication
- À propos du package d'activités IntelligentOCR
- Compatibilité du projet
- Configuration de l'authentification
- Load Taxonomy
- Digitize Document
- Classify Document Scope
- Keyword Based Classifier
- Classifieur de projet Document Understanding (Document Understanding Project Classifier)
- Intelligent Keyword Classifier
- Create Document Classification Action
- Attendre l'action de classification du document et reprendre
- Tester l'étendue des classifieurs
- Outil d'entraînement de classifieur basé sur des mots-clés
- Intelligent Keyword Classifier Trainer
- Data Extraction Scope
- Extracteur de projet Document Understanding (Document Understanding Project Extractor)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Tester l'étendue des extracteurs
- Export Extraction Results
- Services ML
- OCR
- Contrats OCR
- Notes de publication
- À propos des contrats OCR
- Compatibilité du projet
- Interface ActivitéIOCR
- Classe OCRCodeAsync
- Classe ActivitéCodeOCR
- Classe ActivitéOCRNatif
- Classe Caractère
- Classe RésultatOCR
- Classe Mot
- Énumération StylesPolice
- Énumération RotationOCR
- Classe OCRCapabilities
- Classe BaseCaptureOCR
- Classe UsineCaptureOCR
- Classe BaseContrôleCapture
- Énumération UtilisationCaptureMoteur
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Non listé] Abbyy
- Notes de publication
- À propos du package d'activités Abbyy
- Compatibilité du projet
- Reconnaissance optique des caractères ABBYY (ABBYY OCR)
- Reconnaissance optique des caractères ABBYY Cloud (ABBYY Cloud OCR)
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Classer un document (Classify Document)
- Traiter le document (Process Document)
- Valider le document (Validate Document)
- Exporter le document (Export Document)
- Obtenir le champ (Get Field)
- Obtenir la table (Get Table)
- Prepare Validation Station Data
- [Non listé] Abbyy intégré
Activités Document Understanding
Classify Document Scope
UiPath.IntelligentOCR.Activities.DocumentClassification.ClassifyDocumentScope
Fournit une étendue des activités de classifieurs, offrant tous les fichiers nécessaires à la classification des documents. Accepte au moins un classifieur et des courtiers entre eux. Cela garantit la transmission de tous les paramètres aux activités de classification enfant.
Panneau propriétés
Commun
- NomAffichage (DisplayName) - Nom affiché de l'activité.
Entrée
- ModèleObjetDocument (DocumentObjectModel) : le modèle d'objet de document (DOM) que vous souhaitez utiliser pour valider le document. Ce modèle est stocké dans une variable
Document
et peut être récupéré à partir de l'activité Numériser le document (Digitize Document). Consultez la page Numériser le document pour apprendre à utiliser l'activité. Ce champ ne prend en charge que les variablesDocument
. - DocumentPath (DocumentPath) - Chemin d'accès au document que vous souhaitez valider. Ce champ prend uniquement en charge les chaînes et les variables
String
.Remarque : les types de fichiers pris en charge pour ce champ de propriété sont les suivants :.png
,.gif
,.jpe
,.jpg
,.jpeg
,.tiff
,.tif
,.bmp
et.pdf
. - TexteDocument (DocumentText) : le texte du document lui-même, stocké dans une variable
String
. Vous pouvez récupérer cette valeur à partir de l'activité Numériser le document (Digitize Document). Consultez la page Numériser le document pour apprendre à utiliser l'activité. Ce champ ne prend en charge que les chaînes et les variablesString
. - Taxonomie - La taxonomie par rapport à laquelle le document doit être traité, stockée dans une variable
DocumentTaxonomy
. Ce champ prend uniquement en charge les variablesDocumentTaxonomy
.
Divers
- Privé (Private) - Si cette option est sélectionnée, les valeurs des variables et des arguments ne sont plus enregistrées au niveau Détaillé (Verbose).
Sortie
- ClassificationResults : les résultats de l'exécution des fichiers du classifieur sur le fichier spécifié, stockés dans un objet
IReadOnlyList<ClassificationResult>
. Ce champ prend uniquement en charge les variablesIReadOnlyList<ClassificationResult>
.
L’objet RésultatClassification (ClassificationResult) contient les informations suivantes :
- IDTypeDocument : l'ID correspondant au type de document correspondant depuis la taxonomie.
- DocumentId : nom de fichier du document traité.
- ContentType : type de contenu inclus dans le document traité.
- Confiance (Confidence) : confiance de la classification, affichée sous la forme d'une valeur numérique entre
0
et1
. - ConfianceOCR (OcrConfidence) : confiance d'OCR pour les caractères qui font partie de la référence indiquée, affichée sous la forme d'une valeur numérique entre
0
et1
. - Référence : preuves de la classification, dans la version textuelle du document (via
TextStartIndex
etTextLength
), et dans le Modèle d'objet document (Document Object Model) (viaTokens
et les zones de surbrillance pour chaque page à partir de laquelle les preuves sont sélectionnées). - DocumentBounds : informations sur la partie du document à laquelle se rapporte le document, avec
StartPage
(Int32
, basé sur 0),PageCount
(Int32
),TextStartIndex
(Int32
, basé sur 0),TextLength
(Int32
). -
ClassifierName : rempli automatiquement par l'activité Classify Document Scope avec le nom complet du classifieur indiquant l'élément ClassificationResult actuel.
Remarque : tout le contenu deClassificationResults
est trié par ordre croissant par score de confiance, impliquant que celui en haut a la confiance la plus élevée.
L' assistant Configurer les classifieurs (Configure Classifiers) vous permet de configurer la façon dont les classifieurs sont appliqués à chaque type de document, et quels résultats sont acceptables.
Suivez les étapes ci-dessous pour configurer l'assistant :
- Ajoutez une activité Classifier la portée du document (Classify Document Scope) à votre workflow.
- Ajoutez une ou plusieurs activités de classifieur dans l'activité Classer l'étendue du document (Classify Document Scope).
- Nommez vos classifieurs de façon pertinente.
- Classez les classifieurs dans l'étendue, de gauche à droite, dans l'ordre de priorité d'acceptation.
- Configurez vos classifieurs en sélectionnant Configurer les classifieurs (Configure Classifiers).
Vous pouvez maintenant voir l'assistantImage 1. Présentation de l’assistant de configuration des classifieurs
- Sélectionnez les cases à cocher des paires de classifieur et du type de document que vous souhaitez activer. Vous pouvez laisser un type de document de classifieur non coché dans l’une des situations suivantes :
- Le classifieur n’est pas entraîné ou configuré pour identifier ce type de document spécifique.
- Le classifieur ne fonctionne pas comme prévu pour ce type de document spécifique, et si de tels résultats sont renvoyés par le classifieur, ils doivent être ignorés.
- Si un classifieur a sa propre taxonomie, utilisez les zones de texte à côté de chaque case à cocher pour définir le mappage de taxonomie correct entre les deux taxonomies. Par exemple, si le classifieur 1 a été configuré pour renvoyer la classe
INV
pour une facture, mais que votre taxonomie de projet contient un type de document appelé "Incoming Invoice", alors la case correspondant à "Incoming Invoice" et ce classifieur 1 doit contenir la chaîneINV
. - Définissez un seuil de confiance minimum de 0 à 100 pour chaque classifieur dans l’activité Classer l’étendue du document (Classify Document Scope). Tout résultat de classification avec un niveau de confiance inférieur à ce seuil ne sera pas stocké dans la sortie de l’activité Classer l’étendue du document (Classify Document Scope).
Astuce : la plupart des types de documents génèrent une prédiction associée à un niveau de confiance. Cette propriété empêche les faux positifs en tenant uniquement compte des prédictions avec un niveau de confiance supérieur au seuil. Vous pouvez identifier un niveau de confiance optimal en testant divers documents dans votre workflow, en enregistrant les résultats dans une feuille de calcul Excel, par exemple, puis en analysant la valeur la plus adéquate pour définir un seuil. Appliquez le seuil en ajustant la propriété Confiance minimum (Minimum Confidence) dans votre étendue actuelle.
- Sélectionnez Enregistrer (Save) une fois tous les classifieurs configurés.
Image 2. L’assistant Configurer les classifieurs (Configure Classifiers) est configuré pour utiliser un classifieur différent pour chaque type de document.