Extraction et traitement intelligents (IXP) - Consommation de modèles via un workflow

ixp

latest

false

Guide de l'utilisateur des documents complexes et non structurés

Vue d'ensemble (Overview)
Construction de modèles
Validation du modèle
Déploiement du modèle
Utiliser des modèles
- Consommation de modèles via un workflow
- Consommation de modèles via l'API Document Understanding
API
- Événements d'audit d'API
Questions fréquemment posées
- Questions fréquemment posées

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Consommation de modèles via un workflow

Utiliser les prédictions du modèle IXP dans UiPath Studio en créant un workflow pour la définition de la taxonomie et le traitement des documents.

Vous pouvez consommer les prédictions d'une version publiée du modèle Documents complexes et non structurés en créant un workflow dans UiPath Studio.

Vue d'ensemble (Overview)

La création d'un workflow Documents complexes et non structurés Extraction et traitement intelligents (IXP) implique généralement les étapes suivantes :

Installation du package
Définition de la taxonomie
Numérisation des documents
Classification de document
Extraction des documents
Validation du document

Remarque :

L’étape de définition de la taxonomie s’applique uniquement aux projets Windows, et non aux projets inter-plateformes. Pour découvrir les différences entre les types de projet, consultez les sections qui suivent.

Prérequis

Vous devez avoir un modèle publié dans un projet Documents complexes et non structurés.

Lorsque vous commencez à créer votre workflow Studio, vous devez décider du type de projet que vous souhaitez exécuter : Windows ou Inter-plateformes. Chaque type de projet nécessite des packages différents.

Quel que soit le type de projet que vous choisissez, vous pouvez installer les packages :

Automatiquement - Utilisez le modèle de processus Document Understanding. Pour de plus amples détails sur la recherche et l'installation de modèles dans Studio, vérifiez Modèles de projet.
Manuellement - Pour plus de détails, consultez Installation des packages.Si vous choisissez d'installer manuellement les packages, veillez à installer les versions suivantes ou plus récentes, en fonction du type de projet :

Windows

UiPath.IntelligentOCR.Activities 6.22.0
UiPath.System.Activities 24.10.6

Multiplateforme

UiPath.DocumentUnderstanding.Activities 2.12.0
UiPath.System.Activities 24.10.6

Remarque :

Le package IntelligentOCR est compatible avec les projets Windows, et pas avec les projets inter-plateformes.
Vous pouvez créer des workflows inter-plateformes et utiliser d'autres modèles dans Studio Web.

Création d'un workflow d'extraction et de traitement intelligents (IXP) pour les projets Windows

Les sections qui suivent contiennent les étapes à appliquer si vous choisissez de ne pas utiliser l’un des modèles Studio et de commencer à zéro.

Pour créer un workflow d'extraction et de traitement intelligents (IXP) pour les projets Windows, procédez comme suit :

Remarque :

Les noms des variables utilisés dans les sections suivantes ne sont que des exemples.Vous pouvez nommer vos variables en fonction de vos propres conventions.

1. Installation des packages

Assurez-vous d’installer les packages mentionnés dans la section Conditions préalables.

2. Définition de la taxonomie

Dans Studio Desktop, créez un processus de base.
Lors de la configuration de votre processus, dans le champ Compatibilité, sélectionnez le type de workflow que vous souhaitez créer : Windows ou inter-plateformes.Pour de plus amples détails, vérifiez À propos des projets d'automatisation.
Ouvrez Taxonomy Manager depuis l’onglet Conception et configurez les champs de votre table comme suit :
- Créez un champ de table pour chaque groupe de champs dans votre taxonomie de projet Extraction et traitement intelligents (IXP).
- Ajoutez une colonne dans le champ de table respectif pour chaque champ défini dans le groupe de champs.
Remarque :
Taxonomy Manager :
- prend en charge la création de tables et de champs. Lorsque vous créez des workflows Documents complexes et non structurés Extraction et traitement intelligents (IXP), il est recommandé de créer des champs de table au lieu de simplement des champs.
- est disponible uniquement lorsque le package IntelligentOCR est installé.Cela signifie qu'il est uniquement disponible sur les projets Windows, et non sur les projets inter-plateformes.
Ensuite, vous devez avoir un emplacement à partir duquel vous pouvez lire des documents.Par exemple, dans le dossier Projet, créez un nouveau dossier nommé Documents et ajoutez quelques fichiers.
Dans la Séquence, ajoutez une activité Affecter pour spécifier l'endroit d'où vous souhaitez lire les documents.Configurez les champs suivants :
- Enregistrer dans - Créez et ajoutez une variable de type System.String[].Dans cet exemple, la variable est appelée docs.
- Valeur à enregistrer - Ajoutez Directory.GetFiles("./documents").
Ajoutez une activité Charger la toxonomie pour stocker la taxonomie configurée dans une variable pour la référencer dans le reste de l'automatisation.Créez et ajoutez une variable de type DocumentTaxonomy. Dans cet exemple, la variable est appelée taxo.

Remarque :
Vous devez mapper la variable à la sortie de l’activité.

3. Numérisation d’un document

Ajoutez une activité Pour chaque (For Each) pour parcourir chaque document. Pour l'entrée, ajoutez la variable docs que vous avez précédemment créée.
Glissez-déposez l’activité suivante dans Pour chacun :
- Numériser le document - Vous permet de lire les documents que vous avez fournis et d’obtenir la sortie du Modèle d'Object de document (DOM). Configurez les champs suivants :
  - Chemin du document - Ajoutez la variable doc. Vous pouvez trouver la variable dans le nom de l’élément que vous avez configuré dans l’activité Pour chacun. Dans cet exemple, le nom de l’élément est doc et représente le chemin de fichier du document que vous souhaitez numériser.
  - Texte du document - Créez et ajoutez la variable Text.
  - Modèle d'Object de document (DOM) - Créez et ajoutez la variable dom.

4. Classification d’un document

Dans la même activité Pour chacun, après Numériser le document, glissez et déposez l’activité suivante :

Classifier l’étendue du document - Vous permet de classifier le document en cours de traitement dans l’un des types de document définis dans votre taxonomie.Pour les entrées, ajoutez ce qui suit :
- Chemin du document (Document Path) : ajoutez la variable doc.
- Text du document - Ajoutez la variable Text.
- Modèle d’Object de document (DOM) - Ajoutez la variable dom.
- Taxonomie - Ajoutez la variable taxo. Pour les sorties, ajoutez ce qui suit :
- Résultats de la classification (Classification Results) : créez et ajoutez une nouvelle variable Résultats de la classification.

Dans l’étendue Classifier le document, ajoutez l’activité Classifieur génératif pour classifier des documents à l’aide de modèles génératifs. Configurez l’activité comme suit :

Select Manage Field Details.
In the Document Type column, select a document type.
In the Field Details column, add an optional value to define additional details about the document type. This can be a short description of the document type. The maximum number of characters allowed is 1000.
Sélectionnez Enregistrer.

Remarque :

Une activité de classification est facultative si vous n’avez qu’un seul type de document dans votre taxonomie. Vous pouvez copier l'ID de type de document et l'utiliser comme entrée dans l'activité Étendue de l'extraction des données.

5. Extraction des détails d’un document

Glissez-déposez l’activité suivante dans Pour chacun :
- Étendue de l’extraction de données - Vous permet de configurer les activités de l’extracteur. Pour les entrées, ajoutez ce qui suit :
  - Chemin du document (Document Path) : ajoutez la variable doc.
  - Texte du document - Ajoutez la variable Text.
  - Modèle d'objet de document (DOM) : ajoutez la variable dom.
  - Taxonomie - Ajoutez la variable taxo.
  - Résultat de la classification - Ajoutez la variable ClassificationResults. Pour la sortie, ajoutez ce qui suit :
  - Résultats d'extraction (Extraction Results) : créez et ajoutez une nouvelle variable Résultats d'extraction.
Dans l’étendue de l’extraction de données, ajoutez l’activité Extracteur de projet Document Understanding pour extraire les données du document.

Lorsque vous ajoutez l’activité Extracteur de projet au sein de l’étendue, la fenêtre de configuration Obtenir des fonctionnalités doit s’ouvrir automatiquement.

Si le projet publié est hébergé dans une Organization ou un locataire différent, ou est utilisé dans une configuration hybride, ajoutez les détails requis dans Obtenir des fonctionnalités comme suit :
- Créez une application externe dans la page Administration d'Automation Cloud. Pour plus d'informations, consultez la section Ajout d'une application externe.
- Copiez l'ID de l'application et le secret de l'application, où le secret de l'application est le mot de passe.
- Créez un Credential de ressource d'Orchestrator.
- Dans la fenêtre Obtenir des fonctionnalités, ajoutez les informations d’identification, l’ID de l’application et le secret.
- Configurez le reste des champs comme décrit dans l’extracteur de projet Document Understanding.
  
  Remarque :
  Lorsque vous copiez l’URL du locataire, assurez-vous qu’elle inclut les noms de l’Organization et du locataire.Par exemple, https://staging.uipath.com/communicationsminingteam/IXPTesting, où communicationsminingteam est l’Organization et IXPTesting est le locataire.
- Dans l’activité Extracteur de projet Document Understanding, ajoutez le chemin de la ressource en tant qu’entrée dans la propriété Ressource d’informations d’identification du Runtime de l’activité Extracteur de projet Document Understanding.Le chemin doit être sous la forme de <OrchestratorFolderName>/<AssetName>.
Si le workflow s’exécute dans la même Organization et le même locataire où le projet a été publié, sélectionnez le projet publié dans l’activité Extracteur de projet Document Understanding.

Remarque :
Le modèle publié apparaît dans les options déroulantes si Studio est connecté à la même Organization ou au même locataire dans lequel le modèle a été publié.Si le modèle n'apparaît pas, c'est peut-être parce qu'il est publié dans une Organization ou un locataire différent.Dans ce cas, appliquez les instructions de la section qui suit, Consommation des prédictions de projets inter-organisations, inter-locataires ou hybrides.
Sélectionnez Configurer les extracteurs et utilisez l’assistant pour mapper vos champs de taxonomie aux champs définis dans le projet Documents complexes et non structurés.Image 1. L'assistant Configurer les extracteurs de Studio

6. Validation d’un document

Vous pouvez facultativement configurer des critères de décision pour déterminer si une validation humaine est requise pour la sortie de classification.Cela peut être fait à l'aide de règles métier personnalisées ou d'une logique de post-traitement. Vous pouvez également utiliser des critères de décision personnalisés dans un workflow pour déclencher la validation ou vous pouvez configurer des seuils de confiance au niveau du champ.Ce critère de décision dépend des exigences du processus métier et de l’allocation de faux positifs de votre cas d’utilisation, c’est-à-dire des résultats qui ignorent la validation humaine, mais qui ont été extraits de manière incorrecte. En fonction de ces règles, vous pouvez contrôler si un document est automatiquement validé ou s'il est routé vers une validation humaine.Pour plus de détails, Vérifiez la section Paramètres de validation dans Établissement de la structure.

Ajoutez l’activité Présenter la Station de validation pour valider dans la Station de validation.La sortie ExtractionResults de l'activité Étendue de l'extraction de données sera l'entrée de l'activité Présenter la Station de validation.Pour l'entrée, ajoutez la variable ExtractionResults. Pour la sortie, créez et ajoutez une nouvelle variable ValidatedExtractionResults.
Pour les entrées, ajoutez ce qui suit :
- Chemin du document (Document Path) : ajoutez la variable doc.
- Texte du document - Ajoutez la variable Text.
- Modèle d'objet de document (DOM) : ajoutez la variable dom.
- Taxonomie - Ajoutez la variable taxo.
- Résultats d'extraction automatiques - Ajoutez la variable ExtractionResults.
Pour la sortie, ajoutez ce qui suit :
- Résultats d'extraction validés - Créez et ajoutez une nouvelle variable ValidatedExtractionResults.

Dans cette étape de validation, vous pouvez également utiliser d’autres activités que Présenter la Station de validation.Par exemple :

Créez des artefacts de validation ou créez une tâche d’application lorsque vous avez des Apps qui utilisent le composant Validation du contenu.
Créez une action de validation du document ou attendez l’action de validation du document et reprenez lorsque vous souhaitez envoyer la Station de validation à Action Center.

Pour plus de détails sur la validation, Vérifiez les ressources suivantes :

Station de validation
Apps
- Valider des documents avec des actions App

Déclenchement de la validation humaine

La validation humaine de la sortie de la classification est déclenchée en appliquant une logique de décision après l'étape de classification, avant que le workflow ne procède à l'extraction. La décision n'est pas automatique par défaut, elle est explicitement contrôlée via des seuils de confiance et des règles métier définis dans le workflow.

La liste suivante indique comment la validation humaine peut être déclenchée :

Évaluation de la confiance de la classification Chaque résultat de classification inclut des scores de confiance qui indiquent le degré de certitude du modèle quant au type de document prédit. Ces scores sont évalués dans le workflow pour déterminer si la classification est fiable.
Seuils de confiance Vous pouvez définir un seuil de confiance minimum pour la classification.Si le score de confiance pour le type de document prédit tombe en dessous de ce seuil, la classification est considérée comme incertaine et le document est signalé pour validation humaine.
Règles métier et logique conditionnelle En plus des seuils de confiance, vous pouvez appliquer des règles métier personnalisées telles que :
- Types de documents spécifiques qui nécessitent toujours une révision manuelle.
- Inadéquations entre les types de document attendus et prédits.
- Règles basées sur la façon dont le document sera traité ultérieurement. Par exemple, les documents qui doivent être vérifiés avant l'extraction ou l'approbation.
Déclenchement de l’étape de validation Lorsque les critères définis sont remplis, le workflow route le document vers une étape de validation humaine en invoquant l’un des mécanismes de validation :
- Présentez la Station de validation pour la validation dans le robot.
- Créez une tâche de validation pour la validation basée sur Action Center.
- Créez des artefacts de validation de document pour la validation dans Apps.
Confirmation ou correction humainePendant la validation, l'examinateur humain confirme ou corrige le type de document. Le résultat de la classification validé est ensuite utilisé par les étapes suivantes telles que l’extraction de données, garantissant que le traitement en aval est basé sur un type de document approuvé. Pour conclure, la validation humaine de la classification est déclenchée par des règles contrôlées par le workflow, généralement basées sur les scores de confiance et une logique métier, qui déterminent quand un résultat de classification nécessite une révision manuelle avant que le processus ne continue.

Interprétation des résultats de la Station de validation à partir des modèles d'extraction et de traitement intelligents (IXP)

Lorsque vous utilisez des workflows qui exploitent des modèles pour des documents complexes et non structurés d'extraction et de traitement intelligents (IXP), la Station de validation sert d'interface cruciale pour passer en revue, confirmer et affiner les données extraites. La Station de validation montre comment le modèle a interprété le document, ce qui vous permet de comprendre la précision de l'extraction, d'identifier les zones incertaines et d'apporter des corrections si nécessaire.

Dans la Station de validation, le type de document et ses champs correspondants s'affichent à côté des valeurs extraites et des indicateurs de confiance. Pour de plus amples détails sur le processus de validation, vérifiez les ressources suivantes :

Comparaison des workflows de projet Windows et inter-plateformes

La table suivante montre une comparaison entre les workflows d'extraction et de traitement intelligents (IXP) pour les projets Windows et inter-plateformes :

	Windows	Multiplateforme
Packages requis	IntelligentOCR	Document Understanding
Définition de la taxonomie	L'option Taxonomy Manager vous permet de définir la liste des champs qui s'afficheront dans la Station de validation ou qui seront inclus dans l'Object Résultats d'extraction. Remarque : Taxonomy Manager est disponible uniquement lorsque le package Intelligent OCR est installé.	Le package Document Understanding lit et affiche automatiquement les champs définis dans le schéma de modèle Extraction et traitement intelligents (IXP). Ces champs ne sont pas configurés via le workflow.

Cette page vous a-t-elle été utile ?

PrécédentCLI

SuivantConsommation de modèles via l'API Document Understanding

Vue d'ensemble (Overview)​

Prérequis​

Windows​

Multiplateforme​

Création d'un workflow d'extraction et de traitement intelligents (IXP) pour les projets Windows​

1. Installation des packages​

2. Définition de la taxonomie​

3. Numérisation d’un document​

4. Classification d’un document​

5. Extraction des détails d’un document​

6. Validation d’un document​

Déclenchement de la validation humaine​

Interprétation des résultats de la Station de validation à partir des modèles d'extraction et de traitement intelligents (IXP)​

Comparaison des workflows de projet Windows et inter-plateformes​

Cette page vous a-t-elle été utile ?

Vue d'ensemble (Overview)

Prérequis

Windows

Multiplateforme

Création d'un workflow d'extraction et de traitement intelligents (IXP) pour les projets Windows

1. Installation des packages

2. Définition de la taxonomie

3. Numérisation d’un document

4. Classification d’un document

5. Extraction des détails d’un document

6. Validation d’un document

Déclenchement de la validation humaine

Interprétation des résultats de la Station de validation à partir des modèles d'extraction et de traitement intelligents (IXP)

Comparaison des workflows de projet Windows et inter-plateformes