ixp
latest
false
  • Vue d'ensemble (Overview)
    • Introduction
    • Extraire des données de documents non structurés
    • Créer et déployer des modèles
    • Quotas
  • Construction de modèles
  • Validation du modèle
  • Déploiement du modèle
    • Vue d'ensemble (Overview)
    • Publier des versions de modèles
    • Gérer les versions publiées
    • Créer et consommer un workflow
    • CLI
  • API
  • Questions fréquemment posées
Important :
La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.
UiPath logo, featuring letters U and I in white

Guide de l'utilisateur des documents complexes et non structurés

Dernière mise à jour 5 mars 2026

Créer et consommer un workflow

Vous pouvez consommer les prédictions d'une version publiée du modèle Documents complexes et non structurés en créant un workflow dans UiPath Studio.

Vue d'ensemble (Overview)

La création d'un workflow Documents complexes et non structurés Extraction et traitement intelligents (IXP) implique généralement les étapes suivantes :

  1. Installation du package
  2. Définition de la taxonomie
  3. Numérisation des documents
  4. Classification de document
  5. Extraction des documents
  6. Validation du document
Remarque :

L'étape de définition de la taxonomie s'applique uniquement aux projets Windows, pas aux projets multiplate-forme. Pour connaître les différences entre les types de projets, consultez les sections qui suivent.

Prérequis

Vous devez avoir un modèle publié dans un projet Documents non structurés et complexes .

Lorsque vous commencez à créer votre workflow Studio, vous devez décider quel type de projet vous souhaitez exécuter : Windows ou Multiplate-forme. Chaque type de projet nécessite des packages différents.

Quel que soit le type de projet que vous choisissez, vous pouvez installer les packages :

Windows

  • UiPath.IntelligentOCR.Activities 6.22.0
  • UiPath.System.Activities 24.10.6

Multiplateforme

  • UiPath.DocumentUnderstanding.Activities 2.12.0
  • UiPath.System.Activities 24.10.6
Remarque :
  • Le package IntelligentOCR est compatible avec les projets Windows, pas avec les projets multiplateformes.
  • Vous pouvez créer des workflows inter-plateformes et utiliser d'autres modèles dans Studio Web.

Création d'un workflow d'extraction et de traitement intelligents (IXP) pour les projets Windows

Les sections qui suivent contiennent les étapes à appliquer si vous choisissez de ne pas utiliser l'un des modèles Studio et partez de zéro.

Pour créer un workflow d'extraction et de traitement intelligents (IXP) pour les projets Windows, procédez comme suit :

Remarque :

Les noms de variables utilisés dans les sections suivantes ne sont que des exemples. Vous pouvez nommer vos variables en fonction de vos propres conventions.

1. Installation des packages

Assurez-vous d'installer les packages mentionnés dans la section Prérequis.

2. Définir la taxonomie

  1. Dans Studio Desktop, créez un processus de base.

  2. Lors de la configuration de votre processus, dans le champ Compatibilité, sélectionnez le type de workflow que vous souhaitez créer : Windows ou inter-plateformes.Pour de plus amples détails, vérifiez À propos des projets d'automatisation.

  3. Ouvrez Taxonomy Manager à partir de l'onglet Conception et configurez vos champs de table comme suit :

    • Créez un champ de table pour chaque groupe de champs dans votre taxonomie de projet Extraction et traitement intelligents (IXP).
    • Ajoutez une colonne dans le champ de table respectif pour chaque champ défini dans le groupe de champs.
    Remarque :

    Taxonomy Manager:

    • prend en charge la création de tables et de champs. Lorsque vous créez des workflows Documents complexes et non structurés Extraction et traitement intelligents (IXP), il est recommandé de créer des champs de table au lieu de simplement des champs.
    • est disponible uniquement lorsque le package IntelligentOCR est installé.Cela signifie qu'il est uniquement disponible sur les projets Windows, et non sur les projets inter-plateformes.
  4. Ensuite, vous devez avoir un emplacement à partir duquel vous pourrez lire les documents. Par exemple, dans le dossier du projet, créez un nouveau dossier nommé documents, et ajoutez quelques fichiers.

  5. Dans la séquence, ajoutez une activité Attribuer pour spécifier l’endroit à partir duquel vous souhaitez lire les documents. Configurez les champs suivants :

    • Enregistrer dans : créez et ajoutez une variable de type System.String[]. Dans cet exemple, la variable est appelée docs.
    • Valeur à enregistrer : ajoutez Directory.GetFiles("./documents").

    L'activité Affecter.

  6. Ajoutez une activité Charger la taxonomie pour stocker la taxonomie configurée dans une variable afin de la référencer dans le reste de l'automatisation. Créez et ajoutez une variable de type DocumentTaxonomie. Dans cet exemple, la variable est appelée taxo.

    Remarque :

    Vous devez mapper la variable à la sortie de l'activité.

    L'activité Charger la taxonomie.

3. Numériser un document

  1. Ajoutez une activité Pour chaque (For Each) pour parcourir chaque document. Pour l'entrée, ajoutez la variable docs que vous avez précédemment créée.

    L'activité Pour chaque (For Each).

  2. Glissez-déposez l'activité suivante à l'intérieur de l'activité Pour chaque:

    • Numériser le document : vous permet de lire les documents que vous avez fournis et d’obtenir la sortie DOM . Configurez les champs suivants :
      • Chemin du document : ajoutez la variable doc . Vous pouvez trouver la variable dans le Nom de l'élément que vous avez configuré dans l'activité Pour chaque . Dans cet exemple, le nom de l'élément est doc et représente le chemin d'accès au fichier du document à numériser.

      • Texte du document : créez et ajoutez la variable de type texte .

      • Modèle d'objet de document (DOM) : créez et ajoutez la variable om .

        L'activité Numériser le document.

4. Classer un document

Dans la même activité Pour chaque , après Numériser le document, faites glisser et déposez l'activité suivante :

  • Classer l'étendue du document - Permet de classer le document en cours de traitement dans l'un des types de documents définis dans votre taxonomie. Pour les entrées, ajoutez les éléments suivants :
    • Chemin du document : ajoutez la variable doc .

    • Texte du document : ajoutez la variable de type texte .

    • Modèle d'objet de document (DOM) : ajoutez la variable om .

    • Taxonomie : ajoutez la variable de taxonomie. Pour les sorties, ajoutez les éléments suivants :

    • Résultats de la classification : créez et ajoutez une nouvelle variable RésultatsClassification.

      L'activité Classifier l'étendue du document.

Dans Classer l'étendue du document, ajoutez l'activité Classifieur génératif pour classer les documents à l'aide de modèles génératifs. Configurez l'activité comme suit : 1. Sélectionnez Gérer les détails du champ. 2. Dans la colonne Type de document , sélectionnez un type de document. 3. Dans la colonne Détails du champ , ajoutez une valeur facultative pour définir des détails supplémentaires sur le type de document. Il peut s'agir d'une brève description du type de document. Le nombre maximum de caractères autorisés est de 1 000. 4. Sélectionnez Enregistrer.

L’activité Classifieur génératif.

Remarque :

Une activité de classification est facultative si vous ne disposez que d'un seul type de document dans votre taxonomie. Vous pouvez copier l' ID de type de document et l'utiliser comme entrée de l'activité Étendue de l'extraction de données .

5. Extraire les détails d’un document

  1. Glissez-déposez l'activité suivante à l'intérieur de l'activité Pour chaque:

    • Étendue de l'extraction de données : permet de configurer les activités de l'extracteur. Pour les entrées, ajoutez les éléments suivants :
      • Chemin du document : ajoutez la variable doc .
      • Texte du document : ajoutez la variable de texte .
      • Modèle d'objet de document (DOM) : ajoutez la variable om .
      • Taxonomie : ajoutez la variable de taxonomie .
      • Résultat de la classification : ajoutez la variable ClassificationResults. Pour la sortie, ajoutez les éléments suivants :
      • Résultats de l'extraction : créez et ajoutez une nouvelle variable ExtractionResults.
  2. Dans les champs Étendue de l'extraction de données, ajoutez l'activité Extracteur de projet Document Understanding pour extraire les données du document.

    L'activité Étendue de l'extraction des données.

Lorsque vous ajoutez l'activité d'extraction de projet à l'intérieur de l'étendue, la fenêtre de configuration Obtenir des capacités s'ouvre automatiquement.

L’assistant Obtenir des capacités dans Studio.

  1. Si le projet publié est hébergé dans une organisation ou un locataire différent, ou est utilisé dans une configuration hybride, ajoutez les détails requis dans Obtenir des capacités comme suit :

    • Créez une application externe dans la page Administration d'Automation Cloud. Pour plus d'informations, consultez la section Ajout d'une application externe.

    • Copiez l'ID de l'application et le secret de l'application, où le secret de l'application est le mot de passe.

    • Dans la fenêtre Obtenir des capacités , ajoutez les informations d'identification, l'ID d'application et la clé secrète.

    • Configurez le reste des champs comme décrit dans Extracteur de projet Document Understanding ).

      Cette image montre la fenêtre Obtenir des fonctionnalités dans Studio.

      Remarque :

      Lorsque vous copiez l'URL du locataire, assurez-vous qu'elle inclut les noms de l'organisation et du locataire. Par exemple https://staging.uipath.com/communicationsminingteam/IXPTesting, où communicationsminingteam est l'organisation, et IXPTesting est le locataire.

    • Dans l’activité Extracteur de projet Document Understanding , ajoutez le chemin de la ressource en tant qu’entrée dans la propriété Ressource d’informations d’identification de runtime de l’activité Extracteur de projet Document Understanding . Le chemin d'accès doit être sous la forme de <OrchestratorFolderName>/<AssetName>.

    La propriété Informations d’identification du runtime de l’Extracteur de projet Document Understanding.

  2. Si le workflow s’exécute dans la même organisation et le même locataire où le projet a été publié, sélectionnez le projet publié dans l’activité Extracteur de projet Document Understanding .

    Remarque :

    Le modèle publié apparaît dans les options déroulantes si Studio est connecté à la même organisation ou au même locataire que celui dans lequel le modèle a été publié. Si le modèle n'apparaît pas, cela peut être dû au fait qu'il a été publié dans une autre organisation ou un autre locataire. Dans ce cas, appliquez les instructions de la section qui suit, Utiliser des prédictions à partir de projets inter-organisations, entre locataires ou hybrides.

  3. Sélectionnez Configurer les extracteurs et utilisez l’assistant pour mapper vos champs de taxonomie aux champs définis dans le projet Documents non structurés et complexes. Figure 1. L’assistant de configuration des extracteurs de Studio

    L'image montre la fenêtre Configurer les extracteurs dans Studio.

6. Valider un document

Vous pouvez éventuellement configurer des critères de décision pour déterminer si une validation humaine est requise pour la sortie de la classification. Cela peut être fait à l'aide de règles métier personnalisées ou d'une logique de post-traitement. Vous pouvez également utiliser des critères de décision personnalisés dans un workflow pour déclencher la validation, ou vous pouvez configurer des seuils de confiance au niveau du champ. Ce critère de décision dépend des exigences du processus métier et de l'autorisation de votre cas d'utilisation pour les faux positifs, c'est-à-dire des résultats qui ignorent la validation humaine mais qui ont été extraits de manière incorrecte. Selon ces règles, vous pouvez contrôler si un document est automatiquement validé ou est transmis à une validation humaine. Pour plus de détails, consultez la section Paramètres de validation dans Mise en place de la structure.

  1. Ajoutez l’activité Présenter la station de validation pour valider dans la station de validation. La sortie ExtractionResults de l'activité Étendue de l'extraction de données sera l'entrée de l'activité Présenter la station de validation . Pour l’entrée, ajoutez la variable ExtractionResults . Pour la sortie, créez et ajoutez une nouvelle variable ValidatedExtractionResults.

  2. Pour les entrées, ajoutez ce qui suit :

    • Chemin du document : ajoutez la variable doc .
    • Texte du document : ajoutez la variable de texte .
    • Modèle d'objet de document (DOM) : ajoutez la variable om .
    • Taxonomie : ajoutez la variable de taxonomie .
    • Résultats de l'extraction automatique : ajoutez la variable ExtractionResults .
  3. Pour la sortie, ajoutez ce qui suit :

    • Résultats de l'extraction validés – Créez et ajoutez une nouvelle variable ValidatedExtractionResults.

    L'activité Station de validation actuelle. L'activité Station de validation actuelle.

Dans cette étape de validation, vous pouvez également utiliser d'autres activités que Présenter la station de validation. Par exemple :

Pour plus de détails sur la validation, consultez les ressources suivantes :

Déclenchement de la validation humaine

La validation humaine de la sortie de la classification est déclenchée en appliquant une logique de décision après l'étape de classification, avant que le workflow ne procède à l'extraction. La décision n'est pas automatique par défaut, elle est explicitement contrôlée via des seuils de confiance et des règles métier définis dans le workflow.

La liste suivante indique comment la validation humaine peut être déclenchée :

  1. Évaluation de la confiance de la classification Chaque résultat de classification comprend des scores de confiance qui indiquent le degré de confiance du modèle concernant le type de document prévu. Ces scores sont évalués dans le workflow pour déterminer si la classification est fiable.
  2. Seuils de confianceVous pouvez définir un seuil de confiance minimum pour la classification. Si le score de confiance du type de document prévu est inférieur à ce seuil, la classification sera considérée comme incertaine et le document sera marqué pour une validation humaine.
  3. Règles métier et logique conditionnelle Outre les seuils de confiance, vous pouvez appliquer des règles métier personnalisées, telles que :
    • Types de documents spécifiques qui nécessitent toujours une révision manuelle.
    • Inadéquations entre les types de document attendus et prédits.
    • Règles basées sur la façon dont le document sera traité ultérieurement. Par exemple, les documents qui doivent être vérifiés avant l'extraction ou l'approbation.
  4. Déclenchement de l'étape de validation Lorsque les critères définis sont remplis, le workflow achemine le document vers une étape de validation humaine en invoquant l'un des mécanismes de validation :
    • Station de validation actuelle pour la validation dans le robot.
    • Créez une tâche de validation pour une validation basée sur Action Center.
    • Créez des artefacts de validation de document pour la validation dans Apps.
  5. Confirmation ou correction par un humainLors de la validation, le réviseur humain confirme ou corrige le type de document. Le résultat de la classification validé est ensuite utilisé par les étapes suivantes, telles que l’extraction de données, garantissant que le traitement en aval est basé sur un type de document approuvé. Pour conclure, la validation humaine pour la classification est déclenchée par des règles contrôlées par le workflow, généralement basées sur des scores de confiance et une logique métier, qui déterminent le moment où un résultat de classification nécessite une analyse manuelle avant la poursuite du processus.

Interprétation des résultats de la Station de validation à partir des modèles d'extraction et de traitement intelligents (IXP)

Lorsque vous utilisez des workflows qui exploitent des modèles pour des documents complexes et non structurés d'extraction et de traitement intelligents (IXP), la Station de validation sert d'interface cruciale pour passer en revue, confirmer et affiner les données extraites. La Station de validation montre comment le modèle a interprété le document, ce qui vous permet de comprendre la précision de l'extraction, d'identifier les zones incertaines et d'apporter des corrections si nécessaire.

Dans la Station de validation, le type de document et ses champs correspondants s'affichent à côté des valeurs extraites et des indicateurs de confiance. Pour de plus amples détails sur le processus de validation, vérifiez les ressources suivantes :

Comparaison des workflows de projet Windows et inter-plateformes

La table suivante montre une comparaison entre les workflows d'extraction et de traitement intelligents (IXP) pour les projets Windows et inter-plateformes :

WindowsMultiplateforme
Packages requisIntelligentOCRDocument Understanding
Définition de la taxonomieL'option Taxonomy Manager vous permet de définir la liste des champs qui s'afficheront dans la Station de validation ou qui seront inclus dans l'Object Résultats d'extraction.
Remarque : Taxonomy Manager est disponible uniquement lorsque le package Intelligent OCR est installé.
Le package Document Understanding lit et affiche automatiquement les champs définis dans le schéma de modèle Extraction et traitement intelligents (IXP). Ces champs ne sont pas configurés via le workflow.

Cette page vous a-t-elle été utile ?

Connecter

Besoin d'aide ? Assistance

Vous souhaitez apprendre ? UiPath Academy

Vous avez des questions ? UiPath Forum

Rester à jour