ixp
latest
false
  • Vue d'ensemble (Overview)
    • Introduction
    • Extraire des données de documents non structurés
    • Créer et déployer des modèles
    • Quotas
  • Construction de modèles
  • Validation du modèle
  • Déploiement du modèle
    • Vue d'ensemble (Overview)
    • Publier des versions de modèles
    • Gérer les versions publiées
    • Créer et consommer un workflow
    • CLI
  • API
  • Questions fréquemment posées
Important :
La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.
UiPath logo, featuring letters U and I in white

Guide de l'utilisateur des documents complexes et non structurés

Dernière mise à jour 27 mars 2026

Créer et consommer un workflow

Vous pouvez consommer les prédictions d'une version publiée du modèle Documents complexes et non structurés en créant un workflow dans UiPath Studio.

Vue d'ensemble (Overview)

La création d'un workflow Documents complexes et non structurés Extraction et traitement intelligents (IXP) implique généralement les étapes suivantes :

  1. Installation du package
  2. Définition de la taxonomie
  3. Numérisation des documents
  4. Classification de document
  5. Extraction des documents
  6. Validation du document
Remarque :

L’étape de définition de la taxonomie s’applique uniquement aux projets Windows, et non aux projets inter-plateformes. Pour découvrir les différences entre les types de projet, consultez les sections qui suivent.

Prérequis

Vous devez avoir un modèle publié dans un projet Documents complexes et non structurés.

Lorsque vous commencez à créer votre workflow Studio, vous devez décider du type de projet que vous souhaitez exécuter : Windows ou Inter-plateformes. Chaque type de projet nécessite des packages différents.

Quel que soit le type de projet que vous choisissez, vous pouvez installer les packages :

Windows

  • UiPath.IntelligentOCR.Activities 6.22.0
  • UiPath.System.Activities 24.10.6

Multiplateforme

  • UiPath.DocumentUnderstanding.Activities 2.12.0
  • UiPath.System.Activities 24.10.6
Remarque :
  • Le package IntelligentOCR est compatible avec les projets Windows, et pas avec les projets inter-plateformes.
  • Vous pouvez créer des workflows inter-plateformes et utiliser d'autres modèles dans Studio Web.

Création d'un workflow d'extraction et de traitement intelligents (IXP) pour les projets Windows

Les sections qui suivent contiennent les étapes à appliquer si vous choisissez de ne pas utiliser l’un des modèles Studio et de commencer à zéro.

Pour créer un workflow d'extraction et de traitement intelligents (IXP) pour les projets Windows, procédez comme suit :

Remarque :

Les noms des variables utilisés dans les sections suivantes ne sont que des exemples.Vous pouvez nommer vos variables en fonction de vos propres conventions.

1. Installation des packages

Assurez-vous d’installer les packages mentionnés dans la section Conditions préalables.

2. Définition de la taxonomie

  1. Dans Studio Desktop, créez un processus de base.

  2. Lors de la configuration de votre processus, dans le champ Compatibilité, sélectionnez le type de workflow que vous souhaitez créer : Windows ou inter-plateformes.Pour de plus amples détails, vérifiez À propos des projets d'automatisation.

  3. Ouvrez Taxonomy Manager depuis l’onglet Conception et configurez les champs de votre table comme suit :

    • Créez un champ de table pour chaque groupe de champs dans votre taxonomie de projet Extraction et traitement intelligents (IXP).
    • Ajoutez une colonne dans le champ de table respectif pour chaque champ défini dans le groupe de champs.
    Remarque :

    Taxonomy Manager :

    • prend en charge la création de tables et de champs. Lorsque vous créez des workflows Documents complexes et non structurés Extraction et traitement intelligents (IXP), il est recommandé de créer des champs de table au lieu de simplement des champs.
    • est disponible uniquement lorsque le package IntelligentOCR est installé.Cela signifie qu'il est uniquement disponible sur les projets Windows, et non sur les projets inter-plateformes.
  4. Ensuite, vous devez avoir un emplacement à partir duquel vous pouvez lire des documents.Par exemple, dans le dossier Projet, créez un nouveau dossier nommé Documents et ajoutez quelques fichiers.

  5. Dans la Séquence, ajoutez une activité Affecter pour spécifier l'endroit d'où vous souhaitez lire les documents.Configurez les champs suivants :

    • Enregistrer dans - Créez et ajoutez une variable de type System.String[].Dans cet exemple, la variable est appelée docs.
    • Valeur à enregistrer - Ajoutez Directory.GetFiles("./documents").

    L'activité Affecter.

  6. Ajoutez une activité Charger la toxonomie pour stocker la taxonomie configurée dans une variable pour la référencer dans le reste de l'automatisation.Créez et ajoutez une variable de type DocumentTaxonomy. Dans cet exemple, la variable est appelée taxo.

    Remarque :

    Vous devez mapper la variable à la sortie de l’activité.

    L'activité Charger la taxonomie.

3. Numérisation d’un document

  1. Ajoutez une activité Pour chaque (For Each) pour parcourir chaque document. Pour l'entrée, ajoutez la variable docs que vous avez précédemment créée.

    L'activité Pour chaque (For Each).

  2. Glissez-déposez l’activité suivante dans Pour chacun :

    • Numériser le document - Vous permet de lire les documents que vous avez fournis et d’obtenir la sortie du Modèle d'Object de document (DOM). Configurez les champs suivants :
      • Chemin du document - Ajoutez la variable doc. Vous pouvez trouver la variable dans le nom de l’élément que vous avez configuré dans l’activité Pour chacun. Dans cet exemple, le nom de l’élément est doc et représente le chemin de fichier du document que vous souhaitez numériser.

      • Texte du document - Créez et ajoutez la variable Text.

      • Modèle d'Object de document (DOM) - Créez et ajoutez la variable dom.

        L'activité Numériser le document.

4. Classification d’un document

Dans la même activité Pour chacun, après Numériser le document, glissez et déposez l’activité suivante :

  • Classifier l’étendue du document - Vous permet de classifier le document en cours de traitement dans l’un des types de document définis dans votre taxonomie.Pour les entrées, ajoutez ce qui suit :
    • Chemin du document (Document Path) : ajoutez la variable doc.

    • Text du document - Ajoutez la variable Text.

    • Modèle d’Object de document (DOM) - Ajoutez la variable dom.

    • Taxonomie - Ajoutez la variable taxo. Pour les sorties, ajoutez ce qui suit :

    • Résultats de la classification (Classification Results) : créez et ajoutez une nouvelle variable Résultats de la classification.

      L'activité Classifier l'étendue du document.

Dans l’étendue Classifier le document, ajoutez l’activité Classifieur génératif pour classifier des documents à l’aide de modèles génératifs. Configurez l’activité comme suit : 1. Sélectionnez Gérer les détails du champ. 2. Dans la colonne Type de document, sélectionnez un type de document. 3. Dans la colonne Détails du champ, ajoutez une valeur facultative pour définir des détails supplémentaires sur le type de document.Il peut s’agir d’une courte description du type de document.Le nombre maximum de caractères autorisés est de 1 000.4. Sélectionnez Enregistrer.

L’activité Classifieur génératif.

Remarque :

Une activité de classification est facultative si vous n’avez qu’un seul type de document dans votre taxonomie. Vous pouvez copier l'ID de type de document et l'utiliser comme entrée dans l'activité Étendue de l'extraction des données.

5. Extraction des détails d’un document

  1. Glissez-déposez l’activité suivante dans Pour chacun :

    • Étendue de l’extraction de données - Vous permet de configurer les activités de l’extracteur. Pour les entrées, ajoutez ce qui suit :
      • Chemin du document (Document Path) : ajoutez la variable doc.
      • Texte du document - Ajoutez la variable Text.
      • Modèle d'objet de document (DOM) : ajoutez la variable dom.
      • Taxonomie - Ajoutez la variable taxo.
      • Résultat de la classification - Ajoutez la variable ClassificationResults. Pour la sortie, ajoutez ce qui suit :
      • Résultats d'extraction (Extraction Results) : créez et ajoutez une nouvelle variable Résultats d'extraction.
  2. Dans l’étendue de l’extraction de données, ajoutez l’activité Extracteur de projet Document Understanding pour extraire les données du document.

    L'activité Étendue de l'extraction des données.

Lorsque vous ajoutez l’activité Extracteur de projet au sein de l’étendue, la fenêtre de configuration Obtenir des fonctionnalités doit s’ouvrir automatiquement.

L’assistant Obtenir des fonctionnalités dans Studio.

  1. Si le projet publié est hébergé dans une Organization ou un locataire différent, ou est utilisé dans une configuration hybride, ajoutez les détails requis dans Obtenir des fonctionnalités comme suit :

    • Créez une application externe dans la page Administration d'Automation Cloud. Pour plus d'informations, consultez la section Ajout d'une application externe.

    • Copiez l'ID de l'application et le secret de l'application, où le secret de l'application est le mot de passe.

    • Dans la fenêtre Obtenir des fonctionnalités, ajoutez les informations d’identification, l’ID de l’application et le secret.

    • Configurez le reste des champs comme décrit dans l’extracteur de projet Document Understanding.

      Cette image montre la fenêtre Obtenir des fonctionnalités dans Studio.

      Remarque :

      Lorsque vous copiez l’URL du locataire, assurez-vous qu’elle inclut les noms de l’Organization et du locataire.Par exemple, https://staging.uipath.com/communicationsminingteam/IXPTesting, où communicationsminingteam est l’Organization et IXPTesting est le locataire.

    • Dans l’activité Extracteur de projet Document Understanding, ajoutez le chemin de la ressource en tant qu’entrée dans la propriété Ressource d’informations d’identification du Runtime de l’activité Extracteur de projet Document Understanding.Le chemin doit être sous la forme de <OrchestratorFolderName>/<AssetName>.

    La propriété Ressource des informations d’identification du Runtime de l’extracteur de projet Document Understanding.

  2. Si le workflow s’exécute dans la même Organization et le même locataire où le projet a été publié, sélectionnez le projet publié dans l’activité Extracteur de projet Document Understanding.

    Remarque :

    Le modèle publié apparaît dans les options déroulantes si Studio est connecté à la même Organization ou au même locataire dans lequel le modèle a été publié.Si le modèle n'apparaît pas, c'est peut-être parce qu'il est publié dans une Organization ou un locataire différent.Dans ce cas, appliquez les instructions de la section qui suit, Consommation des prédictions de projets inter-organisations, inter-locataires ou hybrides.

  3. Sélectionnez Configurer les extracteurs et utilisez l’assistant pour mapper vos champs de taxonomie aux champs définis dans le projet Documents complexes et non structurés.Image 1. L'assistant Configurer les extracteurs de Studio

    L'image montre la fenêtre Configurer les extracteurs dans Studio.

6. Validation d’un document

Vous pouvez facultativement configurer des critères de décision pour déterminer si une validation humaine est requise pour la sortie de classification.Cela peut être fait à l'aide de règles métier personnalisées ou d'une logique de post-traitement. Vous pouvez également utiliser des critères de décision personnalisés dans un workflow pour déclencher la validation ou vous pouvez configurer des seuils de confiance au niveau du champ.Ce critère de décision dépend des exigences du processus métier et de l’allocation de faux positifs de votre cas d’utilisation, c’est-à-dire des résultats qui ignorent la validation humaine, mais qui ont été extraits de manière incorrecte. En fonction de ces règles, vous pouvez contrôler si un document est automatiquement validé ou s'il est routé vers une validation humaine.Pour plus de détails, Vérifiez la section Paramètres de validation dans Établissement de la structure.

  1. Ajoutez l’activité Présenter la Station de validation pour valider dans la Station de validation.La sortie ExtractionResults de l'activité Étendue de l'extraction de données sera l'entrée de l'activité Présenter la Station de validation.Pour l'entrée, ajoutez la variable ExtractionResults. Pour la sortie, créez et ajoutez une nouvelle variable ValidatedExtractionResults.

  2. Pour les entrées, ajoutez ce qui suit :

    • Chemin du document (Document Path) : ajoutez la variable doc.
    • Texte du document - Ajoutez la variable Text.
    • Modèle d'objet de document (DOM) : ajoutez la variable dom.
    • Taxonomie - Ajoutez la variable taxo.
    • Résultats d'extraction automatiques - Ajoutez la variable ExtractionResults.
  3. Pour la sortie, ajoutez ce qui suit :

    • Résultats d'extraction validés - Créez et ajoutez une nouvelle variable ValidatedExtractionResults.

    L'activité Station de validation actuelle. L'activité Station de validation actuelle.

Dans cette étape de validation, vous pouvez également utiliser d’autres activités que Présenter la Station de validation.Par exemple :

Pour plus de détails sur la validation, Vérifiez les ressources suivantes :

Déclenchement de la validation humaine

La validation humaine de la sortie de la classification est déclenchée en appliquant une logique de décision après l'étape de classification, avant que le workflow ne procède à l'extraction. La décision n'est pas automatique par défaut, elle est explicitement contrôlée via des seuils de confiance et des règles métier définis dans le workflow.

La liste suivante indique comment la validation humaine peut être déclenchée :

  1. Évaluation de la confiance de la classification Chaque résultat de classification inclut des scores de confiance qui indiquent le degré de certitude du modèle quant au type de document prédit. Ces scores sont évalués dans le workflow pour déterminer si la classification est fiable.
  2. Seuils de confiance Vous pouvez définir un seuil de confiance minimum pour la classification.Si le score de confiance pour le type de document prédit tombe en dessous de ce seuil, la classification est considérée comme incertaine et le document est signalé pour validation humaine.
  3. Règles métier et logique conditionnelle En plus des seuils de confiance, vous pouvez appliquer des règles métier personnalisées telles que :
    • Types de documents spécifiques qui nécessitent toujours une révision manuelle.
    • Inadéquations entre les types de document attendus et prédits.
    • Règles basées sur la façon dont le document sera traité ultérieurement. Par exemple, les documents qui doivent être vérifiés avant l'extraction ou l'approbation.
  4. Déclenchement de l’étape de validation Lorsque les critères définis sont remplis, le workflow route le document vers une étape de validation humaine en invoquant l’un des mécanismes de validation :
    • Présentez la Station de validation pour la validation dans le robot.
    • Créez une tâche de validation pour la validation basée sur Action Center.
    • Créez des artefacts de validation de document pour la validation dans Apps.
  5. Confirmation ou correction humainePendant la validation, l'examinateur humain confirme ou corrige le type de document. Le résultat de la classification validé est ensuite utilisé par les étapes suivantes telles que l’extraction de données, garantissant que le traitement en aval est basé sur un type de document approuvé. Pour conclure, la validation humaine de la classification est déclenchée par des règles contrôlées par le workflow, généralement basées sur les scores de confiance et une logique métier, qui déterminent quand un résultat de classification nécessite une révision manuelle avant que le processus ne continue.

Interprétation des résultats de la Station de validation à partir des modèles d'extraction et de traitement intelligents (IXP)

Lorsque vous utilisez des workflows qui exploitent des modèles pour des documents complexes et non structurés d'extraction et de traitement intelligents (IXP), la Station de validation sert d'interface cruciale pour passer en revue, confirmer et affiner les données extraites. La Station de validation montre comment le modèle a interprété le document, ce qui vous permet de comprendre la précision de l'extraction, d'identifier les zones incertaines et d'apporter des corrections si nécessaire.

Dans la Station de validation, le type de document et ses champs correspondants s'affichent à côté des valeurs extraites et des indicateurs de confiance. Pour de plus amples détails sur le processus de validation, vérifiez les ressources suivantes :

Comparaison des workflows de projet Windows et inter-plateformes

La table suivante montre une comparaison entre les workflows d'extraction et de traitement intelligents (IXP) pour les projets Windows et inter-plateformes :

WindowsMultiplateforme
Packages requisIntelligentOCRDocument Understanding
Définition de la taxonomieL'option Taxonomy Manager vous permet de définir la liste des champs qui s'afficheront dans la Station de validation ou qui seront inclus dans l'Object Résultats d'extraction.
Remarque : Taxonomy Manager est disponible uniquement lorsque le package Intelligent OCR est installé.
Le package Document Understanding lit et affiche automatiquement les champs définis dans le schéma de modèle Extraction et traitement intelligents (IXP). Ces champs ne sont pas configurés via le workflow.

Cette page vous a-t-elle été utile ?

Connecter

Besoin d'aide ? Assistance

Vous souhaitez apprendre ? UiPath Academy

Vous avez des questions ? UiPath Forum

Rester à jour