process-mining

latest

false

Important :

Veuillez noter que ce contenu a été localisé en partie à l’aide de la traduction automatique. La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Process Mining

PRODUIT :

Dernière mise à jour 1 mai 2025

Transformations

Folder structure

Les transformations d'une application de processus consistent en un projet dbt . La table suivante décrit le contenu d'un dossier de projet dbt .

Dossier/Fichier	Contient
`dbt_packages\`	le package `pm_utils` et ses macros.
`macros\`	dossier facultatif pour les macros personnalisées
`models\`	`.sql` qui définissent les transformations.
`models\schema\`	`.yml` qui définissent les tests sur les données.
`seed`	`.csv` avec les paramètres de configuration.
`dbt_project.yml`	les paramètres du projet dbt.

Remarque :

Les modèles de journal d'événements et d'application de processus personnalisé ont une structure de transformations de données simplifiée. Les applications de processus créées avec ces modèles d’application n’ont pas cette structure de dossier.

dbt_project.yml

Le fichier dbt_project.yml contient les paramètres du projet dbt qui définit vos transformations. La section vars contient les variables utilisées dans les transformations.

Format date/heure

Chaque modèle d'application contient des variables qui déterminent le format d'analyse des données de date/heure. Ces variables doivent être ajustées si les données d'entrée ont un format date/heure différent de celui prévu.

Transformations de données

Les transformations de données sont définies dans les fichiers .sql du répertoire models\ . Les transformations de données sont organisées dans un ensemble standard de sous-répertoires.

Consultez Structure des transformations (Structure of transformations) pour plus d'informations.

Les fichiers .sql sont écrits en Jinja SQL, ce qui vous permet d'insérer des instructions Jinja dans des requêtes SQL simples. Lorsque dbt exécute tous les .sql fichiers, chaque fichier .sql génère une nouvelle vue ou une nouvelle table dans la base de données.

En règle générale, les fichiers .sql ont la structure suivante : Select * from {{ ref('Table_A') }} Table_A.

Le code suivant montre un exemple de requête SQL.

select
    tableA."Field_1" as "Alias_1",
    tableA."Field_2",
    tableA."Field_3"
from {{ ref('tableA') }} as tableAselect
    tableA."Field_1" as "Alias_1",
    tableA."Field_2",
    tableA."Field_3"
from {{ ref('tableA') }} as tableA

Remarque :

Dans certains cas, pour les applications de processus créées avec des versions antérieures des modèles d'application, les fichiers .sql ont la structure suivante :

Instruction With: une ou plusieurs instructions with pour inclure les sous-tables requises.
- {{ ref(‘My_table) }} fait référence à une table définie par un autre fichier .sql fichier.
- {{ source(var("schema_sources"), 'My_table') }} fait référence à une table d'entrée.
Requête principale: la requête qui définit la nouvelle table.
Requête finale: une requête telle que Select * from table est généralement utilisée à la fin. Cela facilite la réalisation de sous-sélections lors du débogage.

Pour plus de conseils sur l'écriture efficace des transformations, consultez Conseils pour l'écriture de SQL.

Adding source tables

Pour ajouter une nouvelle table source au projet dbt , elle doit être répertoriée dans models\schema\sources.yml. De cette façon, d'autres modèles peuvent s'y référer en utilisant {{ source(var("schema_sources"), 'My_table') }}. L'illustration suivante montre un exemple.

Important : chaque nouvelle table source doit être répertoriée dans sources.yml .

For more detailed information, refer to the official dbt documentation on Sources.

Data output

Les transformations de données doivent générer le modèle de données requis par l'application correspondante ; chaque table et chaque champ attendus doivent être présents.

Si vous souhaitez ajouter de nouveaux champs à votre application de processus, vous pouvez ajouter ces champs dans les transformations.

Macros

Les macros facilitent la réutilisation des constructions SQL courantes. Pour des informations détaillées, consultez la documentation officielle de dbt sur les macros jinja.

pm_utils

Le package pm-utils contient un ensemble de macros généralement utilisées dans les transformations Process Mining. Pour plus d'informations sur les macros pm_utils , consultez ProcessMining-pm-utils.

L'illustration suivante montre un exemple de code jinja appelant la macro pm_utils.optional() .

Graines

Les valeurs de référence sont des fichiers csv utilisés pour ajouter des tables de données à vos transformations. Pour des informations détaillées, consultez la documentation officielle de dbt sur les importations jinja.

Dans Process Mining, cela est généralement utilisé pour faciliter la configuration des mappages dans vos transformations.

Après avoir modifié les fichiers de référence, exécutez le fichier en sélectionnant Exécuter le fichier (Run file) ou Exécuter tout (Run all) pour mettre à jour la table de données correspondante.

Activity configuration

activity_order est utilisé comme essentiel lorsque deux événements se produisent sur le même horodatage.

Utilisation de requêtes SQL

Vous pouvez utiliser des requêtes SQL dans les transformations de données pour définir des champs supplémentaires liés aux activités Le code suivant montre un exemple de requête SQL pour définir activity_order.

case
            when tableA."Activity" = 'ActivityA'
                then 1
            when tableA."Activity" = 'ActivityB'
                then 2
            when tableA."Activity" = 'ActivityC'
                then 3
            when tableA."Activity" = 'ActivityD'
                then 4
    end as "Activity_order"    case
            when tableA."Activity" = 'ActivityA'
                then 1
            when tableA."Activity" = 'ActivityB'
                then 2
            when tableA."Activity" = 'ActivityC'
                then 3
            when tableA."Activity" = 'ActivityD'
                then 4
    end as "Activity_order"

Remarque :

La plupart des modèles d'application ont des champs prédéfinis pour la configuration de l'activité que vous pouvez adapter aux besoins de votre entreprise. Pour les applications de processus qui ne disposent pas de ces champs prédéfinis, vous pouvez utiliser le fichier de référence activity_configuration.csv .

Utilisation du fichier de référence activity_configuration.csv

Le fichier activity_configuration.csv peut également être utilisé pour définir des champs supplémentaires liés aux activités. L'illustration suivante montre un exemple de fichier activity_configuration.csv .

Remarque :

Le activity_configuration.csv ne peut pas être utilisé pour le journal des événements et les modèles d'application de processus personnalisé .

Tests

Le dossier models\schema\ contient un ensemble de fichiers .yml qui définissent les tests. Ceux-ci valident la structure et le contenu des données attendues. Pour des informations détaillées, consultez la documentation officielle de dbt sur les tests.

Remarque : lorsque vous modifiez des transformations, veillez à mettre à jour les tests en conséquence. Les tests peuvent être supprimés si vous le souhaitez.

Projets dbt

Les transformations de données sont utilisées pour transformer les données d'entrée en données adaptées à Process Mining. Les transformations dans Process Mining sont écrites en tant que projets dbt .

Cette page donne une introduction à dbt. Pour des informations plus détaillées, consultez la documentation officielle de dbt.

pm-utils package

Les modèles d'application Process Mining sont fournis avec un package dbt appelé pm_utils. Ce package pm-utils contient des fonctions utilitaires et des macros pour les projets dbt Process Mining. Pour plus d'informations sur le pm_utils , consultez ProcessMining-pm-utils.

Mise à jour de la version pm-utils utilisée pour votre modèle d'application

UiPath® améliore constamment le package pm-utils en ajoutant de nouvelles fonctions.

Lorsqu'une nouvelle version du paquet pm-utils est publiée, il est conseillé de mettre à jour la version utilisée dans vos transformations, pour vous assurer que vous utilisez les dernières fonctions et macros du paquet pm-utils .

Vous trouverez le numéro de version de la dernière version du package pm-utils dans le panneau Versions ( Releases ) du ProcessMining-pm-utils.

Suivez ces étapes pour mettre à jour la version pm-utils dans vos transformations.

Téléchargez le code source (zip) à partir de la version pm-utils.
Extrayez le fichier zip et renommez le dossier en pm_utils.
Exportez les transformations à partir de l'éditeur de transformations de données intégré et extrayez les fichiers.
Remplacez le dossier pm_utils des transformations exportées par le nouveau dossier pm_utils .
Compressez à nouveau le contenu des transformations et importez-les dans l' éditeur de transformations de données .