process-mining

2023.10

false

Important :

Veuillez noter que ce contenu a été localisé en partie à l’aide de la traduction automatique. La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Process Mining

PRODUIT :

Dernière mise à jour 15 avr. 2025

Transformations

Folder structure

Les transformations d'une application de processus consistent en un projet dbt . Vous trouverez ci-dessous une description du contenu d'un dossier de projet dbt .

Dossier/Fichier	Contient
`dbt_packages\`	le package `pm_utils` et ses macros.
`logs\`	journaux créés lors de l’exécution de dbt.
`macros\`	macros personnalisées.
`models\`	`.sql` qui définissent les transformations.
`models\schema\`	`.yml` qui définissent les tests sur les données.
`seed`	`.csv` avec les paramètres de configuration.
`dbt_project.yml`	les paramètres du projet dbt.

Voir illustration ci-dessous.

Transformations de données

Les transformations de données sont définies dans des fichiers .sql dans le répertoire models\ . Les transformations de données sont organisées dans un ensemble standard de sous-répertoires :

1_input,
2_objects,
3_events,
4_event_logs,
5_business_logic.

Consultez Structure des transformations.

Les fichiers .sql sont écrits en Jinja SQL, ce qui vous permet d'insérer des instructions Jinja dans des requêtes SQL simples. Lorsque dbt exécute tous les .sql fichiers, chaque fichier .sql génère une nouvelle vue ou une nouvelle table dans la base de données.

En règle générale, les fichiers .sql ont la structure suivante :

Instruction With: une ou plusieurs instructions with pour inclure les sous-tables requises.
- {{ ref(‘My_table) }} fait référence à une table définie par un autre fichier .sql fichier.
- {{ source(var("schema_sources"), 'My_table') }} fait référence à une table d'entrée.
Requête principale: la requête qui définit la nouvelle table.
Requête finale: une requête telle que Select * from table est généralement utilisée à la fin. Cela facilite la réalisation de sous-sélections lors du débogage.

Pour plus de conseils sur l'écriture efficace des transformations, consultez Conseils pour l'écriture de SQL

Adding source tables

Pour ajouter une nouvelle table source au projet dbt , elle doit être répertoriée dans models\schema\sources.yml. De cette façon, d'autres modèles peuvent s'y référer en utilisant {{ source(var("schema_sources"), 'My_table') }}. L'illustration suivante montre un exemple.

Important : chaque nouvelle table source doit être répertoriée dans sources.yml .

Pour plus d'informations sur l'utilisation des tables source dans les requêtes, reportez-vous à Structure des transformations:1. Entrée (Input). Pour des informations plus détaillées, consultez la documentation officielle de dbt sur les sources.

Data output

Les transformations de données doivent générer le modèle de données requis par l'application correspondante ; chaque table et chaque champ attendus doivent être présents.

Si vous souhaitez ajouter de nouveaux champs à votre application de processus, vous pouvez ajouter ces champs dans les transformations.

Macros

Les macros facilitent la réutilisation des constructions SQL courantes. Pour des informations détaillées, consultez la documentation officielle de dbt sur les macros jinja.

pm_utils

Le package pm-utils contient un ensemble de macros généralement utilisées dans les transformations Process Mining. Pour plus d'informations sur les macros pm_utils , consultez ProcessMining-pm-utils.

L'illustration suivante montre un exemple de code jinja appelant la macro pm_utils.optional() .

Graines

Les valeurs de référence sont des fichiers csv utilisés pour ajouter des tables de données à vos transformations. Pour des informations détaillées, consultez la documentation officielle de dbt sur les importations jinja.

Dans Process Mining, cela est généralement utilisé pour faciliter la configuration des mappages dans vos transformations.

Après avoir modifié les fichiers de référence, exécutez le fichier en sélectionnant Exécuter le fichier (Run file) ou Exécuter tout (Run all) pour mettre à jour la table de données correspondante.

Activity configuration

Le fichier activity_configuration.csv est utilisé pour définir des champs supplémentaires liés aux activités. activity_order est utilisé comme briseur de lien lorsque deux événements se produisent sur le même horodatage. L'illustration suivante montre un exemple de fichier activity_configuration.csv .

Tests

Le dossier models\schema\ contient un ensemble de fichiers .yml qui définissent les tests. Ceux-ci valident la structure et le contenu des données attendues. Pour des informations détaillées, consultez la documentation officielle de dbt sur les tests.

Lorsque les transformations sont exécutées dans Process Mining, seuls les tests dans sources.yml sont exécutés à chaque ingestion de données. Cela permet de vérifier si les données d'entrée sont correctement formatées.

Remarque : lorsque vous modifiez des transformations, veillez à mettre à jour les tests en conséquence. Les tests peuvent être supprimés si vous le souhaitez.

Projets dbt

Les transformations de données sont utilisées pour transformer les données d'entrée en données adaptées à Process Mining. Les transformations dans Process Mining sont écrites en tant que projets dbt .

Cette page donne une introduction à dbt. Pour des informations plus détaillées, consultez la documentation officielle de dbt.

pm-utils package

Les modèles d'application Process Mining sont fournis avec un package dbt appelé pm_utils. Ce package pm-utils contient des fonctions utilitaires et des macros pour les projets dbt Process Mining. Pour plus d'informations sur le pm_utils , consultez ProcessMining-pm-utils.

Mise à jour de la version pm-utils utilisée pour votre modèle d'application

UiPath® améliore constamment le package pm-utils en ajoutant de nouvelles fonctions.

Lorsqu'une nouvelle version du paquet pm-utils est publiée, il est conseillé de mettre à jour la version utilisée dans vos transformations, pour vous assurer que vous utilisez les dernières fonctions et macros du paquet pm-utils .

Vous trouverez le numéro de version de la dernière version du package pm-utils dans le panneau Versions ( Releases ) du ProcessMining-pm-utils.

Suivez ces étapes pour mettre à jour la version pm-utils dans vos transformations.

Téléchargez le code source (zip) à partir de la version pm-utils.
Extrayez le fichier zip et renommez le dossier en pm_utils.
Exportez les transformations à partir de l'éditeur de transformations de données intégré et extrayez les fichiers.
Remplacez le dossier pm_utils des transformations exportées par le nouveau dossier pm_utils .
Compressez à nouveau le contenu des transformations et importez-les dans l' éditeur de transformations de données .