Process Mining - Caractéristiques de performance

process-mining

2024.10

false

Guide de l'utilisateur de Process Mining

Important :

Veuillez noter que ce contenu a été localisé en partie à l’aide de la traduction automatique. La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Caractéristiques de performances

caractéristiques de performances de Process Mining sur Automation Suite: facteurs affectant les temps de réponse pour les exécutions de données et le rendu des tableaux de bord.

Le temps de réponse des applications Process Mining est déterminé par de nombreux facteurs. Cependant, en général, le principe suivant s'applique :

Moins de données égale une exécution plus rapide

Dans Process Mining, il existe deux domaines présentant des caractéristiques de performances différentes : les exécutions de données pour charger les données et les tableaux de bord pour afficher les données.

Données de développement par rapport aux données de production

Dans Process Mining, chaque application de processus a une étape de développement et une étape publiée. Si l'application prévue nécessite un ensemble de données volumineux, il est conseillé d'utiliser un ensemble de données plus petit (< 10 M d'enregistrements) pour développer les transformations de données et les tableaux de bord.

L'ensemble de données de développement est utilisé pour tester les transformations de données. Cela n'affecte pas les données affichées dans les tableaux de bord de l'application de processus publiée. Une fois que votre application est prête à être utilisée par les utilisateurs professionnels, vous pouvez la publier et charger de nouvelles données à utiliser dans l'application de processus publiée.

Un scénario courant consiste à utiliser un ensemble de données avec un délai plus court pour le développement, par exemple, seulement 100 000 événements dans une fenêtre temporelle de 2 semaines. Lors de la publication, un ensemble de données plus volumineux, s'étendant par exemple sur 12 mois, peut être utilisé.

Performances d'exécution des données

Les exécutions de données dans Process Mining sont déclenchées dans les cas d'utilisation suivants :

Création d’une application
Charger des données
Déclenchement Appliquer aux tableaux de bord , Exécuter tout ou Exécuter le fichier dans l'éditeur de transformations de données .
Publication d'une application, qui a des modifications des transformations de données.

Une exécution de données comprend généralement les étapes suivantes, qui ont chacune des caractéristiques de performances différentes :

1. Charger des données

Lors du chargement de données, la taille globale des données téléchargées sur le disque est le facteur le plus important pour la vitesse. Consultez Chargement des données. Les facteurs qui affectent les performances sont les suivants :

Nombre de tables ;
Le nombre d'enregistrements dans les tables ;
Le nombre de colonnes dans les tables ;
Les données dans les tables. Par exemple, une colonne de description multiligne est plus lente qu'une simple colonne booléenne.

2. Transformation des données

Les transformations de données modifient les données d'entrée en modèle de données requis pour les tableaux de bord. Extraire l' Éditeur de transformations de données

Chaque fichier .sql dans les transformations exécute une requête SQL supplémentaire. Les facteurs suivants affectent la vitesse des transformations de données :

Le nombre de fichiers .sql ;
Le nombre d'enregistrements dans chaque table ;
Le nombre de colonnes dans chaque table ;
La complexité de la requête SQL : conditions de jointures, nombre d'expressions de table communes (CTE), expressions dans la requête SQL.

3. Modèle de données

Le modèle de données détermine l'ensemble de tables exposé aux tableaux de bord. Lors d'une exécution de données, des tests sont exécutés pour valider la structure de ces tables dans le modèle de données. Cependant, la partie la plus longue consiste en les pré-calculs effectués pour accélérer la consultation des tableaux de bord ultérieurement.

La vitesse globale de cette étape est déterminée par :

Le nombre de tables dans le modèle de données ;
La relation entre les tables de sortie ;
Le nombre de colonnes dans les tables de sortie
Nombre d'enregistrements dans les tables de sortie.

4. Modèle de processus

La dernière partie d'une analyse de données consiste à exécuter des pré-calculs pour accélérer le graphique de processus.

Le nombre de variantes ;
Le nombre d'événements.

Si vous utilisez un modèle BPMN d'importation pour afficher le processus, la complexité du modèle BPMN affecte également les performances. Plus il y a d'activités et de bords, plus les calculs sont lents.

Comment améliorer les performances de l'analyse des données

Réduire le volume de données

Pour améliorer la vitesse de téléchargement des données, réduisez la taille de vos données au minimum nécessaire. Cet avis s’applique à toutes les étapes des données :

Extraire uniquement les données d'entrée requises ;
Ne transformez que les données nécessaires ;
N'ajoutez des tables au modèle de données que si celui-ci est nécessaire pour l'analyse des données.

Le moyen le plus simple consiste généralement à réduire la fenêtre de temps utilisée pour l'extraction de données, car cela réduit le nombre d'enregistrements pour la plupart des tables de données, de l'entrée à la transformation en sortie.

Plus tôt vous pouvez réduire la taille des données, plus vous êtes efficace :

Filtrez les fichiers sql le plus tôt possible dans vos transformations de données ou si possible dans votre extraction de données.
Pour le développement, un ensemble de données plus petit est généralement utilisé. Pour accélérer les requêtes de test, reportez-vous à la section Données de développement et de production.

Réduire les tables et les colonnes de données

De plus, veillez à ne charger que les colonnes qui sont réellement utilisées. Plus tôt dans le processus ils peuvent être omis, mieux c'est.

Réduisez l'ensemble de colonnes de données extraites à l'état nécessaire.
Supprimez tout fichier .sql non requis pour le modèle de données de sortie.
Supprimez toutes les colonnes de données inutiles des requêtes.
Supprimez toutes les activités inutiles de l'ensemble d'événements.

Réduire la complexité

Plus les calculs dans les transformations de données et le modèle de données sont complexes, plus les exécutions de données sont lentes. Réduire la complexité peut être un défi, mais peut avoir un impact majeur sur l'environnement d'exécution des données.

Réduisez la complexité des instructions SQL dans la mesure du possible. Consultez Conseils pour l'écriture de SQL .
Réduisez les données du modèle de données aux données nécessaires à l'analyse des données. Toutes les tables ou colonnes non nécessaires à l'analyse des données doivent être supprimées.
Si vous utilisez un modèle BPMN d'importation pour afficher le processus, en maintenant le nombre d'activités et de bords bas, vous améliorerez les performances.

Performances du tableau de bord

En général, les temps de chargement du tableau de bord sont affectés par la quantité de données utilisées par les graphiques et les métriques calculées.

Chaque fois qu'un tableau de bord est chargé dans Process Mining, chaque graphique est calculé en parallèle. La vitesse de chargement d'un graphique est affectée par les facteurs suivants :

Nombre de mesures affichées dans le graphique.
Pour chaque mesure, la taille de jointure requise pour calculer la métrique compte. Ceci est déterminé par la table utilisée pour regrouper un graphique, combinée à la table de la métrique.
- La complexité de la relation entre ces deux tables.
- La distance entre ces deux tables dans le modèle de données.
Le type de données des champs utilisés. Les champs numériques sont plus rapides que les champs de texte.
La complexité des métriques elles-mêmes. Les mesures peuvent être basées sur plusieurs champs.

Comment améliorer les performances du tableau de bord

La suppression de toute mesure non requise pour un graphique accélérera le temps de chargement.

Considérez les ICP affichés dans la barre supérieure ;
Examinez les métriques affichées dans vos graphiques. Si un graphique affiche plusieurs mesures, chacune d’entre elles ajoutent un temps de calcul supplémentaire.

La simplicité de la définition des métriques peut également accélérer le temps de chargement des graphiques.

Réfléchissez si vous pouvez simplifier la définition des métriques ;
Envisagez de précalculer des parties de la métrique dans les transformations de données. Tout calcul statique déjà effectué auparavant n'a pas besoin d'être effectué au moment de l'exécution.

Sommaire de la page

Données de développement par rapport aux données de production
Performances d'exécution des données
1. Charger des données
2. Transformation des données
3. Modèle de données
4. Modèle de processus
Comment améliorer les performances de l'analyse des données
Performances du tableau de bord
Comment améliorer les performances du tableau de bord

Cette page vous a-t-elle été utile ?

PrécédentExtension de l’outil d’extraction SAP Ariba

SuivantGuide de dépannage de base

Données de développement par rapport aux données de production​

Performances d'exécution des données​

1. Charger des données​

2. Transformation des données​

3. Modèle de données​

4. Modèle de processus​

Comment améliorer les performances de l'analyse des données​

Réduire le volume de données​

Réduire les tables et les colonnes de données​

Réduire la complexité​

Performances du tableau de bord​

Comment améliorer les performances du tableau de bord​