process-mining
2024.10
true
UiPath logo, featuring letters U and I in white

Process Mining

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Dernière mise à jour 18 déc. 2024

Caractéristiques de performances

Le temps de réponse des applications Process Mining est déterminé par de nombreux facteurs. Cependant, en général, le principe suivant s'applique :

  • Moins de données égale une exécution plus rapide

Dans Process Mining, deux domaines ont des caractéristiques de performances différentes : les exécutions de données pour charger les données et les tableaux de bord pour afficher les données.

Données de développement par rapport aux données de production

Dans Process Mining, chaque application de processus a une étape de développement et une étape publiée. Si l'application prévue nécessite un ensemble de données volumineux, il est conseillé d'utiliser un ensemble de données plus petit (< 10 M d'enregistrements) pour développer les transformations de données et les tableaux de bord.

L'ensemble de données de développement est utilisé pour tester les transformations de données. Cela n'affecte pas les données affichées dans les tableaux de bord de l'application de processus publiée. Une fois que votre application est prête à être utilisée par les utilisateurs professionnels, vous pouvez la publier et ingérer de nouvelles données à utiliser dans l'application de processus publiée.

Un scénario courant consiste à utiliser un ensemble de données avec un délai plus court pour le développement, par exemple, seulement 100 000 événements dans une fenêtre temporelle de 2 semaines. Lors de la publication, un ensemble de données plus volumineux, s'étendant par exemple sur 12 mois, peut être utilisé.

Performances d'exécution des données

Les exécutions de données dans Process Mining sont déclenchées dans les cas d'utilisation suivants :

  • Création d’une application

  • Charger des données

  • Déclenchement Appliquer aux tableaux de bord , Exécuter tout ou Exécuter le fichier dans l'éditeur de transformations de données .

  • Publication d'une application, qui a des modifications des transformations de données.

Une exécution de données comprend généralement les étapes suivantes, qui ont chacune des caractéristiques de performances différentes :

1. Charger des données

Lors du téléchargement de données, la taille globale des données téléchargées sur le disque est le facteur le plus important de la vitesse. Voir Chargement de données. Les facteurs affectant les performances sont les suivants :

  • Nombre de tables ;

  • Le nombre d'enregistrements dans les tables ;

  • Le nombre de colonnes dans les tables ;

  • Les données dans les tables. Par exemple, une colonne de description multiligne est plus lente qu'une simple colonne booléenne.

2. Transformation des données

Les transformations de données modifient les données d'entrée en modèle de données requis pour les tableaux de bord. Consultez Transformations de données.

Chaque fichier .sql dans les transformations exécute une requête SQL supplémentaire. Les facteurs suivants affectent la vitesse des transformations de données :
  • Le nombre de fichiers .sql ;
  • Le nombre d'enregistrements dans chaque table ;

  • Le nombre de colonnes dans chaque table ;

  • La complexité de la requête SQL : conditions de jointures, nombre d'expressions de table communes (CTE), expressions dans la requête SQL.

3. Modèle de données

Le modèle de données détermine l'ensemble de tables exposé aux tableaux de bord. Lors d'une exécution de données, des tests sont exécutés pour valider la structure de ces tables dans le modèle de données. Cependant, la partie la plus longue consiste en les pré-calculs effectués pour accélérer la consultation des tableaux de bord ultérieurement.

La vitesse globale de cette étape est déterminée par :

  • Le nombre de tables dans le modèle de données ;

  • La relation entre les tables de sortie ;

  • Le nombre de colonnes dans les tables de sortie

  • Nombre d'enregistrements dans les tables de sortie.

4. Modèle de processus

La dernière partie d'une analyse de données consiste à exécuter des pré-calculs pour accélérer le graphique de processus.

  • Le nombre de variantes ;

  • Le nombre d'événements.

Si vous utilisez un modèle BPMN d'importation pour afficher le processus, la complexité du modèle BPMN affecte également les performances. Plus il y a d'activités et de bords, plus les calculs sont lents.

Comment améliorer les performances de l'analyse des données

Réduire le volume de données

Pour améliorer la vitesse de téléchargement des données, réduisez la taille de vos données au minimum nécessaire. Cet avis s’applique à toutes les étapes des données :

  • Extraire uniquement les données d'entrée requises ;

  • Ne transformez que les données nécessaires ;

  • N'ajoutez des tables au modèle de données que si celui-ci est nécessaire pour l'analyse des données.

Le moyen le plus simple consiste généralement à réduire la fenêtre de temps utilisée pour l'extraction de données, car cela réduit le nombre d'enregistrements pour la plupart des tables de données, de l'entrée à la transformation en sortie.

Plus tôt vous pouvez réduire la taille des données, plus vous êtes efficace :

  • Filtrez les fichiers sql le plus tôt possible dans vos transformations de données ou si possible dans votre extraction de données.
  • Pour le développement, un ensemble de données plus petit est généralement utilisé. Pour accélérer les requêtes de test, consultez Données de développement par rapport à la production.

Réduire les tables et les colonnes de données

De plus, veillez à ne charger que les colonnes qui sont réellement utilisées. Plus tôt dans le processus ils peuvent être omis, mieux c'est.

  • Réduisez l'ensemble de colonnes de données extraites à l'état nécessaire.

  • Supprimez tout fichier .sql non requis pour le modèle de données de sortie.
  • Supprimez toutes les colonnes de données inutiles des requêtes.

  • Supprimez toutes les activités inutiles de l'ensemble d'événements.

Réduire la complexité

Plus les calculs dans les transformations de données et le modèle de données sont complexes, plus les exécutions de données sont lentes. Réduire la complexité peut être un défi, mais peut avoir un impact majeur sur l'environnement d'exécution des données.

  • Réduisez si possible la complexité des instructions SQL, consultez Conseils pour l'écriture de SQL .

  • Réduisez les données du modèle de données aux données nécessaires à l'analyse des données. Toutes les tables ou colonnes non nécessaires à l'analyse des données doivent être supprimées.

  • Si vous utilisez un modèle BPMN d'importation pour afficher le processus, en maintenant le nombre d'activités et de bords bas, vous améliorerez les performances.

Performances du tableau de bord

En général, les temps de chargement du tableau de bord sont affectés par la quantité de données utilisées par les graphiques et les métriques calculées.

Chaque fois qu'un tableau de bord est chargé dans Process Mining, chaque graphique est calculé en parallèle. La vitesse de chargement d'un graphique est affectée par les facteurs suivants :

  • Nombre de mesures affichées dans le graphique.

  • Pour chaque mesure, la taille de jointure requise pour calculer la métrique compte. Ceci est déterminé par la table utilisée pour regrouper un graphique, combinée à la table de la métrique.

    • La complexité de la relation entre ces deux tables.

    • La distance entre ces deux tables dans le modèle de données.

  • Le type de données des champs utilisés. Les champs numériques sont plus rapides que les champs de texte.

  • La complexité des métriques elles-mêmes. Les mesures peuvent être basées sur plusieurs champs.

Comment améliorer les performances du tableau de bord

La suppression de toute mesure non requise pour un graphique accélérera le temps de chargement.

  • Considérez les ICP affichés dans la barre supérieure ;

  • Examinez les métriques affichées dans vos graphiques. Si un graphique affiche plusieurs mesures, chacune d’entre elles ajoutent un temps de calcul supplémentaire.

La simplicité de la définition des métriques peut également accélérer le temps de chargement des graphiques.

  • Réfléchissez si vous pouvez simplifier la définition des métriques ;

  • Envisagez de précalculer des parties de la métrique dans les transformations de données. Tout calcul statique déjà effectué auparavant n'a pas besoin d'être effectué au moment de l'exécution.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.