- Notes de publication
- Avant de commencer
- Démarrage
- Intégrations
- Travailler avec des applications de processus
- Travailler avec des tableaux de bord et des graphiques
- Travailler avec des graphiques de processus
- Travailler avec des modèles de processus Découvrir et importer des modèles BPMN
- Showing or hiding the menu
- Informations contextuelles
- Exporter (Export)
- Filtres
- Envoi d’idées d’automatisation au Automation Hub d’UiPath®
- Balises
- Dates d’échéance
- Comparer
- Vérification de la conformité
- Analyse des causes profondes
- Simulation du potentiel d’automatisation
- Démarrage d'un projet Task Mining à partir de Process Mining
- Triggering an automation from a process app
- Afficher les données de processus
- Création d'applications
- Chargement des données
- Charger des données
- Récupération des informations d'identification pour le stockage d'objets blob Azure
- [Aperçu] Charger des données en utilisant une connexion directe
- Chargement de données à l'aide de DataUploader
- Affichage des journaux
- Optimisation d'une application
- Planification des exécutions de données
- Personnaliser les applications de processus
- Introduction aux tableaux de bord
- Créer des tableaux de bord
- Tableaux de bord
- Gestionnaire de l’automatisation
- Input data
- Définition de nouvelles tables d'entrée
- Ajout de champs
- Ajouter des tables
- Configuration requise pour le modèle de données
- Affichage et modification du modèle de données
- Exportation et importation de transformations
- Afficher les journaux de transformations
- Modification et test des transformations de données
- Structure of transformations
- Fusion des journaux d'événements
- Tips for writing SQL
- Gestionnaire de processus
- Publier les applications de processus
- Modèles d'applications
- Ressources supplémentaires
Process Mining
Caractéristiques de performances
Le temps de réponse des applications Process Mining est déterminé par de nombreux facteurs. Cependant, en général, le principe suivant s'applique :
-
Moins de données égale une exécution plus rapide
Dans Process Mining, deux domaines ont des caractéristiques de performances différentes : les exécutions de données pour charger les données et les tableaux de bord pour afficher les données.
Dans Process Mining, chaque application de processus a une étape de développement et une étape publiée. Si l'application prévue nécessite un ensemble de données volumineux, il est conseillé d'utiliser un ensemble de données plus petit (< 10 M d'enregistrements) pour développer les transformations de données et les tableaux de bord.
L'ensemble de données de développement est utilisé pour tester les transformations de données. Cela n'affecte pas les données affichées dans les tableaux de bord de l'application de processus publiée. Une fois que votre application est prête à être utilisée par les utilisateurs professionnels, vous pouvez la publier et ingérer de nouvelles données à utiliser dans l'application de processus publiée.
Un scénario courant consiste à utiliser un ensemble de données avec un délai plus court pour le développement, par exemple, seulement 100 000 événements dans une fenêtre temporelle de 2 semaines. Lors de la publication, un ensemble de données plus volumineux, s'étendant par exemple sur 12 mois, peut être utilisé.
Les exécutions de données dans Process Mining sont déclenchées dans les cas d'utilisation suivants :
-
Création d’une application
-
Charger des données
-
Déclenchement Appliquer aux tableaux de bord , Exécuter tout ou Exécuter le fichier dans l'éditeur de transformations de données .
-
Publication d'une application, qui a des modifications des transformations de données.
Une exécution de données comprend généralement les étapes suivantes, qui ont chacune des caractéristiques de performances différentes :
Lors du téléchargement de données, la taille globale des données téléchargées sur le disque est le facteur le plus important de la vitesse. Voir Chargement de données. Les facteurs affectant les performances sont les suivants :
-
Nombre de tables ;
-
Le nombre d'enregistrements dans les tables ;
-
Le nombre de colonnes dans les tables ;
-
Les données dans les tables. Par exemple, une colonne de description multiligne est plus lente qu'une simple colonne booléenne.
Les transformations de données modifient les données d'entrée en modèle de données requis pour les tableaux de bord. Consultez Transformations de données.
.sql
dans les transformations exécute une requête SQL supplémentaire. Les facteurs suivants affectent la vitesse des transformations de données :
-
Le nombre de fichiers
.sql
; -
Le nombre d'enregistrements dans chaque table ;
-
Le nombre de colonnes dans chaque table ;
-
La complexité de la requête SQL : conditions de jointures, nombre d'expressions de table communes (CTE), expressions dans la requête SQL.
Le modèle de données détermine l'ensemble de tables exposé aux tableaux de bord. Lors d'une exécution de données, des tests sont exécutés pour valider la structure de ces tables dans le modèle de données. Cependant, la partie la plus longue consiste en les pré-calculs effectués pour accélérer la consultation des tableaux de bord ultérieurement.
La vitesse globale de cette étape est déterminée par :
-
Le nombre de tables dans le modèle de données ;
-
La relation entre les tables de sortie ;
-
Le nombre de colonnes dans les tables de sortie
-
Nombre d'enregistrements dans les tables de sortie.
La dernière partie d'une analyse de données consiste à exécuter des pré-calculs pour accélérer le graphique de processus.
-
Le nombre de variantes ;
-
Le nombre d'événements.
Si vous utilisez un modèle BPMN d'importation pour afficher le processus, la complexité du modèle BPMN affecte également les performances. Plus il y a d'activités et de bords, plus les calculs sont lents.
Réduire le volume de données
Pour améliorer la vitesse de téléchargement des données, réduisez la taille de vos données au minimum nécessaire. Cet avis s’applique à toutes les étapes des données :
-
Extraire uniquement les données d'entrée requises ;
-
Ne transformez que les données nécessaires ;
-
N'ajoutez des tables au modèle de données que si celui-ci est nécessaire pour l'analyse des données.
Le moyen le plus simple consiste généralement à réduire la fenêtre de temps utilisée pour l'extraction de données, car cela réduit le nombre d'enregistrements pour la plupart des tables de données, de l'entrée à la transformation en sortie.
Plus tôt vous pouvez réduire la taille des données, plus vous êtes efficace :
-
Filtrez les fichiers
sql
le plus tôt possible dans vos transformations de données ou si possible dans votre extraction de données. -
Pour le développement, un ensemble de données plus petit est généralement utilisé. Pour accélérer les requêtes de test, consultez Données de développement par rapport à la production.
Réduire les tables et les colonnes de données
De plus, veillez à ne charger que les colonnes qui sont réellement utilisées. Plus tôt dans le processus ils peuvent être omis, mieux c'est.
-
Réduisez l'ensemble de colonnes de données extraites à l'état nécessaire.
-
Supprimez tout fichier
.sql
non requis pour le modèle de données de sortie. -
Supprimez toutes les colonnes de données inutiles des requêtes.
-
Supprimez toutes les activités inutiles de l'ensemble d'événements.
Réduire la complexité
Plus les calculs dans les transformations de données et le modèle de données sont complexes, plus les exécutions de données sont lentes. Réduire la complexité peut être un défi, mais peut avoir un impact majeur sur l'environnement d'exécution des données.
-
Réduisez si possible la complexité des instructions SQL, consultez Conseils pour l'écriture de SQL .
-
Réduisez les données du modèle de données aux données nécessaires à l'analyse des données. Toutes les tables ou colonnes non nécessaires à l'analyse des données doivent être supprimées.
-
Si vous utilisez un modèle BPMN d'importation pour afficher le processus, en maintenant le nombre d'activités et de bords bas, vous améliorerez les performances.
En général, les temps de chargement du tableau de bord sont affectés par la quantité de données utilisées par les graphiques et les métriques calculées.
Chaque fois qu'un tableau de bord est chargé dans Process Mining, chaque graphique est calculé en parallèle. La vitesse de chargement d'un graphique est affectée par les facteurs suivants :
-
Nombre de mesures affichées dans le graphique.
-
Pour chaque mesure, la taille de jointure requise pour calculer la métrique compte. Ceci est déterminé par la table utilisée pour regrouper un graphique, combinée à la table de la métrique.
-
La complexité de la relation entre ces deux tables.
-
La distance entre ces deux tables dans le modèle de données.
-
-
Le type de données des champs utilisés. Les champs numériques sont plus rapides que les champs de texte.
-
La complexité des métriques elles-mêmes. Les mesures peuvent être basées sur plusieurs champs.
La suppression de toute mesure non requise pour un graphique accélérera le temps de chargement.
-
Considérez les ICP affichés dans la barre supérieure ;
-
Examinez les métriques affichées dans vos graphiques. Si un graphique affiche plusieurs mesures, chacune d’entre elles ajoutent un temps de calcul supplémentaire.
La simplicité de la définition des métriques peut également accélérer le temps de chargement des graphiques.
-
Réfléchissez si vous pouvez simplifier la définition des métriques ;
-
Envisagez de précalculer des parties de la métrique dans les transformations de données. Tout calcul statique déjà effectué auparavant n'a pas besoin d'être effectué au moment de l'exécution.
- Données de développement par rapport aux données de production
- Performances d'exécution des données
- 1. Charger des données
- 2. Transformation des données
- 3. Modèle de données
- 4. Modèle de processus
- Comment améliorer les performances de l'analyse des données
- Performances du tableau de bord
- Comment améliorer les performances du tableau de bord