process-mining

2023.10

false

Importante :

Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Process Mining

ENTREGA:

Última actualización 15 de ene. de 2026

Características de rendimiento

El tiempo de respuesta de las aplicaciones de Process Mining está determinado por muchos factores. Sin embargo, en general se aplica el siguiente principio:

Menos datos equivale a una ejecución más rápida

En Process Mining, hay dos áreas que tienen diferentes características de rendimiento: ejecuciones de datos para cargar los datos y paneles para ver los datos.

Datos de desarrollo frente a datos de producción

En Process Mining, cada aplicación de proceso tiene una etapa de desarrollo y una etapa publicada. Si la aplicación deseada requiere un conjunto de datos grande, se recomienda utilizar un conjunto de datos más pequeño (<10 millones de registros) para desarrollar las transformaciones de datos y los paneles.

El conjunto de datos de desarrollo se utiliza para probar las transformaciones de datos. No afecta a los datos que se muestran en los paneles de la aplicación de proceso publicada. Una vez que tu aplicación esté lista para ser utilizada por los usuarios empresariales, puedes publicar la aplicación y cargar nuevos datos para su uso en la aplicación de proceso publicada.

Un escenario común es utilizar un conjunto de datos con un marco de tiempo más corto para el desarrollo, por ejemplo, solo 100 000 eventos en una ventana de tiempo de 2 semanas. Al publicar, se puede utilizar un conjunto de datos más grande, por ejemplo, que abarque 12 meses.

Rendimiento de la ejecución de datos

Las ejecuciones de datos en Process Mining se desencadenan en los siguientes casos de uso:

Crear una aplicación
Cargar datos
Desencadenar Aplicar a paneles , Ejecutar todo o Ejecutar archivo en el editor de Transformaciones de datos .
Publicar una aplicación que tenga cambios en las transformaciones de datos.

Una ejecución de datos suele constar de los siguientes pasos, cada uno de los cuales tiene diferentes características de rendimiento:

1. Cargar datos

Al cargar datos, el tamaño total de los datos cargados en el disco es el factor más importante para la velocidad. Consulta Cargar datos. Los factores que afectan al rendimiento son:

El número de tablas;
El número de registros en las tablas;
El número de columnas en las tablas;
Los datos de las tablas. Por ejemplo, una columna de descripción de varias líneas es más lenta que una columna booleana simple.

2. Transformar datos

Las transformaciones de datos cambian los datos de entrada en el modelo de datos necesario para los paneles. Consulta Transformaciones de datos.

Cada archivo .sql de las transformaciones ejecuta una consulta SQL adicional. Los siguientes factores afectan a la velocidad de las transformaciones de datos:

El número de archivos .sql ;
El número de registros en cada tabla;
El número de columnas de cada tabla;
La complejidad de la consulta SQL: condiciones de unión, número de Expresiones de tabla comunes (CTE), expresiones en la consulta SQL.

3. Modelo de datos

El modelo de datos determina el conjunto de tablas que se exponen a los paneles. Durante una ejecución de datos, se ejecutan pruebas para validar la estructura de estas tablas en el modelo de datos. Sin embargo, la parte que más tiempo consume son los cálculos previos que se realizan para acelerar la visualización de los paneles más adelante.

La velocidad general de este paso está determinada por:

El número de tablas en el modelo de datos;
La relación entre las tablas de salida;
El número de columnas en las tablas de salida
El número de registros en las tablas de salida.

4. Modelo de proceso

La última parte de una ejecución de datos es ejecutar cálculos previos para acelerar el gráfico de proceso.

El número de variantes;
El número de los eventos.

Si utilizas un modelo BPMN de importación para mostrar el proceso, la complejidad del modelo BPMN también afecta al rendimiento. Cuantas más actividades y bordes haya, más lentos serán los cálculos.

Cómo mejorar el rendimiento de la ejecución de datos

Reducir el volumen de datos

Para mejorar la velocidad de carga de datos, reduce el tamaño de tus datos al mínimo necesario. Este consejo es válido para todas las etapas de los datos:

Extraiga solo los datos de entrada necesarios;
Transforme solo los datos necesarios;
Solo añade tablas al modelo de datos si es necesario para el análisis de datos.

La forma más fácil de hacerlo suele ser disminuir la ventana de tiempo utilizada para la extracción de datos, ya que eso reduce el número de registros para la mayoría de las tablas de datos desde la entrada hasta la transformación y la salida.

Cuanto antes puedas reducir el tamaño de los datos, más eficiente será:

Filtra los archivos sql lo antes posible en tus transformaciones de datos o, si es posible, en tu extracción de datos.
Para el desarrollo, normalmente se utiliza un conjunto de datos más pequeño, para acelerar las consultas de prueba, consulta Desarrollo frente a datos de producción.

Reducir tablas y columnas de datos

Además, tenga cuidado de cargar solo las columnas que se utilizan realmente. Cuanto antes se puedan omitir en el proceso, mejor.

Reduce el conjunto de columnas de datos extraídos a lo necesario.
Elimina cualquier archivo .sql que no sea necesario para el modelo de datos de salida.
Elimina cualquier columna de datos innecesaria en las consultas.
Elimina cualquier actividad innecesaria del conjunto de eventos.

Reducir la complejidad

Cuanto más complicados sean los cálculos en las transformaciones de datos y el modelo de datos, más lentas serán las ejecuciones de datos. Reducir la complejidad puede ser un desafío, pero puede tener un gran impacto en el tiempo de ejecución de los datos.

Reduzca la complejidad de las declaraciones SQL siempre que sea posible, consulte Consejos para escribir SQL .
Reduce los datos del modelo de datos a los datos necesarios para el análisis de datos. Debe eliminarse cualquier tabla o columna que no sea necesaria para el análisis de datos.
Si utilizas un modelo BPMN de importación para mostrar el proceso, mantener bajo el número de actividades y aristas mejorará el rendimiento.

Rendimiento del panel

En general, los tiempos de carga del panel se ven afectados por la cantidad de datos utilizados por los gráficos y las métricas que se calculan.

Cada vez que se carga un panel en Process Mining, cada gráfico se calcula en paralelo. La velocidad de carga de un gráfico se ve afectada por los siguientes factores:

El número de métricas mostradas en el gráfico.
Para cada métrica, el tamaño de unión requerido para calcular la métrica es importante. Esto viene determinado por la tabla utilizada para agrupar un gráfico, combinada con la tabla de la métrica.
- La complejidad de la relación entre esas dos tablas.
- La distancia entre estas dos tablas en el modelo de datos.
El tipo de datos de los campos utilizados. Los campos numéricos son más rápidos que los campos de texto.
La complejidad de las métricas en sí. Las métricas pueden basarse en varios campos.

Cómo mejorar el rendimiento del panel

Eliminar cualquier métrica que no sea necesaria para un gráfico acelerará el tiempo de carga.

Ten en cuenta los KPI que se muestran en la barra superior;
Ten en cuenta las métricas que se muestran en tus gráficos. Si un gráfico muestra varias métricas, cada una de ellas añade tiempo de cálculo adicional.

Simplificar la definición de métricas también puede acelerar el tiempo de carga del gráfico.

Considere si puede simplificar la definición de métricas;
Considera precalcular partes de la métrica en las transformaciones de datos. Cualquier cálculo estático que ya se haya realizado antes, no es necesario hacerlo en tiempo de ejecución.

En esta página