- 发行说明
- 在开始之前
- 入门指南
- 集成
- 使用流程应用程序
- 创建应用程序
- 正在加载数据
- 自定义流程应用程序
- 发布流程应用程序
- 应用程序模板
- 其他资源
Process Mining
性能特征
Process Mining 应用程序的响应时间由许多因素决定。 但是,通常遵循以下原则:
-
数据越少,执行速度就越快
在“Process Mining”中,有两个区域具有不同的性能特征:用于加载数据的数据运行和用于查看数据的仪表板。
以下用例会触发 Process Mining 中的数据运行:
-
创建应用程序
-
上传数据
-
触发“ 应用到 数据转换 编辑器中的仪表板”、 “全部 运行”或 “运行文件 ”。
-
发布在数据转换中有更改的应用程序。
数据运行通常包含以下步骤,每个步骤具有不同的性能特征:
上传数据时,磁盘上上传数据的总体大小是影响速度的最重要因素。 请参阅加载数据。 影响性能的因素包括:
-
表格数量;
-
表格中的记录数;
-
表格中的列数;
-
表格中的数据。 例如,多行描述列比简单的“布尔值”列慢。
数据转换将输入数据更改为仪表板所需的数据模型。 请参阅数据转换。
.sql
文件都会运行一个附加的 SQL 查询。 以下因素会影响数据转换的速度:
-
.sql
文件的数量; -
每个表格中的记录数;
-
每个表格中的列数;
-
SQL 查询的复杂性:联接条件、通用表表达式 (CTE) 的数量、SQL 查询中的表达式。
数据模型决定了向仪表板公开的一组表格。 在数据运行期间,系统将运行测试以验证数据模型中这些表的结构。 但是,最耗时的部分是为加快稍后查看仪表板的速度而进行的预计算。
此步骤的总体速度由以下因素决定:
-
数据模型中表格的数量;
-
输出表之间的关系;
-
输出表中的列数
-
输出表中的记录数。
减少数据量
要提高数据上传速度,请将数据大小减少到所需的最小值。 此建议适用于数据的所有阶段:
-
仅提取所需的输入数据;
-
仅转换所需的数据;
-
仅在数据分析需要时将表格添加到数据模型。
执行此操作的最简单方法通常是减少用于数据提取的时间窗口,因为这会减少大多数数据表从输入到转换再到输出的记录数。
减少数据大小越早,效率就越高:
-
在数据转换中(如有可能,在数据提取中)尽早筛选
sql
文件。 -
对于开发,通常使用较小的数据集,以加快测试查询的速度,请参阅开发数据与生产数据。
减少数据表和列
此外,请注意仅加载实际使用的列。 在流程中越早将其排除在外越好。
-
根据需要减少提取的数据列集。
-
删除输出数据模型不需要的任何
.sql
文件。 -
删除查询中任何不必要的数据列。
-
从事件集中删除任何不必要的活动。
降低复杂性
数据转换和数据模型中的计算越复杂,数据运行的速度就越慢。 降低复杂性可能是一项挑战,但可能会对数据运行时产生重大影响。
-
尽可能降低 SQL 语句的复杂性,请参阅有关编写 SQL 的提示。
-
将数据模型中的数据减少到数据分析所需的数据。 应删除数据分析不需要的任何表格或列。
-
如果您使用导入 BPMN 模型来显示流程,则保持较低的活动和边线数量将提高性能。
通常,仪表板加载时间受图表和计算的指标使用的数据量的影响。
每次在 Process Mining 中加载仪表板时,都会并行计算每个图表。 加载图表的速度受以下因素影响:
-
图表中显示的指标数量。
-
对于每个指标,计算指标所需的联接大小很重要。 这由用于对图表进行分组的表格与指标的表格结合确定。
-
这两个表之间关系的复杂性。
-
数据模型中这两个表之间的距离。
-
-
所用字段的数据类型。 数字字段比文本字段更快。
-
指标本身的复杂性。 指标可以基于多个字段。