Process Mining
最新
False
横幅背景图像
Process Mining
上次更新日期 2024年4月17日

性能特征

Process Mining 应用程序的响应时间由许多因素决定。 但是,通常遵循以下原则:

  • 数据越少,执行速度就越快

在“Process Mining”中,有两个区域具有不同的性能特征:用于加载数据的数据运行和用于查看数据的仪表板

开发数据与生产数据

在 Process Mining 中,每个应用程序都有一个开发阶段和一个已发布阶段。 如果您的目标应用程序需要大型数据集,则建议使用较小的数据集来开发数据转换和仪表板。 应用程序完成后,可以使用更大的数据集将其发布给最终用户。 请参阅“开发”选项卡

一种常见场景是使用开发时间较短的数据集,例如,2 周的时间窗口内仅包含 10 万个事件。 发布时,可以使用更大的数据集,例如 12 个月。

数据运行性能

以下用例会触发 Process Mining 中的数据运行:

  • 创建应用程序

  • 上传数据

  • 触发“ 应用到 数据转换 编辑器中的仪表板”、 “全部 运行”或 “运行文件 ”。

  • 发布在数据转换中有更改的应用程序。

数据运行通常包含以下步骤,每个步骤具有不同的性能特征:

1. 上传数据

上传数据时,磁盘上上传数据的总体大小是影响速度的最重要因素。 请参阅加载数据。 影响性能的因素包括:

  • 表格数量;

  • 表格中的记录数;

  • 表格中的列数;

  • 表格中的数据。 例如,多行描述列比简单的“布尔值”列慢。

2. 转换数据

数据转换将输入数据更改为仪表板所需的数据模型。 请参阅数据转换

转换中的每个.sql文件都会运行一个附加的 SQL 查询。 以下因素会影响数据转换的速度:
  • .sql文件的数量;
  • 每个表格中的记录数;

  • 每个表格中的列数;

  • SQL 查询的复杂性:联接条件、通用表表达式 (CTE) 的数量、SQL 查询中的表达式。

3. 数据模型

数据模型决定了向仪表板公开的一组表格。 在数据运行期间,系统将运行测试以验证数据模型中这些表的结构。 但是,最耗时的部分是为加快稍后查看仪表板的速度而进行的预计算。

此步骤的总体速度由以下因素决定:

  • 数据模型中表格的数量;

  • 输出表之间的关系;

  • 输出表中的列数

  • 输出表中的记录数。

4. 流程模型

数据运行的最后一部分是运行预计算,以加快流程图的速度。

  • 变体数量;

  • 事件的数量。

如果您使用导入 BPMN 模型来显示流程,则 BPMN 模型的复杂性也会影响性能。 活动和边越多,计算就越慢。

如何提高数据运行性能

减少数据量

要提高数据上传速度,请将数据大小减少到所需的最小值。 此建议适用于数据的所有阶段:

  • 仅提取所需的输入数据;

  • 仅转换所需的数据;

  • 仅在数据分析需要时将表格添加到数据模型。

执行此操作的最简单方法通常是减少用于数据提取的时间窗口,因为这会减少大多数数据表从输入到转换再到输出的记录数。

减少数据大小越早,效率就越高:

  • 在数据转换中(如有可能,在数据提取中)尽早筛选sql文件。
  • 对于开发,通常使用较小的数据集,以加快测试查询的速度,请参阅开发数据与生产数据

减少数据表和列

此外,请注意仅加载实际使用的列。 在流程中越早将其排除在外越好。

  • 根据需要减少提取的数据列集。

  • 删除输出数据模型不需要的任何.sql文件。
  • 删除查询中任何不必要的数据列。

  • 从事件集中删除任何不必要的活动。

降低复杂性

数据转换和数据模型中的计算越复杂,数据运行的速度就越慢。 降低复杂性可能是一项挑战,但可能会对数据运行时产生重大影响。

  • 尽可能降低 SQL 语句的复杂性,请参阅有关编写 SQL 的提示

  • 将数据模型中的数据减少到数据分析所需的数据。 应删除数据分析不需要的任何表格或列。

  • 如果您使用导入 BPMN 模型来显示流程,则保持较低的活动和边线数量将提高性能。

仪表板性能

通常,仪表板加载时间受图表和计算的指标使用的数据量的影响。

每次在 Process Mining 中加载仪表板时,都会并行计算每个图表。 加载图表的速度受以下因素影响:

  • 图表中显示的指标数量。

  • 对于每个指标,计算指标所需的联接大小很重要。 这由用于对图表进行分组的表格与指标的表格结合确定。

    • 这两个表之间关系的复杂性。

    • 数据模型中这两个表之间的距离。

  • 所用字段的数据类型。 数字字段比文本字段更快。

  • 指标本身的复杂性。 指标可以基于多个字段。

如何提高仪表板性能

删除图表不需要的任何指标将加快加载时间。

  • 考虑顶部栏中显示的 KPI;

  • 考虑图表中显示的指标。 如果图表显示多个指标,则每个指标都会增加额外的计算时间。

简化指标的定义还可以加快图表加载时间。

  • 考虑是否可以简化指标定义;

  • 考虑在数据转换中预计算部分指标。 之前已经完成的任何静态计算都不需要在运行时完成。

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.