process-mining
2023.10
true
重要 :
请注意此内容已使用机器翻译进行了部分本地化。
Process Mining
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 2024年8月14日

性能特征

Process Mining 应用程序的响应时间由许多因素决定。 但是,通常遵循以下原则:

  • 数据越少,执行速度就越快

在“Process Mining”中,有两个区域具有不同的性能特征:用于加载数据的数据运行和用于查看数据的仪表板

开发数据与生产数据

在 Process Mining 中,每个流程应用程序都有一个开发阶段和一个已发布阶段。 如果您的目标应用程序需要大型数据集,则建议使用较小的数据集(少于 1000 万条记录)来开发数据转换和仪表板。

开发数据集用于测试数据转换。 它不会影响已发布流程应用程序的仪表板中显示的数据。 一旦您的应用程序准备好供业务用户使用,您就可以发布应用程序并提取新数据以在已发布的流程应用程序中使用。

一种常见场景是使用开发时间较短的数据集,例如,2 周的时间窗口内仅包含 10 万个事件。 发布时,可以使用更大的数据集,例如跨度为 12 个月的数据集。

数据运行性能

以下用例会触发 Process Mining 中的数据运行:

  • 创建应用程序

  • 上传数据

  • 触发“ 应用到 数据转换 编辑器中的仪表板”、 “全部 运行”或 “运行文件 ”。

  • 发布在数据转换中有更改的应用程序。

数据运行通常包含以下步骤,每个步骤具有不同的性能特征:

1. 上传数据

上传数据时,磁盘上上传数据的总体大小是影响速度的最重要因素。 请参阅加载数据。 影响性能的因素包括:

  • 表格数量;

  • 表格中的记录数;

  • 表格中的列数;

  • 表格中的数据。 例如,多行描述列比简单的“布尔值”列慢。

2. 转换数据

数据转换将输入数据更改为仪表板所需的数据模型。 请参阅数据转换

转换中的每个.sql文件都会运行一个附加的 SQL 查询。 以下因素会影响数据转换的速度:
  • .sql文件的数量;
  • 每个表格中的记录数;

  • 每个表格中的列数;

  • SQL 查询的复杂性:联接条件、通用表表达式 (CTE) 的数量、SQL 查询中的表达式。

3. 数据模型

数据模型决定了向仪表板公开的一组表格。 在数据运行期间,系统将运行测试以验证数据模型中这些表的结构。 但是,最耗时的部分是为加快稍后查看仪表板的速度而进行的预计算。

此步骤的总体速度由以下因素决定:

  • 数据模型中表格的数量;

  • 输出表之间的关系;

  • 输出表中的列数

  • 输出表中的记录数。

4. 流程模型

数据运行的最后一部分是运行预计算,以加快流程图的速度。

  • 变体数量;

  • 事件的数量。

如果您使用导入 BPMN 模型来显示流程,则 BPMN 模型的复杂性也会影响性能。 活动和边越多,计算就越慢。

如何提高数据运行性能

减少数据量

要提高数据上传速度,请将数据大小减少到所需的最小值。 此建议适用于数据的所有阶段:

  • 仅提取所需的输入数据;

  • 仅转换所需的数据;

  • 仅在数据分析需要时将表格添加到数据模型。

执行此操作的最简单方法通常是减少用于数据提取的时间窗口,因为这会减少大多数数据表从输入到转换再到输出的记录数。

减少数据大小越早,效率就越高:

  • 在数据转换中(如有可能,在数据提取中)尽早筛选sql文件。
  • 对于开发,通常使用较小的数据集,以加快测试查询的速度,请参阅开发数据与生产数据

减少数据表和列

此外,请注意仅加载实际使用的列。 在流程中越早将其排除在外越好。

  • 根据需要减少提取的数据列集。

  • 删除输出数据模型不需要的任何.sql文件。
  • 删除查询中任何不必要的数据列。

  • 从事件集中删除任何不必要的活动。

降低复杂性

数据转换和数据模型中的计算越复杂,数据运行的速度就越慢。 降低复杂性可能是一项挑战,但可能会对数据运行时产生重大影响。

  • 尽可能降低 SQL 语句的复杂性,请参阅有关编写 SQL 的提示

  • 将数据模型中的数据减少到数据分析所需的数据。 应删除数据分析不需要的任何表格或列。

  • 如果您使用导入 BPMN 模型来显示流程,则保持较低的活动和边线数量将提高性能。

仪表板性能

通常,仪表板加载时间受图表和计算的指标使用的数据量的影响。

每次在 Process Mining 中加载仪表板时,都会并行计算每个图表。 加载图表的速度受以下因素影响:

  • 图表中显示的指标数量。

  • 对于每个指标,计算指标所需的联接大小很重要。 这由用于对图表进行分组的表格与指标的表格结合确定。

    • 这两个表之间关系的复杂性。

    • 数据模型中这两个表之间的距离。

  • 所用字段的数据类型。 数字字段比文本字段更快。

  • 指标本身的复杂性。 指标可以基于多个字段。

如何提高仪表板性能

删除图表不需要的任何指标将加快加载时间。

  • 考虑顶部栏中显示的 KPI;

  • 考虑图表中显示的指标。 如果图表显示多个指标,则每个指标都会增加额外的计算时间。

简化指标的定义还可以加快图表加载时间。

  • 考虑是否可以简化指标定义;

  • 考虑在数据转换中预计算部分指标。 之前已经完成的任何静态计算都不需要在运行时完成。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。