- 发行说明
- 在开始之前
- 入门指南
- 集成
- 使用流程应用程序
- 创建应用程序
- 正在加载数据
- 自定义流程应用程序
- 发布流程应用程序
- 应用程序模板
- 其他资源
Process Mining
Structure of transformations
输入步骤用于加载原始数据。 通常会执行以下操作,为下一个转换步骤准备数据:
- 选择具有可选宏和必选宏的字段。 使用可选宏时,原始数据中不需要存在字段。
- 将字段类型 转换为适当的数据类型。
-
在转换的早期筛选 表以减少数据大小。
在“实体”步骤中,输入表将转换为实体表。 预期事件所需的每个实体都应具有自己的表格。 请参阅设计事件日志。 此外,也可以在此处定义支持实体。
Invoices_input
、 Invoice_types_input
和Customers_input
联接在一起以创建实体表 Invoices。
创建实体表时,请遵循以下准则。
- 有一个实体 ID 字段,该字段对于每个数据记录都是唯一的。
- 数据分析所需的所有实体字段均已存在。
- 所有实体字段都具有易于理解的名称。
Invoice_ID
字段与发票实体相关联。
并非所有输入表都转换为实体表。 此外,其他输入表可能包含相关信息,例如示例中的“客户”表。 在实体步骤中将它们定义为单独的表格可能会很方便,以便可以在数据转换中重用它们。
3. events
。
在此转换步骤中,将为每个实体创建事件表。 请参阅设计事件日志。 事件表中的每条记录代表发生的一个事件。 关于数据的结构化方式,有两种情况:
- 时间戳字段: 实体表上具有事件时间戳的字段。 例如,
Invoices
表中的Invoice_created
字段。 - 事务日志:事件列表。
根据数据的结构,用于创建事件表的转换会有所不同。
在这种情况下,时间戳字段的值必须转换为事件表中的单独记录。 以下示例是包含三个时间戳字段的发票表格。
每个时间戳字段用于创建单独的事件表。 对于时间戳字段包含值的每条记录,请创建一个表格,其中包含发票 ID、事件名称(活动)和事件发生的时间戳(事件结束)。
Invoices_input table
分为Invoice_events_Create_invoice
、 Invoice_events_Delete_invoice
和Invoices_events_Change_invoice_price
。
Invoices_events
。
如果事件存储在事务日志中,则应标识每个实体的相关事件。 为每个实体创建一个表,并存储相应的实体 ID、事件名称 (Activity) 以及事件发生的时间戳 (Event end)。
在以下示例中,事务日志包含 采购订单 和 发票 实体的事件。
在事件表中,以下字段为必填字段。 事件表中的所有记录都应包含这些字段的值。
字段 |
描述 |
---|---|
实体 ID |
发生事件的实体的 ID。 例如, 发票 ID。 |
活动 |
该活动描述了对实体执行的操作。 |
Event end |
“事件结束”字段指示特定事件的完成时间。 理想情况下,这应该是日期时间字段,而不是日期。 |
当一个流程中涉及多个实体时,所有实体的事件都需要链接到在流程中被视为“案例”的主要实体。 有关详细信息,请参阅定义事件日志。 以下步骤描述了如何将所有事件与主要实体相关联,以及如何将它们组合到单个事件日志中。
创建“实体关系”表以集中所有实体之间的关系。 此实体关系表将包含相关实体的 ID 字段。
要创建实体关系表,请根据 ID 字段联接所有实体表:
- 从主要实体开始
- 使用左联接将相关实体联接到主实体。
- 如果实体与主实体不直接相关,则将实体左联接到已联接到主实体的相关实体。
在以下示例中,存在三个实体: 采购订单、发票行和 发票。 采购订单 被视为流程中的主要实体。 发票行 直接链接到 采购订单 , 发票 通过 发票行间接链接。
以下是生成的实体关系表。
在最后一个转换步骤中,根据需要添加业务逻辑以进行数据分析。 可以在此处将其他派生字段添加到现有表格中。 例如,在仪表板的 KPI 中使用的特定吞吐量时间或布尔值字段。
Tags
和Due dates
。
标签是案例的属性,表示某些业务规则。 通常添加标签是为了便于分析这些业务规则。 例如:
- 由同一人支付和批准的发票。
- 发票审批时间超过 10 天。
- 已跳过检查发票活动。
标签表中的每条记录都代表特定案例的数据中出现的一个标签。 此表格的必填字段为“案例 ID”和“标签”。 并非所有案例都有标签,有些案例可能有多个标签。 以下是“标签”表格示例。