- 在开始之前
- 管理访问权限
- 入门指南
- 集成
- 使用流程应用程序
- 创建应用程序
- 正在加载数据
- Transforming data
- 自定义仪表板
- 发布仪表板
- 应用程序模板
- 通知
- 其他资源

Process Mining 用户指南
发现流程模型
简介
发现流程可以更好地了解流程结构。高级流程挖掘技术称为概率 Intractive Miner (PIM),可以通过分析整个事件日志自动识别并行发生、决策的一部分或更复杂循环的一部分的活动。考虑到可以执行任务的不同方式及其发生频率,这为流程在实践中的实际展开方式创建了灵活且真实的表示。在复杂的环境中,这种方式特别有用,因为在这些环境中,流程并不总是以严格定义的方式遵循。
创建流程应用程序时,可以选择“发现流程模型”作为“Process mining 类型”。查看创建新应用程序向导以了解更多信息。
算法
PIM 算法的工作原理是,以递归方式将事件日志中的活动集划分为更小的子集,直到只留下单个活动。然后,它每次都会尝试找到这些子集之间的最佳拟合关系。这些定义流程的结构和行为的关系称为流程语义。
PIM 在以下递归阶段工作:
- 直接关注流程模型:总结性挖掘器首先构建“直接关注”流程模型,该模型显示了活动在事件日志中的相互关注情况。
- 剪切检测:在剪切检测步骤中,Insensitive Miner 会将流程分为两个部分,以便运算符可以描述这些部分之间的关系。该运算符用于表示剪切两部分之间的“序列”、“互斥选择”、“并行”或“循环”关系。
- 日志拆分:在此步骤中,In AWS 中,Insensitive Miner 将剪切内容中的拆分应用于事件日志,将两半的活动分成不同的事件子日志。然后,算法根据这些子日志创建新的“直接关注”流程模型,并以递归方式重复检测和拆分剪切内容的过程。但是,在继续递归之前,算法会检查一些基本用例。例如,如果子日志仅包含一个活动,则递归将停止,因为无法发现进一步的截取。
剪切检测
“剪切检测”步骤是“概率概括 Miner”的核心。PIM 为每对活动计算 0 到 1 之间的行为分数,表明它们之间行为的强度。这些分数源自“直接关注”流程模型数据中的频率。PIM 区分顺序、互斥选择、并行和循环行为。
接下来,PIM 计算剪切检测的概率。这些概率基于半场之间活动对分数的平均值。PIM 不会直接考虑每个可能的拆分并选取最佳选项,而是会直接识别概率最高的剪切。
示例
请考虑以下事件日志及其附带的“直接遵循”流程模型*。*
<A, D, E><sup>12</sup> <A, B, C, E><sup>5</sup> <A, C, B, E><sup>3</sup>

PIM 为每对活动计算以下序列行为分数。由于我们始终从 A 开始,因此 A 中每个其他活动的分数都很高。由于我们始终以 E 结尾,因此每项活动到 E 的分数都很高。
| 序列分数 | A | B | C | D | E |
|---|---|---|---|---|---|
| A | - | 0.88 | 0.88 | 0.92 | 0.95 |
| B | 0 | - | 0.22 | 0 | 0.88 |
| C | 0 | 0 | - | 0 | 0.88 |
| D | 0 | 0 | 0 | - | 0.92 |
| E | 0 | 0 | 0 | 0 | 0 |
在下一个阶段,PIM 断定两个序列拆分(A | B,C,D,E)和(A,B,C,D | E)的概率相等,并选择其中一个拆分。拆分将应用于事件日志,创建两个较小的事件日志,以递归方式分析两个日志的拆分情况。最后,PIM 识别 B 和 C 之间的并列关系,以及与 D 的选择关系。下图显示了获得的结果。
