- 发行说明
- 在开始之前
- 入门指南
- 集成
- 使用流程应用程序
- 创建应用程序
- 正在加载数据
- 自定义流程应用程序
- 应用程序模板
- 其他资源

Process Mining
流程应用程序的转换包含一个 dbt 项目。 下面是 dbt 项目文件夹内容的说明。
|
文件夹/文件 |
包含 |
|---|---|
|
|
pm_utils包及其宏。
|
|
|
运行 dbt时创建的日志。 |
|
|
自定义宏。 |
|
|
.sql文件,用于定义转换。
|
|
|
.yml文件,用于定义数据测试。
|
|
|
.csv包含配置设置的文件。
|
|
|
dbt项目的设置。 |
请参见下图。
models\目录的.sql文件中定义。 数据转换组织在一组标准的子目录中:
1_input,2_objects,3_events,4_event_logs,5_business_logic。
查看转换结构。
.sql文件以 Jinja SQL 编写,允许您在普通 SQL 查询中插入 Jinja 语句。 当 dbt 运行所有.sql文件时,每个.sql文件都会在数据库中生成一个新视图或新表。
.sql文件具有以下结构:
-
With 语句:一个或多个 with 语句,用于包含所需的子表。
{{ ref(‘My_table) }}引用由另一个 .sql 文件定义的表 文件。{{ source(var("schema_sources"), 'My_table') }}引用输入表。
- 主查询:定义新表的查询。
-
最终查询:通常在最后使用
Select * from table等查询。 这样可以在调试时轻松进行子选择。
有关如何有效编写转换的更多提示,请参阅编写 SQL 的提示
Adding source tables
models\schema\sources.yml中列出。 这样,其他模型就可以使用{{ source(var("schema_sources"), 'My_table') }}引用它。 下图显示了一个示例。
sources.yml中列出每个新的源表。
有关更详细信息,请参阅有关 来源 的 官方 dbt 文档 。
Data output
数据转换必须输出相应应用程序所需的数据模型;每个预期的表格和字段都必须存在。
如果要向流程应用程序添加新字段,可以在转换中添加这些字段。
宏可以轻松地重用常见的 SQL 结构。 有关详细信息,请参阅有关 Jinja 宏的官方 dbt 文档。
pm_utils
pm_utils.optional()宏的 Jinja 代码示例。
csv文件,用于将数据表添加到转换。 有关详细信息,请参阅有关 Jinja 种子的官方 dbt 文档。
在 Process Mining中,这通常用于在转换中轻松配置映射。
编辑种子文件后,通过选择“运行文件”或“运行全部”来运行文件,以更新相应的数据表。
有关种子文件的使用示例,请查看活动配置。
Activity configuration
activity_configuration.csv文件用于设置与活动相关的其他字段。 当两个事件在相同时间戳发生时, activity_order将用作决定性因素。 下图显示了一个activity_configuration.csv文件的示例。
sources.yml中的测试。 这样做是为了检查输入数据的格式是否正确。
数据转换用于将输入数据转换为适合Process Mining的数据。 Process Mining中的转换将写入dbt项目。
本页介绍dbt 。 有关更详细信息,请参阅官方 dbt 文档。
pm-utils package
Process Mining应用程序模板附带一个名为pm_utils的dbt包。 此pm-utils包包含用于 Process Mining dbt项目的实用工具函数和宏。 有关pm_utils的更多信息,请参阅ProcessMining-pm-utils 。
更新用于应用程序模板的 pm-utils 版本
pm-utils 包。
pm-utils 包的新版本时,建议您更新转换中使用的版本,以确保使用 pm-utils 包的最新函数和宏。
pm-utils 包的最新版本的版本号。
pm-utils 版本。
-
下载
pm-utils版本中的源代码 (zip)。 -
提取
zip文件并将文件夹重命名为pm_utils 。 -
从内联的数据转换编辑器导出转换并提取文件。
-
将导出的转换中的pm_utils文件夹替换为新的pm_utils文件夹。
-
再次压缩转换的内容,并将其导入到数据转换编辑器中。