- 发行说明
- 入门指南
- 安装
- 配置
- 集成
- 身份验证
- Working with Apps and Discovery Accelerators
- AppOne 菜单和仪表板
- AppOne 设置
- TemplateOne 1.0.0 菜单和仪表板
- TemplateOne 1.0.0 设置
- TemplateOne menus and dashboards
- TemplateOne 2021.4.0 设置
- Purchase to Pay Discovery Accelerator 菜单和仪表板
- 购买到付款 Discovery Accelerator 设置
- Order to cash Discovery Accelerator 菜单和仪表板
- “订单到现金” Discovery Accelerator 设置
- Basic Connector for AppOne
- SAP Connectors
- 适用于 AppOne 的 SAP 订单到现金连接器
- 适用于 AppOne 的 SAP 采购到付款连接器
- SAP Connector for Purchase to Pay Discovery Accelerator
- SAP Connector for Order-to-Cash Discovery Accelerator
- Superadmin
- 仪表板和图表
- 表格和表格项目
- 应用程序完整性
- How to ....
- 使用 SQL 连接器
- Introduction to SQL connectors
- Setting up a SQL connector
- CData Sync extractions
- Running a SQL connector
- Editing transformations
- 释放 SQL 连接器
- Scheduling data extraction
- Structure of transformations
- Using SQL connectors for released apps
- Generating a cache with scripts
- Setting up a local test environment
- Separate development and production environments
- 实用资源
Process Mining
在应用程序中使用分片
分片是一种创新解决方案,可用于提高流程挖掘应用程序的性能。 简而言之,分片会将事件日志中的数据划分为称为“分片”的较小部分。 每个分片越小,速度就越快。
使用分片,最终用户只需考虑他们感兴趣的数据的适用部分。 当用户登录应用程序时,将仅加载适用的数据分片。
分片可分为两种不同的类型:
- 常规分片,其中包含详细级别的部分数据。
- 基准分片,其中包含所有数据的聚合高级视图。
存在多种用于创建常规分片和基准分片的技术。 可以通过根据用例属性拆分数据来创建常规分片。 基准分片合并所有分片的数据。 通常,使用预聚合、筛选或抽样来降低数据的详细信息级别。
分片属性的一个示例可以是公司代码,其中每个分片都包含属于单个公司代码的所有案例。 如果您的数据集中有 10 个公司代码,则每个分片的速度将比原始分片快约 10 倍(假设拆分相等)。
请参见下图。
即使在使用分片时,您也可以为 ETL 使用单个连接器。 为此,您可以设置应用程序模块,每个要创建的分片使用一个模块。
在连接器中,添加一个系统表,并将表作用域设置为“当前用户”,以获取 ActiveApplicationCode,该代码指示当前处于活动状态的模块。 您可以使用系统表中的此属性为数据加载创建条件。
示例
使用案例类型应用分片时,请根据 ActiveApplicationCode 属性设置表达式Case_Type_Shard ,以确定哪种案例类型属于哪个应用程序代码。 然后,在 case_base 表中,将联接条件设置为:
Cases_preprocessing where Case_type_Shard = Case_type
这可确保仅在最终输出中传递案例类型属于当前分片的案例。
events_preprocessing
表中,为cases_base
表创建一个查找表达式,以检查案例是否在所选分片中。
请参见下图。
在 events_base 表的联接条件中将此表达式属性与以下表达式一起使用:
Events_preprocessing where Case_in_shard
。
要设置应用程序以进行分片,您还需要每个分片一个模块。 这些模块的模块代码必须与连接器中的模块代码相同。
此外,根据您使用的基准分片类型,常规分片和基准分片的数据结构可能有所不同。 在这种情况下,您需要为基准分片使用单独的应用程序。
由于您正在使用多个模块,因此需要使用脚本重新加载数据,以确保所有连接器模块的数据最终都位于同一数据集中。 这样,应用程序可以根据打开的模块知道要考虑的数据部分。 有关用于重新加载数据的脚本,请参见 设置自动数据刷新 。