Process Mining - 数据量

process-mining

2021.10

true

Process Mining 用户指南

发行说明
- 2024
  - 2021.10.4
- 2022
- 2021 年
入门指南
- 关于 Process Mining 的信息
- UiPath Process Mining 简介
- 用户角色
- UiPath Process Mining 组件
- 平台架构
  - 服务器架构
  - 集成选项
- 从数据到仪表板
- App and Discovery Accelerator development
安装
- 硬件和软件要求
- 服务器安装
- 更新许可证
- 部署应用程序和发现加速器
- 部署 UiPath Process Mining Profiler
- 部署连接器
- 更新 UiPath Process Mining
- 更新应用程序或发现加速器的自定义版本
- 安装训练环境
配置
- Server configuration
- 使用 Git 存储库
- 为开发者创建帐户
  - 双重身份验证
- 备份
- 关于遥测
- 设置审核日志
  - 类别详细信息
集成
- 设置与 UiPath Automation Hub 的集成
- Set up Actionable Insights
身份验证
- 通过 Azure Active Directory 设置单点登录
- 通过集成的 Windows 身份验证设置单点登录
- 为 Microsoft Active Directory 设置通过 SAML 的单点登录
  - Configuring ADFS
- Adding Superadmin AD Groups
- Adding End-user AD Groups
- 设置 LDAP
- 双重身份验证
- 设置凭据存储区
  - 设置 Azure 密钥保险库凭据存储
  - 使用凭据存储
Working with Apps and Discovery Accelerators
- 使用图表
- 使用流程图
- • 将自动化概念发送到 UiPath Automation Hub
- 筛选条件
- Favorites
- 导出
- Selecting the preferred language
AppOne 菜单和仪表板
- Introduction to AppOne
- 分析 AppOne 中的数据
- AppOne 中的菜单和仪表板概述
- 菜单概述
- Menu Process
- Menu Timing
  - Timing - Timing
  - 时间 - 截止日期
- Menu Conformance
- Menu Users
- Menu Details
AppOne 设置
- Input tables of AppOne
TemplateOne 1.0.0 菜单和仪表板
- TemplateOne menus and dashboards
- 菜单概述
- 菜单分析
- 菜单效率
  - Efficiency - Automation
- 菜单合规性
  - Compliance - Tags
  - 合规性 - 截止日期
- Menu Details
TemplateOne 1.0.0 设置
- TemplateOne 入门
- Steps to roll-out TemplateOne 1.0.0
- Input tables of TemplateOne 1.0.0
- Adding custom attributes
- Configuring the context bar
TemplateOne menus and dashboards
- TemplateOne menus and dashboards
- 菜单概述
- 菜单分析
- 菜单效率
  - Efficiency - Automation
- 菜单合规性
  - Compliance - Tags
  - 合规性 - 截止日期
- Menu Details
TemplateOne 2021.4.0 设置
- TemplateOne 入门
- Steps to roll-out TemplateOne
- Input tables of TemplateOne
  - Input tables of TemplateOne 2021.4.0
- Loading data into TemplateOne
Purchase to Pay Discovery Accelerator 菜单和仪表板
- Purchase-to-Pay Discovery Accelerator 简介
- Analyzing data with Purchase-to-Pay Discovery Accelerator
- 菜单和仪表板概述
- 菜单概述
  - Overview - Procurement
  - 概览 - 应付账款
- Menu Procurement
- 菜单应付账款
- 菜单效率
- 菜单合规性
- Menu Details
购买到付款 Discovery Accelerator 设置
- Purchase-to-Pay Discovery Accelerator 输入表
  - Purchase-to-Pay Discovery Accelerator 21.10 输入表
  - Purchase-to-Pay Discovery Accelerator V. 21.4 输入表
- 添加自动化预计值
Order to cash Discovery Accelerator 菜单和仪表板
- Introduction to Order-to-Cash Discovery Accelerator
- 菜单和仪表板概述
- 菜单概述
- 菜单分析
  - 分析 - 端到端
  - Analysis - Deviations
- 菜单效率
  - Efficiency - Automation
  - 效率 - 客户
- Menu Details
  - Details - End to end
“订单到现金” Discovery Accelerator 设置
- Order-to-Cash Discovery Accelerator 的输入表
  - Order-to-Cash Discovery Accelerator V21.4.1 的输入表
  - Input tables of the Order-to-Cash Discovery Accelerator 21.4
- 添加自动化预计值
Basic Connector for AppOne
- 部署基本连接器
- 基本连接器简介
- 基本连接器的输入表
- 正在加载数据
  - 映射属性
  - 清理输入数据
- 添加标签
- 添加自动化预计值
- 添加截止日期
- 添加参考模型
- 设置 Actionable Insights
- 设置可折叠图表
- 在 AppOne 中使用输出数据集
- Output tables of the Basic Connector
SAP Connectors
- Introduction to SAP Connector
- 在 SAP Connector for AppOne 中加载数据
- SAP 输入
- 检查 SAP 连接器中的数据
- 向 SAP Connector for AppOne 添加流程特定标签
- 向 SAP Connector for AppOne 添加流程特定的截止日期
- 向 SAP Connector for AppOne 添加自动化预计值
- 向 SAP Connector for AppOne 添加属性
- 向 SAP Connector for AppOne 添加活动
- 向 SAP Connector for AppOne 添加实体
适用于 AppOne 的 SAP 订单到现金连接器
- Order-to-Cash Process in UiPath Process Mining
  - “订单到收款”流程中的角色
- Introduction to SAP Order-to-Cash Connector for AppOne
  - 实体
  - Activities (活动)
- SAP Order-to-Cash Connector for AppOne 的输入数据
- Other settings
- 可选属性
- Order-to-Cash 标签
- 订单到收款到期日期
- Order-to-Cash Reference models
适用于 AppOne 的 SAP 采购到付款连接器
- UiPath Process Mining 中的“购买到付款”流程
  - 采购到付款流程中的角色
- Introduction to SAP Purchase-to-Pay Connector for AppOne
  - 实体
  - Activities (活动)
- SAP Purchase-to-Pay Connector for AppOne 的输入数据
- Other settings
- 购买到付款标签
- 采购到付款到期日期
SAP Connector for Purchase to Pay Discovery Accelerator
- SAP Connector for Purchase-to-Pay Discovery Accelerator 简介
  - 实体
  - Activities (活动)
- Input Data of the SAP Connector for Purchase-to-Pay Discovery Accelerator
- Configuring the SAP Connector for Purchase-to-Pay Discovery Accelerator
- 配置活动代码
SAP Connector for Order-to-Cash Discovery Accelerator
- Introduction to SAP Connector for Order-to-Cash Discovery Accelerator
  - 实体
  - Activities (活动)
- SAP Connector for Order-to-Cash Discovery Accelerator 的输入数据
- Configuring the SAP Connector for Order-to-Cash Discovery Accelerator
Superadmin
- 超级管理员页面
- 协作开发
  - 工作区冲突
  - 提交
- 创建版本
- 查看分支历史记录
- Creating Apps
- Modules
仪表板和图表
- 创建仪表板
- Adding charts on a dashboard
- HTML 面板
- 流程图
- 旧版图表
  - 向仪表板添加比较期间筛选器
- 将旧图表迁移到新图表
表格和表格项目
- 连接字符串表
  - 连接字符串类型
  - 表格作用域
- 联接表格
- 全局表
- 表格项目简介
- 数据源属性
  - 属性选取器
  - 向应用程序或发现加速器添加新属性
- 指标
- 筛选条件
- 显示格式
- 表达式
- Maps
- 操作
应用程序完整性
- 维护应用程序完整性
- 应用程序问题
  - 查找应用程序问题
  - 解决应用程序问题
- 应用程序分析
  - 剖析分析
  - 分析示例
How to ....
- Rebrand and restyle Apps and Discovery Accelerators
- 翻译应用程序
- 在应用程序中使用分片
- 使用通用脚本数据源
  - Example: Creating a Python Script
  - Example: Creating an R Script
- 创建匿名数据集
- 设置本机 SAP 提取
  - 在 SAP 系统上安装 Z_XTRACT_IS_TABLE 功能模块
- 设置自动化数据刷新
- 使用访问矩阵启用基于角色的数据访问
使用 SQL 连接器
- Introduction to SQL connectors
- Setting up a SQL connector
- CData Sync extractions
- Running a SQL connector
- Editing transformations
- 释放 SQL 连接器
- Scheduling data extraction
- Structure of transformations
- Using SQL connectors for released apps
- Generating a cache with scripts
- Setting up a local test environment
- Separate development and production environments
实用资源
- 故障排除
- 性能
  - Data Volume
  - Data Loading
  - 系统资源
  - Application Design
  - Connector Data Model Design
  - Internet Connections
- 安全性

重要 :

请注意，此内容已使用机器翻译进行了部分本地化。新发布内容的本地化可能需要 1-2 周的时间才能完成。

Data Volume

简介

数据量将始终与性能直接权衡。流程挖掘天生就痴迷于构建流程图的细节。

但是，拥有所有这些唯一时间戳会影响性能。通常，所有流程挖掘工具和所有内存工具都存在理论限制。

用户类型

我们明确区分了用于应用程序和连接器的数据的性能。尽管它们使用相同的平台，但还是存在一些差异，即用户（开发者与最终用户）可以接受的内容以及所执行的操作类型。

大量数据可能会影响连接器和应用程序，但所有问题都可以在连接器中解决。

Data Volume

最终用户将体验到的性能与数据量直接相关。数据量取决于最大表格中的行数。通常，只有行数决定最终用户的性能体验。列数只是从数据库加载数据时的一个因素。

每个流程包含大约 5000000 (5M) 个用例和最多约 50000000 (50M) 个事件的流程是理想的选择。随着用例和事件的增加，解析数据和显示可视化效果的时间将更长。

UiPath Process Mining平台将继续工作，但当插入大量数据时，反应速度可能会下降。建议您首先检查数据量。如果超过上述数量，则建议您考虑优化或限制数据集。

详细级别

详细程度越高，响应时间就越长，这会影响性能。

需要与最终用户讨论数据量、详细程度和等待时间之间的确切权衡。有时历史数据可能非常重要，但通常只需要过去几年的数据。

另一个因素是列中具有的唯一值。UiPath Process Mining使用专有方法将*.mvn文件的大小减至最小。这非常适用于相似的值。属性的大量唯一值也会影响性能，例如事件详细信息。

Solutions (解决方案)

处理大数据量有两个主要的解决方案方向：

优化；
数据最小化。

优化涉及超级管理员可以进行的调整，以使仪表板更快地呈现，这可以通过为特定数据集定制应用程序设置来实现（有关更多信息，请参阅应用程序设计）。

本节介绍数据最小化，这些技术是针对特定业务问题量身定制的，可用于减少最终用户可见的数据。

此处描述的技术可以并存，甚至可以组合使用以利用多种技术的优势。此外，您可以将未进行数据最小化的应用程序与最小化的应用程序一起保留，因为在可以接受较低性能的情况下，有时可能需要特定的详细级别。

数据作用域

限制将显示在游览数据集中的记录数量不仅可以提高应用程序的性能，还可以提高流程的可理解性，从而提高企业的接受度。

您可以在“连接器”中完成数据作用域的设定。

作用域限定选项之一是通过筛选出日期或期间来限制要查看的时间范围。例如，您可以将时间范围从 10 年限制为一年。或从 1 年到 1 个月。请参见下图。

建议进行有限数量的活动，尤其是在开始任何流程挖掘工作时。随着专业知识的增加，您可以从那里开始构建。

以下是活动范围的指南：

范围（活动数量）	描述
5-20	开始使用 Process Mining 时的首选范围。提供见解信息的简单流程。
20-50	专家范围。使用明确的变体进行扩展。
50-100	如果存在明确的变体，则最有用。这意味着有些相关的流程，但主要是独立的流程。
100+	建议拆分为子流程。

备注：

筛选出活动将简化您的流程并更易于理解。请注意，您也可能会丢失信息或详情。

以下是有关筛选数据的一些建议：

不相关的活动：可以筛选出不直接影响流程的活动。
次要活动：某些活动（即变更活动）可以在流程中的任何位置发生。这些显着增加了许多变体。
最少发生的事件：可以筛选出在数据集中仅发生几次的事件。
较小的流程：仅分析子流程。
对活动进行分组：数据集中的某些活动可能更像是小任务，它们共同表示对业务更有意义的活动。对它们进行分组需要在连接器中使用一些逻辑，并且可能会导致活动重叠。
如有可能，在连接器的性能内，使用连接器筛选出活动。这样，您可以轻松地还原任何更改，或者重新添加活动。避免在数据提取或数据加载中筛选出活动。

删除异常值

如果某个案例包含大量事件（异常值），则会影响一些在事件级别计算汇总的表达式。“自/至”仪表板项目筛选器受此影响，如果有这些异常值，则计算起来可能非常耗时。建议在连接器中筛选出这些案例，以将其从数据集中提取。

备注：

这确实会影响指标。您应该仅根据业务用户删除异常值。

关注异常值

在其他情况下，异常值可能是需要关注的关键领域。如果您的流程进展顺利，或者您采用了六西格码方法，则您需要专注于出现问题的地方。您不会显示所有正确的案例，而是仅显示错误的案例。

请参见下图。

减小数据集的大小

在连接器中，您可以删除包含大量详细信息的属性。例如， “事件详细信息”属性中包含的长字符串。

开发完成后，数据集中可能会出现大量未使用的属性。建议仅将连接器输出数据集中使用的属性的可用性设置为公开。将其他属性的可用性设置为私有（私有）。

预聚合

预聚合是许多 BI 工具用来深入了解大数据量的一种技术。它涉及聚合特定属性的数据，以减少数据集中的记录数量。在 BI 中，这通常是对每个供应商的价值求和，因此每个供应商只有一个记录。

请参见下图。

流程挖掘需要更多配置，但起点是仅聚合流程变体。对于每个变体，您将拥有一个案例记录和相关数量的事件。这可以显着减少数据量。

要显示正确的结果，您还必须显示每个变体代表的记录数，对于事件结束，您可以使用每个事件的中间持续时间。仅使用变体进行聚合可能会太高，因此最好检查最常用的筛选条件，例如变体、案例类型和案例结束月份的组合（以显示一段时间内的趋势）。

但是，添加属性会对记录数产生二次影响，因此需要在性能和用例之间谨慎平衡。

预聚合最适用于概览流程和发现一般趋势。

抽样

抽样是一种技术，您可以在特定时间段内获取一定百分比的案例及其事件。例如，您可以设置仅显示所有案例及其事件的 10%。这样，您仍然会遇到异常或异常值，因为每个案例在数据集中出现的机会相似。

请参见下图。

级联采样

级联采样是一种采样百分比随时间下降一定百分比的技术。例如，显示上周的 100%、两周前的 90%、三周前的 80% 等。

数据分片

数据分片是数据作用域解决方案的一项技术，它允许组织将数据拆分为多个数据集，而不仅仅是分割一个部分。此设置确实需要其他配置，因为需要使用模块拆分应用程序，并且需要从连接器导出多个较小的数据集。

通过数据分片，原始数据集分为多个分片。每个分片越小，速度就越快。当用户登录应用程序时，将仅加载适用的数据分片。

典型的分片单位是“公司代码”或“部门” 。例如，如果有 50 个公司代码，则每个分片将包含一个公司代码，并且基本上比原始数据集快 50 倍左右。

有关分片的概述，请参见下图。

此页面有帮助吗？

前一个性能

下一个Data Loading

简介​

用户类型​

Data Volume​

详细级别​

Solutions (解决方案)​

数据作用域​

删除异常值​

关注异常值​

减小数据集的大小​

预聚合​

抽样​

级联采样​

数据分片​

此页面有帮助吗？

简介

用户类型

Data Volume

详细级别

Solutions (解决方案)

数据作用域

删除异常值

关注异常值

减小数据集的大小

预聚合

抽样

级联采样

数据分片