process-mining

latest

false

重要 :

请注意，此内容已使用机器翻译进行了部分本地化。新发布内容的本地化可能需要 1-2 周的时间才能完成。

Process Mining

适用平台：

上次更新日期 2026年3月3日

管理输入数据

您可以直接从数据转换中配置输入表，以确保输入数据满足流程应用程序的要求。“管理输入数据”设置选项允许您轻松配置现有输入表或从新上传的文件创建新的输入表。

请按照以下步骤管理输入数据设置。

在“输入”部分中，找到“表格”文件夹。
找到要管理文件的表格，然后选择上下文菜单图标以打开所选表格的“编辑表格”面板。

系统将显示“表格”页面，其中显示流程应用程序已存在的源表格。

映射和配置输入表

您上传一个或多个文件时，系统会在“源表格”部分自动为每个上传的文件添加一张新表格，并在“目标表格”部分创建相应的输入表格。默认情况下，上传文件的文件名用作表格的名称。系统将显示一条警告消息，指示需要先配置表，然后才能为表上传数据。

映射输入表

您的输入数据必须符合为应用程序定义的数据模型。如果需要，您可以将源表映射到其他目标表。

配置输入表

系统会自动检测目标输入表的设置，您只需进行检查。

请按照以下步骤编辑输入表的设置。

找到要配置的表格，然后选择“编辑表格”图标，以打开所选表格的“编辑表格”面板。
根据需要编辑设置，然后选择“保存” 。

下表描述了表格设置。

设置	描述
表格名称	数据转换中的输入表的名称。
必需	用于将表格定义为必填表格的选项。如果是`TRUE` ，则稍后在发布或导入流程应用程序时需要该表。如果未上传表格，则会引发错误。如果`FALSE` ，则在发布或导入应用程序时，该表被视为“可选” 。如果未上传表格，则系统将创建一个空表格，以便后续 SQL 查询不会失败。
自动检测	用于识别输入文件中的字段类型，并将检测到的字段类型自动应用于目标表中的相应字段。
编码	文件中使用的编码。
分隔符	分隔不同字段的分隔符。
行尾	用于表示行尾和新行尾的字符。
引号字符	Case 字段中使用的引号字符需要用引号括起来。
转义字符	用于正确解释转义字符，否则这些字符将被视为特殊控制字符（例如引号或分隔符）。注意：默认情况下，选定的引号字符将用作转义字符。或者，可以选择反斜杠 (\) 作为转义字符。
加载类型	表格的加载类型。注意：如果选择“增量”作为“加载类型” ，则必须指定其他设置才能为表格配置“增量加载”。

增量数据加载

对于完全加载，无论数据自上次加载以来是已更改还是保持不变，都将从源中提取所有数据并将其加载到目标系统中。增量加载仅提取自上次加载以来已更改（添加或更新）的数据。与完整加载相比，增量加载通常更快，而且占用的资源更少，尤其是在处理大量数据（其中只有一小部分可能会经常更改）时。

要为表启用增量数据加载，您必须将表的加载类型设置为增量。增量加载需要唯一标识符以确保正确加载数据，并需要一个字段（例如时间戳或版本）来跟踪源数据的更改。

下表描述了增量加载所需的其他设置。

设置	描述
主键	唯一标识数据源中每条记录的一个或多个主键字段。
时间戳字段	用于跟踪上次更新或添加每条记录的时间的字段。
时间戳格式	“时间戳”字段中使用的时间戳值的格式。

重要提示：

用于加载数据的提取方法可能需要额外或特定的配置才能进行增量提取。

有关如何为 CData Sync 设置增量提取的更多信息，请查看使用 CData Sync 加载数据。

查看使用 Theobald Xtract Universal 加载数据，了解有关如何为Theobald Xtract Universal设置增量提取的更多信息。

有关如何设置数据上传器以进行增量提取的更多信息，请查看 使用数据上传器加载数据 。

注意：如果您将“加载类型”切换回“完全” ，请确保相应地配置所使用的提取方法。

删除源文件

如果您在上传源数据时不小心选择了源文件，则可以从“输入数据”屏幕中将其删除。

注意：只有在没有为源文件上传任何数据时，才能删除源文件。

请按照以下步骤删除源文件。

在“源表格”列表中找到要删除的源文件。
将鼠标悬停在表格上，然后选择“删除文件” 。

输入文件已删除。

删除输入表格

您可以直接从“输入数据”屏幕的“映射表”页面中删除先前上传的输入表。删除输入表将删除流程应用程序的数据。如果要稍后在流程应用程序中使用这些数据，则必须重新上传输入表。

重要提示：删除表格可能会导致数据转换失败。

请按照以下步骤删除表格。

找到要删除的表格，然后选择“删除表格” 图标。系统会显示确认消息。
选择“删除”。

映射和配置输入字段

完成输入表配置后，您可以映射和配置表的输入字段。

在“表格” 页面中选择“下一步” 。系统将显示“字段”页面。

对于每个表格，系统会自动检测源文件中的字段并将其映射到目标表中的相应字段。

映射输入字段

您的输入数据必须符合为应用程序定义的数据模型。如有需要，您可以将“源”字段映射到其他“目标”字段。

“自动检测”选项可识别输入文件中的字段类型，并将检测到的字段类型自动应用于目标表中的相应字段。

配置输入字段

系统会自动检测目标输入字段的设置，您只需进行检查。

请按照以下步骤编辑输入字段的设置。

找到要配置的字段，然后选择“编辑字段” 图标以打开所选字段的“编辑字段”面板。
根据需要编辑设置，然后选择“保存” 。

下表描述了表格设置。

设置	描述
名称	字段的名称。注意： “名称”是必填字段。
自动检测	用于识别输入文件中的字段类型，并自动为目标表中的字段应用检测到的字段类型。
类型	字段的数据类型。文本整数小数布尔值日期 Datetime 注意：根据字段类型，您必须指定解析设置才能配置字段。
必需	用于将字段定义为必填字段的选项。如果选中，则在发布或导入流程应用程序时，该字段为必填。如果缺少该字段，则会引发错误。如果未选择，则该字段视为可选字段。当缺少该字段时，系统将为该字段添加 NULL 值，以确保后续 SQL 查询不会失败。
唯一	用于定义字段值的选项，其中每条记录具有不同或唯一的值。
不为 NULL	用于定义每条记录的字段必须具有值的选项。该字段不能留空或使用 NULL 值填充。

字段类型的解析设置

下表描述了不同字段类型的可用解析设置。

字段类型	解析设置
整数	千位分隔符无点 (.) 逗号 (,)
小数	小数分隔符点 (.) 逗号 (,) 千位分隔符无点 (.) 逗号 (,)
布尔值	True 值: `TRUE` 或 `1` False 值 `FALSE` 或 `0` 备注： “True”值和“False”值是必需设置，并且必须不同。
日期	日期格式（请查看日期格式的解析设置示例）。
Datetime	日期时间格式日期格式（请参阅日期时间格式的示例解析设置。）

日期格式的解析设置示例

格式	示例
`yyyy-MM-dd`	`2025-04-05` `2025-4-5`
`yy/mm/dd/`	`04/05/25` `4/5/25`
`mm/dd/yyyy`	`04/05/2025` `4/5/2025`
`yyyy-mm-dd`	`04-05-2025` `4-5-2025`
`yyyy-mm-dd`	`05-04-2025` `5-4-2025`
`YYYY/MM/DD`	`2025 年 4 月 5 日`

日期时间格式的解析设置示例

格式	示例
`yyyy-mm-dd hh:mm:ss[.nnn]`	`2025-04-05 14:30:45.123` `2025-4-5 14:30:45.123`
`yyyy/mm/dd hh:mm:ss[.nnn]`	`2025/04/05 14:30:45.123` `2025/4/5 14:30:45.123`
`mm/dd/yyyy hh:mm:ss[.nnn]`	`04/05/2025 14:30:45.123` `4/5/2025 14:30:45.123` `04/05/2025 14:30:45` `4/5/2025 14:30:45`
`yyyy-mm-ddThh:mm:ss[.nnn]`	`2025-04-05T14:30:45.123` `2025-4-5T14:30:45.123`
`mm-dd-yyyy hh:mm:ss[.nnn]`	`04-05-2025 14:30:45.123` `4-5-2025 14:30:45.123` `04-05-2025 14:30:45` `4-5-2025 14:30:45`
`dd-mm-yyyy hh:mm:ss[.nnn]`	`05-04-2025 14:30:45.123` `5-4-2025 14:30:45.123` `05-04-2025 14:30:45` `5-4-2025 14:30:45`
`yyyy-mm-ddThh:mm:ss[.nnn]+00:00`^*	`2025-04-05T14:30:45.123+02:00` `2025-04-05T14:30:45-03:00` `2025-04-05T14:30:45` `2025-4-5T14:30:45.123+02:00` `2025-4-5T14:30:45-03:00` `2025-4-5T14:30:45Z`
`yyyy-mm-ddThh:mm:ss[.nnn]+0000`^*	`2025-04-05T09:30:00+0000` `2025-04-05T09:30:00.123+0000`
`yyyy-mm-dd hh:mm:ss[.nnn]+00:00`^*	`2025-04-05 09:30:00+00:00` `2025-04-05 09:30:00.123+00:00`
`yyyy-mm-dd hh:mm:ss[.nnn]+0000`^*	`2025-04-05 09:30:00+0000` `2025-04-05 09:30:00.123+0000`
`dd/mm/yyyy hh:mm:ss[.nnn]`	`05/04/2025 14:30:45.123` `5/4/2025 14:30:45.123`
`mm/dd/yy hh:mm:ss[.nnn] AM/PM`	`04/05/25 02:30:45 PM` `4/5/25 02:30:45 PM`

*) 在数据提取期间，包含时区信息的时间戳会自动转换为 UTC。

调整现有流程应用程序以利用“管理输入数据”屏幕

简介

备注：

尽管现有的流程应用程序保持完整功能，但您可以调整流程应用程序以利用 Process Mining 中的“管理输入数据”屏幕。使用“管理输入数据”屏幕，您可以轻松添加新的输入表和输入字段。因此，建议调整输入数据结构可能会发生变化的流程应用程序。如果您预计输入数据的结构不会发生很多变化，则可能需要考虑不调整应用程序。

如果要开始使用“管理输入数据”屏幕加载现有流程应用程序的表格和字段，则需要手动执行此页面中描述的步骤。

先决条件

在开始调整应用程序之前:

确保发布对流程应用程序的所有更改。
导出或克隆流程应用程序以保存备份。

步骤

提示：

输入查询是引用sources部分中定义的表的 SQL 文件。这些模型通常位于文件夹1_input中。

对每个输入查询执行以下步骤。

确保输入 SQL 文件仅包含重命名和类型转换。将其他逻辑 (筛选、派生列等) 移至后续 SQL 文件。

下图显示了一个仅包含重命名和类型转换的Event_log_input.sql文件示例。
转到“管理输入数据” ，并调整每个字段的字段属性。有关详细信息，请参阅映射和配置输入字段。
1. 使用数据转换中的“管理输入数据设置” 选项设置数据类型和重命名。
2. 检查“字段”属性 面板中的“字段”属性 （“必填” 、“唯一” 、“非空” ），并确保它们设置正确。
检查所有 SQL 文件中对输入表{{ ref('table_name') }}引用，并更新这些引用以使用新表：

将出现的所有{{ ref('table_name') }}替换为{{ source('sources', 'source_table_name') }} 。例如：将指向 SQL 文件的{{ ref('Event_log_input') }}替换为{{ source('sources', 'Event_log_raw') }} ，以直接指向源表。

备注：
这些引用可以出现在任何 SQL 文件中。
由于不再使用原始输入 SQL 文件，因此您现在可以安全地将其删除。

重要提示：

如果转换包含“管理输入数据设置”中尚不可用的格式设置，则类型转换应保留在dbt转换中。例如，SAP 日期不可用 (YYYYMMDD)。

故障排除

问题

无法正确加载之前上传的文件。

可能的解决方案

检查文件的编码和行尾，是否与表格设置匹配。有关更多信息，请参阅映射和配置输入表。

在此页面上

映射和配置输入表
映射输入表
配置输入表
增量数据加载
删除源文件
删除输入表格
映射和配置输入字段
映射输入字段
配置输入字段
字段类型的解析设置
调整现有流程应用程序以利用“管理输入数据”屏幕
简介
先决条件
步骤
故障排除

此页面有帮助吗？

前一个删除输入表

下一个管理文件存储