process-mining
latest
false
重要 :
请注意,此内容已使用机器翻译进行了部分本地化。 新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Process Mining

上次更新日期 2025年9月4日

选择数据源

您可以使用示例数据集,上传包含.tsv文件的数据集,或使用提取程序加载数据。创建新流程应用程序后,将加载数据。
重要提示:

出于性能和安全原因,强烈建议使用小型数据集进行应用程序开发和测试数据转换。

开发数据集用于测试数据转换。 它不会影响已发布流程应用程序的仪表板中显示的数据。

一旦您的应用程序准备好供业务用户使用,您就可以发布应用程序并加载新数据以在已发布的流程应用程序中使用。

  1. 为您的数据源选择适用的选项。

  2. 选择“下一步”

使用 Theobald 提取程序

备注:

对于使用 SAP 源系统的流程应用程序,建议使用“ Theobald 提取程序”选项。

如果您选择了使用 SAP 源系统的应用程序模板,则默认使用 Theobald 提取程序选项来加载数据。

您可以稍后在应用程序创建过程中的“使用 Theobald 上传数据”步骤中复制详情,以在提取程序中使用。 请参阅完成应用程序创建

有关更多信息,请参阅使用 Theobald Xtract Universal 加载数据

使用 CData 提取程序

备注:

对于使用 CData 支持的源系统的应用程序模板,“使用 CData 提取程序” 选项是默认选项。

您可以稍后在应用程序创建过程中的“使用 CData 上传数据”步骤中复制详细信息,以在提取程序中使用。 请参阅完成应用程序创建

有关更多信息,请参阅使用 CData Sync 加载数据

使用示例数据

注意:仅当流程应用程序可使用示例数据时,才会启用“使用示例数据”选项。

上传数据

也可以使用.csv文件上传数据。
警告:

对于大量数据,建议使用 CData Sync 或 Theobald Xtract Universal(适用于 SAP)上传数据。

您还可以使用数据上传器将每个最大 5TB 的数据文件直接上传到 Process Mining 流程应用程序中。

注意:创建新的流程应用程序时,请始终确保数据所采用的格式符合用于创建新应用程序的应用程序模板的要求。另请查看应用程序模板
注意:表格名称和字段名称区分大小写。始终确保数据集中的字段名称(列标题)与输入表中列出的字段名称匹配,并且文件名与表名称匹配。

请按照以下步骤上传数据文件。

映射输入表

备注:

The required tables for the process app are displayed in the Required tables section on the Select data source page.

  1. 拖放流程应用程序的输入表所需的文件,或选择“选择文件”图标选择文件图标以选择您的计算机中的文件。系统已上传一个或多个文件。

    备注:

    如果缺少任何必需的表格,您可以使用+上传文件选项上传其他文件。

    “源表格”部分中会为每个上传的文件添加一个新表格,并会自动映射到“目标表格”部分中的相关输入表格。

    提示:

    蓝色圆点表示已为该表格上传新数据。这可以是新表格,也可以是现有表格。

  2. 确保每个表都映射到正确的目标表。如果需要,从“目标表”列表中选择其他表以更正映射。

  3. 选择“下一步” 。系统将显示“字段”页面,您可以在其中继续映射输入字段。

如果上传的文件未作为必需表格列出,则系统会在“源表格”部分自动为每个上传的文件添加一个新表格,并在“目标表格”部分创建相应的输入表格。默认情况下,上传文件的文件名用作表格的名称。

备注:

系统将显示一条警告消息,指示需要先配置表,然后才能为表上传数据。上传新表格后,该表格将在数据转换中可用。但是,您需要采取进一步的步骤才能使此数据在仪表板上可见。首先,必须使用 SQL 查询加载表格数据。然后,应将该表合并到流程应用程序的数据模型中。有关如何在数据模型中添加表的更多信息,请参阅数据模型。

配置输入表

系统会自动检测目标输入表的设置,您只需进行检查。

请按照以下步骤编辑输入表的设置。

  1. 找到要配置的表格,然后选择“编辑表格”图标,以打开所选表格的“编辑表格”面板。

  2. 根据需要编辑设置,然后选择“保存”

下表描述了表格设置。

设置

描述

表格名称

数据转换中的输入表的名称。

必需

用于将表格定义为必填表格的选项。

如果是TRUE ,则稍后在发布或导入流程应用程序时需要该表。如果未上传表格,则会引发错误。如果FALSE ,则在发布或导入应用程序时,该表被视为“可选” 。如果未上传表格,则系统将创建一个空表格,以便后续 SQL 查询不会失败。

编码

文件中使用的编码。

分隔符

分隔不同字段的分隔符。

行尾

用于表示行尾和新行尾的字符。

引号字符

Case 字段中使用的引号字符需要用引号括起来。

加载类型

表格的加载类型。

备注:

如果选择“增量”作为“加载类型” ,则必须指定其他设置才能为表配置增量加载。

增量数据加载

对于完全加载,无论数据自上次加载以来是已更改还是保持不变,都将从源中提取所有数据并将其加载到目标系统中。增量加载仅提取自上次加载以来已更改(添加或更新)的数据。与完整加载相比,增量加载通常更快,而且占用的资源更少,尤其是在处理大量数据(其中只有一小部分可能会经常更改)时。

要为表启用增量数据加载,您必须将表的加载类型设置为增量。增量加载需要唯一标识符以确保正确加载数据,并需要一个字段(例如时间戳或版本)来跟踪源数据的更改。

下表描述了增量加载所需的其他设置。

设置

描述

主键

唯一标识数据源中每条记录的一个或多个主键字段。

时间戳字段

用于跟踪上次更新或添加每条记录的时间的字段。

时间戳格式

“时间戳”字段中使用的时间戳值的格式。

重要提示:

用于加载数据的提取方法可能需要额外或特定的配置才能进行增量提取。

有关如何设置 数据上传器 以进行增量提取的更多信息,请查看 使用数据上传器加载数据

注意:如果您将“加载类型”切换回“完全” ,请确保相应地配置所使用的提取方法。

映射输入字段

备注:

对于所选表格,表格的必填字段将显示在“字段”页面的“必填字段”部分中。

在输入表中检测到的源字段会自动映射到目标表中的相应字段。

  1. 确保每个字段均已映射到正确的目标字段。如果需要,从“目标字段”列表中选择其他字段以更正映射。

  2. 选择“下一步”以继续。

配置输入字段

系统会自动检测目标输入字段的设置,您只需进行检查。

请按照以下步骤编辑输入字段的设置。

  1. 找到要配置的字段,然后选择“编辑字段” 图标以打开所选字段的“编辑字段”面板。

  2. 根据需要编辑设置,然后选择“保存”

下表描述了表格设置。

设置

描述

名称

字段的名称。

备注:

名称是必填字段。

类型

字段的数据类型。

  • 文本

  • 整数

  • 小数

  • 布尔值

  • 日期

  • Datetime

备注:

根据字段类型,您必须指定解析设置才能配置字段。

必需

用于将字段定义为必填字段的选项。

如果选中,则在发布或导入流程应用程序时,该字段为必填。如果缺少该字段,则会引发错误。如果未选择,则该字段视为可选字段。当缺少该字段时,系统将为该字段添加 NULL 值,以确保后续 SQL 查询不会失败。

唯一

用于定义字段值的选项,其中每条记录具有不同或唯一的值。

不为 NULL

用于定义每条记录的字段必须具有值的选项。该字段不能留空或使用 NULL 值填充。

字段类型的解析设置

下表描述了不同字段类型的可用解析设置。

字段类型

解析设置

整数

千位分隔符

  • 点 (.)

  • 逗号 (,)

小数

  • 小数分隔符

    • 点 (.)

    • 逗号 (,)

  • 千位分隔符

    • 点 (.)

    • 逗号 (,)

布尔值

  • True 值:

    TRUE1
  • False 值

    FALSE0
备注:

“True”值“False”值是必需设置,并且必须不同。

日期

日期格式(请查看日期格式的解析设置示例)。

Datetime

Date time format Date format (Check out Example parse settings for Datetime formats.)
日期时间格式的解析设置示例
格式示例
YYYY-MM-DD HH:mm:ss

2025-04-05 14:30:45

2025-4-5 14:30:45

yyyy-mm-dd hh:mm:ss[.nnn]

2025-04-05 14:30:45.123

2025-4-5 14:30:45.123

yyyy-mm-ddThh:mm:ss[.nnn]

2025-04-05T14:30:45.123

2025-4-5T14:30:45.123

yyyy-dd-mm hh:mm:ss[.nnn]

2025-05-04 14:30:45.123

2025-5-4 14:30:45.123

yy/mm/dd hh:mm:ss上午/下午

04/05/25 02:30:45 PM

4/5/25 02:30:45 PM

mm-dd-yyyy hh:mm:ss[.nnn]

04-05-2025 14:30:45.123

4-5-2025 14:30:45.123

04-05-2025 14:30:45

4-5-2025 14:30:45

mm-yyyy-dd hh:mm:ss[.nnn]

04-2025-05 14:30:45.123

4-2025-5 14:30:45.123

04-2025-05 14:30:45

4-2025-5 14:30:45

dd-mm-yyyy hh:mm:ss[.nnn]

05-04-2025 14:30:45.123

5-4-2025 14:30:45.123

05-04-2025 14:30:45

5-4-2025 14:30:45

dd-yyyy-mm hh:mm:ss[.nnn]

05-2025-04 14:30:45.123

5-2025-4 14:30:45.123

05-2025-04 14:30:45

5-2025-4 14:30:45

yyyy-mm-ddThh:mm:ss[.nnn]+00:00*

2025-04-05T14:30:45.123+02:00

2025-04-05T14:30:45-03:00

2025-04-05T14:30:45

2025-4-5T14:30:45.123+02:00

2025-4-5T14:30:45-03:00

2025-4-5T14:30:45Z

yyyy-mm-ddThh:mm:ss+00:00*

2025-04-05T14:30:45+02:00

2025-04-05T14:30:45

2025-4-5T14:30:45-03:00

2025-4-5T14:30:45Z

dd/mm/yyyy hh:mm:ss[.nnn]

05/04/2025 14:30:45.123

5/4/2025 14:30:45.123

*) 在数据提取期间,包含时区信息的时间戳会自动转换为 UTC。

使用提取程序上传数据

注意:使用提取程序加载数据时,数据将加载到 Blob 存储中。因此,在加载数据时,Process Mining Automation Cloud TM无法检查 IP 地址。这意味着,如果为租户设置了 IP 限制,则在使用提取程序从不受信任的 IP 范围内的计算机加载数据时不会强制执行此限制,并且数据将上传到 Process Mining。
备注:

您可以稍后在应用程序创建过程中的“使用提取程序上传数据”步骤中复制详情,以在提取程序中使用。 请参阅完成应用程序创建

使用直接连接上传数据

注意: 创建流程应用程序时,如果您有权访问 Orchestrator Orchestrator 文件夹 ,则只能使用“使用直接连接上传数据” 选项,因为这是创建或读取 Integration Service 连接所必需的。
备注:

“使用直接连接上传数据”选项适用于使用 ServiceNow 源系统或 Salesforce 源系统的流程特定应用程序模板。如果要设置与 ServiceNow 或 Salesforce 的直接连接, “使用直接连接上传数据”选项也适用于通用应用程序模板“事件日志”“自定义流程”

备注:

对于使用可直接连接的源系统的应用程序模板,“使用直接连接上传数据”选项是默认选项。

先决条件

直接连接上传数据使用Integration Service连接。 这意味着您需要:
  • Integration Service许可证;

  • 在租户上启用Integration Service

  • 访问OrchestratorOrchestrator 文件夹的权限

Integration Service连接受文件夹限制。 如果要使用特定文件夹中的连接,则需要有权访问Orchestrator中的该文件夹,才能在Process Mining中查看该文件夹。 如果您从Process Mining创建新连接,则系统将在Orchestrator的个人工作区中创建此连接。

有关 Integration Service 许可和 Integration Service 连接的更多信息,请参阅 Integration Service 指南。

设置直接连接

您可以在“选择数据源”步骤中使用与源系统的直接连接进行设置,而不是使用 CData Sync 设置连接。

使用直接连接上传数据”选项直接将数据从源系统加载到流程应用程序中。

请按照以下步骤设置与源系统的直接连接:

  1. 选择“使用直接连接上传数据”选项。

    用于显示的应用程序模板的源系统。

  2. 选择“连接”

    系统随即会打开一个新的浏览器选项卡,您可以在其中输入连接的身份验证详细信息。

注意:

如果您使用的是流程特定的应用程序模板,请确保用户凭据有权访问应用程序模板中指定的默认表格和字段列表。有关详细信息,请参阅应用程序模板

有关如何为特定源系统设置连接的更多信息和详细说明,请参阅使用直接连接加载数据

故障排除

请参阅基本故障排除指南中的集成提取程序

映射输入表

  1. “源表格”部分中将为每个提取的表格添加一个表格,并且该表格会自动映射到“目标表格”部分中的相关输入表。

  2. 确保每个表都映射到正确的目标表。如果需要,从“目标表”列表中选择其他表以更正映射。

  3. 选择“下一步”

If you upload a table that is not listed as a required table, a new table is automatically added in the Source tables section for each uploaded file and a corresponding input table is created in the Target tables section. By default, the file name of the uploaded file is used as the name of the tables.

Note: A warning message is displayed indicating the table needs configuration before data can be uploaded for the table. When a new table is uploaded, it becomes available in data transformations. However, further steps are required to make this data visible on the dashboards. First, the table data must be loaded using a SQL query. Then, the table should be incorporated into the data model of the process app. Refer to Data models for more information on how to add a table in the data model.
配置输入表

系统会自动检测目标输入表的设置,您只需进行检查。

请按照以下步骤编辑输入表的设置。

  1. 找到要配置的表格,然后选择“编辑表格”图标,以打开所选表格的“编辑表格”面板。

  2. 根据需要编辑设置,然后选择“保存”

下表描述了表格设置。

设置

描述

表格名称

数据转换中的输入表的名称。

必需

用于将表格定义为必填表格的选项。

如果是TRUE ,则稍后在发布或导入流程应用程序时需要该表。如果未上传表格,则会引发错误。如果FALSE ,则在发布或导入应用程序时,该表被视为“可选” 。如果未上传表格,则系统将创建一个空表格,以便后续 SQL 查询不会失败。

编码

文件中使用的编码。

分隔符

分隔不同字段的分隔符。

行尾

用于表示行尾和新行尾的字符。

引号字符

Case 字段中使用的引号字符需要用引号括起来。

加载类型

表格的加载类型。

备注:

如果选择“增量”作为“加载类型” ,则必须指定其他设置才能为表配置增量加载。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo
© 2005-2025 UiPath。保留所有权利。