Process Mining - 增量提取

process-mining

latest

false

Process Mining 用户指南

重要 :

请注意，此内容已使用机器翻译进行了部分本地化。新发布内容的本地化可能需要 1-2 周的时间才能完成。

增量提取

在 CData Sync 中配置增量提取，包括为不支持预配置增量提取的源系统进行手动设置。

对于大多数源系统，CData Sync 已预配置应如何执行增量提取。如果不是这种情况，则必须手动编辑设置才能执行增量提取。有关如何执行此操作的更多信息，请参阅官方CData Sync 文档。

对于增量提取，需要定义一个起点（或“增量开始日期”），将从该起点为每个表格提取新数据或更新的数据。

请按照以下步骤定义表格的增量开始日期。

要在 CData Sync 中为作业启用增量提取，请转到“高级”选项卡，然后编辑“复制选项”以取消选择“删除表格”选项。这将启用增量提取。

要使用 CData Sync 运行增量提取，您需要在提取作业中为要增量加载的每个表格添加一个时间戳列。“时间戳”列将跟踪上次提取数据的时间，从而使 CData Sync 仅为下一次迭代提取新数据或更新的数据。

请按照以下步骤使用 CData Sync 配置增量数据提取。

编辑在“创建作业”中创建的 CData Sync 提取作业。
转到“任务” ，并编辑要配置用于增量提取的表格。
前往“列” ，然后选择“编辑映射” 。
选择“+”（添加列）。
输入 SQL 命令，将时间戳转换为正确的格式。例如：
1. 对于 MS SQL Server 数据库，请输入FORMAT(GETDATE(), 'yyyy-MM-dd HH:mm:ss')
2. 对于 Oracle 源数据库，请输入to_char(CURRENT_TIMESTAMP, 'YYYY-MM-DD HH24:MI:SS') 。
3. 选择“下一步”。
在“列名称”字段中输入EXTRACTED 。
选择TIMESTAMP作为“数据类型” ，然后选择“添加列” 。下图显示了一个示例。
转到“概述” ，然后编辑 “来源信息” 。
从列表中选择适用的增量列。

备注：
这应该是一个包含每次更改的时间戳值的列，或一个保存每次更新的行数的整数列。
选择“保存”。

有关如何启动提取作业的信息，请查看运行作业。

首次运行 CData Sync 提取作业时，将执行完整提取并提取所有源数据。每次运行 CData Sync 提取作业时，仅提取源中已更改的数据，并将增量添加到已提取的数据中。

有关使用 CData Sync 提取增量数据的更多信息，请参阅官方 CData Sync 文档。

在此页面上

前一个从多个源系统加载数据

下一个CData 同步故障排除