结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 2 部分: 为涉及 XML 的多个 ETL 作业设计控制流
2010-06-24 00:00:00 来源:WEB开发网由于有这个引用完整性约束,就需要修改 结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 1 部分:创建用于填充混合型数据仓库的 ETL 数据流 中描述的 ETL 操作。在 结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 1 部分:创建用于填充混合型数据仓库的 ETL 数据流 的场景中,一个数据流从源表 TPOXADMIN.ACCOUNT 的 INFO 列提取出 XML 数据并填充两个目标数据仓库表:DWADMIN.ACCT 和 DWADMIN.HOLDINGS。因为这两个目标数据仓库表之间没有引用完整性约束,所以先填充其中哪个目标表都可以。
本文中的场景修改了目标表的设计,包含主键和外键约束,这要求先填充 DWADMIN.ACCT 表。为了确保先填充 DWADMIN.ACCT 表,需要把 ETL 操作分为多个数据流,使用控制流为这些数据流指定所需的执行次序。注意,如果 DWADMIN.ACCT 是空的,DB2 会拒绝在 DWADMIN.HOLDINGS 表中插入行,因为这个表包含一个引用 DWADMIN.ACCT 表的外键。
要想了解 TPOXADMIN.ACCOUNT 的 INFO 列中的 XML 源数据如何映射到数据仓库表的各个列,请回顾 结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 1 部分:创建用于填充混合型数据仓库的 ETL 数据流 的 结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 1 部分:创建用于填充混合型数据仓库的 ETL 数据流 和 结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 1 部分:创建用于填充混合型数据仓库的 ETL 数据流。
控制流和数据流概况
在构建控制流之前,需要单独创建每个数据流。因为每个数据流都是 结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 1 部分:创建用于填充混合型数据仓库的 ETL 数据流 描述的数据流的子集,您应该熟悉它们的逻辑。
更多精彩
赞助商链接