WEB开发网
开发学院数据库DB2 结合使用 IBM InfoSphere Warehouse Design Studi... 阅读

结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 2 部分: 为涉及 XML 的多个 ETL 作业设计控制流

 2010-06-24 00:00:00 来源:WEB开发网   
核心提示: 设计第一个流 第一个流从源表中提取出 XML 数据并填充 DWADMIN.ACCT 表(这个表包含主键),见图 1,结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 2 部分: 为涉及 XML 的多个 ETL 作业设计控制流(3

设计第一个流

第一个流从源表中提取出 XML 数据并填充 DWADMIN.ACCT 表(这个表包含主键),见图 1。

图 1. 用于填充混合型 DWADMIN.ACCT 表的数据流
结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 2 部分: 为涉及 XML 的多个 ETL 作业设计控制流

查看原图(大图)

Table Source 操作符(见 图 1 的左上方)指定 TPOXADMIN.ACCOUNT 表作为输入源。这个表中的 XML 数据输入到两个 XML Relational Mapping 操作符。其中一个操作符(图 1 中下方的分支)为一个 Group By 操作符提供输入,后者执行目标表的两个列所需的聚合。但是,目标表还包含一个 XML 列,其中包含原来的 XML 记录。因为 XML 列不能参与 Group By 子句,所以需要定义第二个 XML Relational Mapping 操作符(图 1 中上方的分支)。此操作符从 XML 数据中提取账户 ID 值,并保留完整的 XML 记录。然后,将这个映射操作获得的账户 ID 与 Group By 操作的输出中的账户 ID 进行联结,创建填充目标 ACCT 表的结果集。

设计第二个流

第二个数据流的设计更简单。它填充 DWADMIN.HOLDINGS 表,这个表包含一个引用 DWADMIN.ACCT 表的外键。这个数据流从源表中读取 XML 数据,然后使用一个 XML Relational Mapping 操作符直接填充目标表,见图 2。

图 2. 用于填充 DWADMIN.HOLDINGS 表的数据流
结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 2 部分: 为涉及 XML 的多个 ETL 作业设计控制流

上一页  1 2 3 4 5 6 7 8  下一页

Tags:结合 使用 IBM

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接