结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 2 部分: 为涉及 XML 的多个 ETL 作业设计控制流
2010-06-24 00:00:00 来源:WEB开发网核心提示: 设计第一个流 第一个流从源表中提取出 XML 数据并填充 DWADMIN.ACCT 表(这个表包含主键),见图 1,结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 2 部分: 为涉及 XML 的多个 ETL 作业设计控制流(3
设计第一个流
第一个流从源表中提取出 XML 数据并填充 DWADMIN.ACCT 表(这个表包含主键),见图 1。
图 1. 用于填充混合型 DWADMIN.ACCT 表的数据流
查看原图(大图)
Table Source 操作符(见 图 1 的左上方)指定 TPOXADMIN.ACCOUNT 表作为输入源。这个表中的 XML 数据输入到两个 XML Relational Mapping 操作符。其中一个操作符(图 1 中下方的分支)为一个 Group By 操作符提供输入,后者执行目标表的两个列所需的聚合。但是,目标表还包含一个 XML 列,其中包含原来的 XML 记录。因为 XML 列不能参与 Group By 子句,所以需要定义第二个 XML Relational Mapping 操作符(图 1 中上方的分支)。此操作符从 XML 数据中提取账户 ID 值,并保留完整的 XML 记录。然后,将这个映射操作获得的账户 ID 与 Group By 操作的输出中的账户 ID 进行联结,创建填充目标 ACCT 表的结果集。
设计第二个流
第二个数据流的设计更简单。它填充 DWADMIN.HOLDINGS 表,这个表包含一个引用 DWADMIN.ACCT 表的外键。这个数据流从源表中读取 XML 数据,然后使用一个 XML Relational Mapping 操作符直接填充目标表,见图 2。
图 2. 用于填充 DWADMIN.HOLDINGS 表的数据流
[]
- ››使用脚本恢复WinXP系统的用户登录密码
- ››使用phpMyadmin创建数据库及独立数据库帐号
- ››使用Zend Framework框架中的Zend_Mail模块发送邮件...
- ››使用cout标准输出如何控制小数点后位数
- ››使用nofollow标签做SEO的技巧
- ››使用 WebSphere Message Broker 的 WebSphere Tra...
- ››使用SQL Server事件探查器做应用程序的性能分析
- ››使用SQL Server事件探查器分析死锁原因
- ››使用纯文本文件打造WCF服务
- ››结合 Dojo 和 JAX-RS 创建 RESTful 服务
- ››使用 Dojo 开发定制 Business Space 小部件,第 4...
- ››使用 ADDRESS 与 INDIRECT函数查询信息
更多精彩
赞助商链接