结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 2 部分: 为涉及 XML 的多个 ETL 作业设计控制流
2010-06-24 00:00:00 来源:WEB开发网核心提示: 注意,该脚本支持 Windows 上运行的 DB2 9.7 服务器,结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 2 部分: 为涉及 XML 的多个 ETL 作业设计控制流(5),如果在您的服务器上已经有名为 TPOX 的数
注意,该脚本支持 Windows 上运行的 DB2 9.7 服务器。如果在您的服务器上已经有名为 TPOX 的数据库,这个脚本会删除它并用新的数据库对象重新创建它。
步骤 2:准备 Design Studio 环境
在创建数据流之前,按 结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 1 部分:创建用于填充混合型数据仓库的 ETL 数据流 中的步骤准备 Design Studio 环境(如果还没有这么做的话)。
步骤 3:创建提取账户数据的数据流
第一个数据流需要从源 TPOXADMIN.ACCOUNT 表提取信息,根据需要转换信息,填充 DWADMIN.ACCT 目标表。按以下步骤创建这个数据流。
复制在 结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 1 部分:创建用于填充混合型数据仓库的 ETL 数据流 中完成的数据流,给它起新的名称。
编辑这个数据流,删除 DWADMIN.HOLDINGS 表的 Table Target 操作符。
编辑为 Group By 操作符提供输入的 XML Relational Mapping 操作符,删除 SYMBOL 和 QTY 的列定义。应该保留 id、title、currency、workingbalance、officer、datachanged、timechanged 和 holdingtype 的列定义,见图 4。
图 4. 从 XML 节点提取的列定义
查看原图(大图)
更多精彩
赞助商链接