结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 2 部分: 为涉及 XML 的多个 ETL 作业设计控制流
2010-06-24 00:00:00 来源:WEB开发网单击 … 按钮以指定适当的数据流,见图 9。
图 9. 通过编辑数据流操作符的属性选择所需的流
查看原图(大图)
找到前面创建的用来填充 DWADMIN.ACCT 表的数据流。
可以把这个数据流操作符的默认名称改为更有意义的名称。
重复步骤 6-8,把填充 DWADMIN.HOLDINGS 表的数据流添加到控制流中。
把这个操作符拖到现有数据流操作符的右边。
在 Palette 上,选择 Common operators > End。
把它放在最后一个数据流操作符的右边。现在,控制流建模所需的所有操作符都就位了。
通过选择 Common operators > Email 添加用来管理运行时错误的操作符。
把它放在第一个数据流操作符下面。
右键单击这个操作符并选择 Show Properties View 以指定它的属性。
指定发件人和收件人的电子邮件地址、标题和消息。对于这个示例,这些属性都使用固定的值(而不是可变值),见图 10。每个属性旁边的图标表示使用固定值还是可变值。
图 10. 定义 Email 操作符的属性
查看原图(大图)
选择 Common operators > Fail,把它放在 Email 操作符的右边。
把 Start 操作符连接到第一个数据流操作符的输入。
使用右上角的绿色对勾把第一个数据流操作符连接到第二个,这会建立有条件连接。这个有条件连接只在这个操作成功的情况下执行控制流。在这个场景中,如果无法填充包含主键的表,就希望避免填充引用它的表,所以应该使用有条件连接。
把第二个数据流操作符连接到 End 操作符。对于这个示例,使用数据流操作符输出端的蓝色箭头定义无条件连接。
把第一个数据流操作符的失败端(由红色的 X 表示)连接到它下面的 Email 操作符。
使用无条件连接把 Email 操作符连接到 Fail 操作符。
检查控制流是否与 图 3 相似。
步骤 7:测试控制流
创建控制流之后,按标准的 Design Studio 过程测试它。使用上面工具栏中的图标检查控制流,然后调试或执行它。
结束语
本系列探索如何使用 IBM InfoSphere Warehouse Design Studio 和 DB2 pureXML 来支持数据仓库中 XML 使用量的日益增长。XML 已成为很多组织进行数据交换的首选格式。因此,数据架构师正在评估将 XML 集成到数据仓库中的各种选择。设计 ETL 任务(或数据流)是将 XML 集成到数据仓库环境中的重要方面。
本文是本系列的第二篇,介绍如何使用控制流管理多个数据流的执行。控制流适用于复杂的操作。控制流有助于促进代码重用,还让开发人员能够指定活动的次序。
本文示例源代码或素材下载
更多精彩
赞助商链接