WEB开发网
开发学院数据库DB2 结合使用 IBM InfoSphere Warehouse Design Studi... 阅读

结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 2 部分: 为涉及 XML 的多个 ETL 作业设计控制流

 2010-06-24 00:00:00 来源:WEB开发网   
核心提示: 单击 … 按钮以指定适当的数据流,见图 9,结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 2 部分: 为涉及 XML 的多个 ETL 作业设计控制流(9),图 9. 通过编辑数据流操作符的属性选择所需的流查看原

单击 … 按钮以指定适当的数据流,见图 9。

图 9. 通过编辑数据流操作符的属性选择所需的流
结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 2 部分: 为涉及 XML 的多个 ETL 作业设计控制流

查看原图(大图)

找到前面创建的用来填充 DWADMIN.ACCT 表的数据流。

可以把这个数据流操作符的默认名称改为更有意义的名称。

重复步骤 6-8,把填充 DWADMIN.HOLDINGS 表的数据流添加到控制流中。

把这个操作符拖到现有数据流操作符的右边。

在 Palette 上,选择 Common operators > End。

把它放在最后一个数据流操作符的右边。现在,控制流建模所需的所有操作符都就位了。

通过选择 Common operators > Email 添加用来管理运行时错误的操作符。

把它放在第一个数据流操作符下面。

右键单击这个操作符并选择 Show Properties View 以指定它的属性。

指定发件人和收件人的电子邮件地址、标题和消息。对于这个示例,这些属性都使用固定的值(而不是可变值),见图 10。每个属性旁边的图标表示使用固定值还是可变值。

图 10. 定义 Email 操作符的属性
结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 2 部分: 为涉及 XML 的多个 ETL 作业设计控制流

查看原图(大图)

选择 Common operators > Fail,把它放在 Email 操作符的右边。

把 Start 操作符连接到第一个数据流操作符的输入。

使用右上角的绿色对勾把第一个数据流操作符连接到第二个,这会建立有条件连接。这个有条件连接只在这个操作成功的情况下执行控制流。在这个场景中,如果无法填充包含主键的表,就希望避免填充引用它的表,所以应该使用有条件连接。

把第二个数据流操作符连接到 End 操作符。对于这个示例,使用数据流操作符输出端的蓝色箭头定义无条件连接。

把第一个数据流操作符的失败端(由红色的 X 表示)连接到它下面的 Email 操作符。

使用无条件连接把 Email 操作符连接到 Fail 操作符。

检查控制流是否与 图 3 相似。

步骤 7:测试控制流

创建控制流之后,按标准的 Design Studio 过程测试它。使用上面工具栏中的图标检查控制流,然后调试或执行它。

结束语

本系列探索如何使用 IBM InfoSphere Warehouse Design Studio 和 DB2 pureXML 来支持数据仓库中 XML 使用量的日益增长。XML 已成为很多组织进行数据交换的首选格式。因此,数据架构师正在评估将 XML 集成到数据仓库中的各种选择。设计 ETL 任务(或数据流)是将 XML 集成到数据仓库环境中的重要方面。

本文是本系列的第二篇,介绍如何使用控制流管理多个数据流的执行。控制流适用于复杂的操作。控制流有助于促进代码重用,还让开发人员能够指定活动的次序。

本文示例源代码或素材下载

上一页  4 5 6 7 8 9 

Tags:结合 使用 IBM

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接