结合使用 IBM InfoSphere Warehouse Design Studio 和 pureXML 数据,第 2 部分: 为涉及 XML 的多个 ETL 作业设计控制流
2010-06-24 00:00:00 来源:WEB开发网返回到数据流设计的图形视图。
右键单击刚才编辑的 XML Relational Mapping 操作符,选择 Propagate Column Change。
出现提示时,单击 OK。
保存修改。新的数据流应该与 图 2 相似。
步骤 5:测试数据流
在构建调用这些数据流的控制流之前,应该确认每个数据流可以正确地工作。按照下面介绍的标准 Design Studio 过程测试第一个流(用于填充 DWADMIN.ACCT),然后测试第二个流(用于填充 DWADMIN.HOLDINGS 表)。在最初测试时,使用调试器可能有帮助。按以下步骤测试每个流。
如果还没有保存设计的话,现在就保存。
在 Data Project Explorer 面板中,右键单击数据流并选择 Validate 以检查数据流。如果发现了任何错误,纠正它们。
如果愿意,可以在数据流中设置断点。设置方法是右键单击数据流中操作符之间的连接并选择 Toggle Breakpoint。
在 Data Project Explorer 面板中,右键单击流并选择 Debug 或 Execute。如果调试流,可以使用顶部的 Resume 图标监视数据流中每个步骤的输出。注意,调试器可能会产生与 DROP TABLE 语句有关的警告,可以不理会它。
步骤 6:创建控制流
两个数据流已经开发并测试完了,现在可以构建一个以正确次序执行它们的控制流。为了简单,本文中按以下步骤创建一个基本的控制流。还可以使用更多高级特性,但是这些特性超出了本系列的范围。
在数据仓库项目中,右键单击 Control Flows 文件夹。
创建一个新的控制流,给它起名。
在 Palette 上,选择 Common operators > Data Flows。
把一个图标拖到控制流设计中默认出现的 Start 操作符的右边。
右键单击并选择 Show Properties View。
更多精彩
赞助商链接