灵活有效的数据仓库解决方案,第3部分:设计并实现仓库ETL过程
2010-05-14 15:00:27 来源:WEB开发网核心提示:定义仓库主题领域、过程和步骤仓库步骤是对仓库中单独某一操作的定义,仓库步骤定义如何移动和转换数据,灵活有效的数据仓库解决方案,第3部分:设计并实现仓库ETL过程(4),可以在 DB2 Data Warehouse Center 中使用的仓库步骤类型有很多:SQL(插入、更新和替换)文件(FTP,文件数据的导入和导出)D
定义仓库主题领域、过程和步骤
仓库步骤是对仓库中单独某一操作的定义。仓库步骤定义如何移动和转换数据。可以在 DB2 Data Warehouse Center 中使用的仓库步骤类型有很多:
SQL(插入、更新和替换)
文件(FTP,文件数据的导入和导出)
DB2 程序(数据导出、装入、表重组和统计数据更新)
仓库转换器(数据清理、键表和时间表的生成,以及翻转和透视数据)
统计信息转换器
在运行一个步骤时,可能发生仓库源和仓库目标之间的数据迁移或转换。其中一个步骤就是 Data Warehouse Center 中的一个逻辑实体,该实体定义了以下内容:
到源数据的链接。
对输出表或文件的定义和链接。
用来填充输出表或文件机制(SQL 语句或程序)和定义。
填充输出表或文件的处理选项或时间表。
仓库过程包含为特定仓库执行数据转换和移动的一系列步骤。一个过程可以产生一个表或一组总结表(summary table)。过程还可以执行一些特定类型的数据转换。
图 7. 定义仓库过程
更多精彩
赞助商链接