优化数据转换
2009-11-16 00:00:00 来源:WEB开发网在临时数据库中执行转换
许多 InfoSphere DataStage 站点都有一个临时数据库,在这里对数据进行存储、整理和添加标志,然后提取到不同的目标。 InfoSphere DataStage Balanced Optimization 支持在这个临时数据库中做更多工作,包括分配代理键、修改数据捕捉和把数据转移到数据质量报告表中。
用于数据仓库的转换
InfoSphere DataStage 可以从许多源数据库和 ERP 系统中提取数据。它可以在网格或集群上执行大量转换操作 —— 合并数据、消除重复、探测修改和检查数据质量。它可以把数据交付给原子级数据仓库表(按照转换后的格式或原始格式)。然后,可以直接把数据转移到维和事实表中,在这个过程中数据不必离开数据库。 InfoSphere DataStage 定义从细节表到维或事实表的元数据映射和转换,由数据库引擎执行数据转移。 InfoSphere DataStage Balanced Optimization 告诉开发人员哪些转移应该在数据库中执行,哪些应该通过 ETL 引擎执行。
用于分析的转换
分析师需要使用大量数据。 InfoSphere DataStage 和 InfoSphere DataStage Balanced Optimization 的组合为他们提供一种轻松高效地转移数据的方法。 IBM 和 Teradata 正在开发在数据库中直接提供分析报告的方法,从而减少数据转移和延迟并利用数据库的并行可伸缩性运行分析函数。
InfoSphere Balanced Warehouse 提供一个与行业相关的数据模型,用于在原子级保存数据以及生成 BI 和记分卡报告。 InfoSphere DataStage 可以通过一个本地 DB2 企业平台从数据库中提取出分析所需的数据,并把数据交付给 SAS 数据集或 SAS 程序。 InfoSphere DataStage Balanced Optimization 可以把过滤、联结和聚合步骤转移到数据库中执行,从而提高运行速度。
更多精彩
赞助商链接