交付有效且灵活的数据仓库解决方案:第2部分:仓库设计和数据建模
2010-05-14 15:00:30 来源:WEB开发网两层数据仓库设计的好处包括:
灵活且易于维护。可以随时根据用户的报表需求修改数据集市的数据结构。但是,它不影响数据存储库中数据库的数据结构。
易于伸缩和集成。关系类型的业务数据存储库数据库比数据集市中非正规(denormalized)和汇总性(summarized)的数据库更易于伸缩和集成。
用户友好。将数据集市和数据存储库分离使得数据集市的设计更加是终端用户所驱动的,因为数据建模师不需要过多考虑数据集成和模式可伸缩性问题。
更好的安全设计。两层的方法将数据存储和数据访问管理相分离。终端用户只能访问授权给他们的数据集市,而非所有的数据仓库数据。
更好的数据管理设计。数据仓库是为存储集成的业务范围的历史数据而设计的。但是,数据仓库中的许多数据集市都不一定需要那么多的历史数据。两层设计是存储历史数据的好地方。
请记住,上面两层的仓库设计是概念仓库布局。例如,在数据存储库层,登台数据库和存储库数据库可以在不同的服务器上、在同一服务器上或者甚至在不同模式下的同一数据库中。
仓库数据建模层
数据建模有三层:概念、逻辑和物理。在数据仓库的设计中,数据建模的每一层都有自己的目的。
概念
高级数据模型是所有业务主题领域以及业务的公共数据元素的一致性定义,从高级的业务视图到通用的逻辑数据设计。您可以从中派生出通用的范围,并获得对业务需求的理解。这个概念数据模型是当前和将来数据仓库开发阶段的基础。
逻辑
逻辑数据模型包含关于业务主题领域的更多详细信息。它捕获目标业务主题领域中的详细业务需求。逻辑数据模型是当前项目的物理数据建模的基础。
从这一阶段开始,该解决方案就适用自底向上的方法了,这意味着这个逻辑数据模型中仅仅将最重要和紧迫的业务主题领域锁定为目标。
逻辑数据模型的功能包括:
对于所有实体及其之间的关系的规范。
对于每个实体的属性的规范。
对于所有主键和外键的规范。
规范化(Normalization)和聚集。
对于多维数据结构的规范。
物理
物理数据建模应用物理约束,如空间、性能以及数据的物理分布。物理数据模型是与数据库系统以及您将使用的数据仓库工具紧密相关的。该阶段的目的是设计真正的物理实现。
将逻辑建模与物理建模清晰分离是特别重要的。良好的逻辑建模实践关注问题域的本质。逻辑建模解决“什么”之类的问题。物理建模为模型解决“如何”之类的问题,这表示给定的计算环境中实现的真实性。因为业务计算环境随时间变化,所以逻辑和物理数据建模的分离将帮助稳定一个阶段到另一阶段的逻辑模型。
一旦实现了数据仓库,且客户开始使用它,他们就常常会生成新的请求和需求。这将启动另一开发周期,继续数据仓库构建的迭代和进化过程。正如您可以看到的,逻辑数据模型是数据仓库的活动部分,在数据仓库的整个生命周期中使用和维护。数据仓库的建模过程确实是无止境的。
图 4. 数据仓库逻辑数据模型的生命周期
- ››灵活更改Windows 7“自动播放”设置
- ››灵活更改Win7系统“自动播放”设置
- ››有效促进网站排名权重的友情链接评定标准
- ››灵活运用ISA的链接转换功能:ISA2006系列之十三
- ››灵活配置DHCP服务器 解决更改IP地址问题
- ››灵活有效的数据仓库解决方案:第1部分:客户互动和...
- ››交付有效且灵活的数据仓库解决方案:第2部分:仓库...
- ››灵活有效的数据仓库解决方案,第3部分:设计并实现...
- ››有效使用 Optim Query Tuner 工具进行 SQL 查询语...
- ››灵活使用Word 2003文档窗口的滚动条
- ››有效加快Windows 7系统的运行速度
- ››灵活设置Windows Server 2008应对系统管理谜局
更多精彩
赞助商链接