WEB开发网
开发学院数据库DB2 交付有效且灵活的数据仓库解决方案:第2部分:仓库... 阅读

交付有效且灵活的数据仓库解决方案:第2部分:仓库设计和数据建模

 2010-05-14 15:00:30 来源:WEB开发网   
核心提示:数据仓库的建模数据只是所有业务活动、资源以及企业结果的记录,数据模型是对那些数据的组织良好的抽象,交付有效且灵活的数据仓库解决方案:第2部分:仓库设计和数据建模(3),因此数据模型成为理解和管理企业业务的最佳方法是极其自然的,数据模型起到了指导或计划数据仓库的实现的作用,而本文不会进行这方面的讨论,本小节将介绍两层的仓

数据仓库的建模

数据只是所有业务活动、资源以及企业结果的记录。数据模型是对那些数据的组织良好的抽象,因此数据模型成为理解和管理企业业务的最佳方法是极其自然的。数据模型起到了指导或计划数据仓库的实现的作用。在真正的实现开始之前,联合每个业务领域的数据模型可以帮助确保其结果是有效的数据仓库,并且可以帮助减少实现的成本。

目标仓库数据的建模是将需求转换成图画以及支持表示那些需求的元数据的过程。出于易读性目的,本文将关于需求和建模的讨论相分离,但实际上这些步骤通常是重叠的。一旦在文档中记录一些初始需求,初始模型就开始成型。随着需求变得更加完整,模型也会如此。

最重要的是向终端用户提供良好集成并易于解释的数据仓库的逻辑模型。这些逻辑模型是数据仓库元数据的核心之一。为终端用户提供的简单性以及历史数据的集成和联合是建模方法应该帮助提供的关键原则。

仓库数据的建模与操作数据库的建模

在建模的过程中,请记住下列问题:

数据仓库应该是面向终端用户的。在数据库操作中,用户不直接与数据库进行交互。他们使用应用程序,这些应用程序具有预先定义的或固定的查询。数据仓库的数据库——特别是数据集市——与终端用户非常接近,它通常不具有固定的查询。因此,它必须更易于理解。

数据仓库应该是为数据分析而设计的。终端用户几乎直接处理数据,而且没有固定的工作流(除了这里和那里的少数例外)。终端用户对在仓库中记录数据不感兴趣,但他们需要从中获得信息。他们向仓库提出问题,通过所提取的信息测试并验证假设,重新构造事件链,分析那些事件以检测可能的模式或季节性的趋势,以及为将来做出推断和设计。

终端用户的需求可能是模糊或不完整的。这些不完整的需求需要灵活的建模过程和适合于进化开发的技术。灵活的进化软件开发的风险是不连贯和不一致的终端结果。在开发数据模型时,肯定需要注意这些问题。

数据仓库是集成的数据库集合,而非单个数据库。应将它构想为单个信息源,用于整个企业中所有的决策支持处理和所有的信息应用程序。数据仓库是一个“有机”物,如果在开始时还不够大,就还会趋于变大。

数据仓库包含属于不同信息主题领域的数据。这些主题领域可以是将数据仓库逻辑划分成几个不同(概念的,甚至或者是物理的)数据库的基础。数据仓库还可以包含不同类别的数据。

数据仓库通常包含历史数据,而不是日常操作数据的快照(snapshot)。必要的遗留数据库可能不可用,或者可能无法在足够细的层次上捕获,除非花费金钱并付出努力来改变遗留输入环境。因此,数据仓库启用项目通常涉及业务过程和源应用程序的重组(reengineering)。

两层数据仓库设计

如何进行数据仓库的建模可能是商业智能领域中最有争议的问题之一,而本文不会进行这方面的讨论。本小节将介绍两层的仓库建模方法,该方法最适合于自底向上的实现。

图 3. 两层仓库建模

上一页  1 2 3 4 5 6 7 8  下一页

Tags:交付 有效 灵活

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接