WEB开发网
开发学院数据库MSSQL Server SQL Server中的关系型数据仓库分区策略(1) 阅读

SQL Server中的关系型数据仓库分区策略(1)

 2007-12-27 15:32:37 来源:WEB开发网   
核心提示:分区方式让数据被批量导入到单个的分段表中,每一段都代表了一个确定的分区范围,SQL Server中的关系型数据仓库分区策略(1)(6),分段表随后被添加到分区视图当中或者被当作一个新的分区交换到分区表中,由于每一个分区逻辑上都是由一个单独的分段表来代表的,如果数据被分区了,一个滑动窗口的实现就成为了可能,因此步进的批量

分区方式让数据被批量导入到单个的分段表中,每一段都代表了一个确定的分区范围。分段表随后被添加到分区视图当中或者被当作一个新的分区交换到分区表中。由于每一个分区逻辑上都是由一个单独的分段表来代表的,因此步进的批量导入不会对任何针对现有数据的查询造成可用性和性能上的影响。

一个典型的数据仓库解决方案应当包括在批量导入数据的同时进行数据转换的功能。转换包括对源数据的清除和/或者聚合以产生目标库。

一个转换典型情况下是通过使用象微软系统集成服务这样的工具来完成的。如果过程中不需要一个复杂的工作流,用户可以选择使用SELECT/INTO来完成转换。

索引

在把数据导入到一个关系型数据仓库后,一般就要创建索引来为用户查询提供支持。在对关系型数据仓库体系结构造成影响的各个要素中创建和维护索引扮演了主要角色。

在没有索引时对事实表的查询性能通常比较差。对于使用单个巨大事实表的情况,一个最佳的解决方案是删除所有的索引,导入数据,然后重建索引。这种方法导致可用性的降低并且有一个不断增长的维护窗口,当表的大小增长到一定程度时这种方法可能就不太现实了。

在SQL Server 2000中当在基表上创建索引时,分区视图有效的处理了这个问题。SQL Server 2005支持在单独的分区上重建和重组索引,因而便于更好的管理分区索引。

数据老化

老化的数据被访问的频率比新的数据低一些。与日俱增的法律和规定需要业务保证老化的数据在线并能够被立即访问到。因而,在维护现有的数据的高可用性以及方便快速导入新的数据的同时有效的管理老化的数据对于一个企业是非常关键的。数据老化可以通过一个滑动窗口来有效的处理。如果数据被分区了,一个滑动窗口的实现就成为了可能。要查看更多的细节,请参阅本文后面的“滑动窗口实现”

上一页  1 2 3 4 5 6 7 8 9 10  下一页

Tags:SQL Server 关系型

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接