开发学院数据库 MSSQL Server 在SQL Server中的关系型数据仓库分区策略（1）阅读

在SQL Server中的关系型数据仓库分区策略（1）

　2007-05-15 09:27:46　来源：WEB开发网　　　

核心提示： ◆创建一个分区函数和架构以确定每个分区的分界点和物理存储位置，分界点应当和分区视图的基表的差不多◆在新建的分区架构上创建一个分区表，在SQL Server中的关系型数据仓库分区策略（1）(5)，该表应当指定与分区视图的基表同样的物理结构，包括索引◆将分区视图的每个基表交换为新建的分区事实表

◆创建一个分区函数和架构以确定每个分区的分界点和物理存储位置。分界点应当和分区视图的基表的差不多

◆在新建的分区架构上创建一个分区表。该表应当指定与分区视图的基表同样的物理结构，包括索引

◆将分区视图的每个基表交换为新建的分区事实表的一个分区。分区架构所关联的文件组必须与被交换进来的表所属的文件组相匹配。另外，要迁移的表必须符合交换提示的要求。举个例子，目标表不能是一个与架构绑定的视图的部件。关于交换提示的要求列表，请参阅SQL Server 2005联机丛书中的“使用分区交换有效的传递数据”

影响关系型数据仓库分区的因素

对于一个分区的关系型数据仓库的成功实现而言，包括了对数据库增长和易管理性的规划。接下来的部份阐述了影响关系型数据仓库分区的因素以及滑动窗口实现的详细信息。

数据量

当事实表的大小比较小时，分区只会添加更多的管理复杂性而不会带来更多的价值。事实表的大小是基于应用程序的特点并且由每一种实现方式所决定的。通常用户需要事实表在他们实施分区之前至少有100 GB。

数据导入

数据导入是一个数据仓库的核心部份。几乎所有的数据仓库都会周期性的处理最近收集的数据。是否成功的管理数据仓库取决于批量导入进程的效率以及导入过程中现有的数据能否继续使用。

在构建你的事实表时有两个选择：

◆建立一个巨大的表，或者

◆使用分区的方式

使用单个巨表这种方式与使用分区相比会导致较低的可用性，原因是在典型的关系型数据仓库环境中批量导入操作是步进执行的。例如，步进式的批量导入会从对目标表的锁定中获得巨大的好处。当使用单个表时，这样做就会阻止所有其它的用户在表导入的过程中访问它。对于步进导入数据的最佳工作方式是使用一个规划维护窗口。对于使用单个巨表这种方式中批量导入的全面讨论请参阅在http://www.microsoft.com/technet/prodtechnol/sql/2000/maintain/incbulkload.mspx 上的“SQL Server 2000步进批量导入案例学习”