WEB开发网
开发学院数据库MSSQL Server Microsoft SQL Server 2000 中的数据转换服务 (DT... 阅读

Microsoft SQL Server 2000 中的数据转换服务 (DTS)

 2007-11-11 08:56:22 来源:WEB开发网   
核心提示: Microsoft sql server(WINDOWS平台上强大的数据库平台) 2000 中查询优化器使用的统计Microsoft? sql server(WINDOWS平台上强大的数据库平台)? 2000 收集关于存储在数据库中的索引和列数据的统计信息,sql server(WINDOWS平台上强大的数据库平台)

Microsoft sql server(WINDOWS平台上强大的数据库平台) 2000 中查询优化器使用的统计

Microsoft? sql server(WINDOWS平台上强大的数据库平台)? 2000 收集关于存储在数据库中的索引和列数据的统计信息。sql server(WINDOWS平台上强大的数据库平台) 查询优化器使用这些统计信息来选择用于执行 INSERT、SELECT、DELETE 或 UPDATE 查询的最有效方案。本文说明了收集的数据类型、数据的存储位置以及用于创建、更新与删除统计的命令。默认情况下,sql server(WINDOWS平台上强大的数据库平台) 2000 会自动创建和更新统计(当此类操作有用时)。本文也概括介绍了如何在不同的级别(索引、表和数据库)上更改这些默认值。

sql server(WINDOWS平台上强大的数据库平台) 2000 中的统计数据

sql server(WINDOWS平台上强大的数据库平台) 2000 既收集关于单个列的统计信息(单列统计),也收集关于成组的列的统计信息(多列统计)。关于一个统计对象的所有信息存储在 SYSINDEXES 表中一行的多个列中。计算列以及数据类型为 ntexttextimage 的列不能被指定为统计列。组成一个统计集的所有列的总宽度不能超过 900 字节。

sql server(WINDOWS平台上强大的数据库平台) 2000 收集的统计信息

  • 上次收集统计信息的时间(在 STATBLOB 中)。

  • 表或索引中的行数(SYSINDEXES 中的 rows 列)。

  • 表或索引所占用的页数(SYSINDEXES 中的 dpages 列)。

  • 用于生成直方图和密度信息的行数(在 STATBLOB 中,将在下面讲解)。

  • 平均键长(在 STATBLOB 中)。

  • 单列直方图,包括步数(在 STATBLOB 中)。

注意:  直方图是给定列的最多 200 个值的集合。给定列中的所有值(如果通过抽样来收集统计信息,则为选定的值)会被排序;排序后序列最多会划分为 199 个间隔,以便得到最有效的统计。一般,这些间距的大小并不相等。以下数值与直方图的每个步长存储在一起。

表 1:直方图的值

RANGE_HI_KEY键值
EQ_ROWS指定与 RANGE_HI_KEY 精确相等的行数。
RANGE_ROWS指定区间中的行数。(这些行小于这个 RANGE_HI_KEY,但大于上一个较小的区间键值)。
DENSITY指定 1/n,其中 n 表示区间中互不相同的值的数目。

使用 dbcc show_statistics 命令时显示的是两个导出值而不是 DENSITY 信息。

表 2:用两个导出值显示 dbcc show_statistics 的直方图

DISTINCT_RANGE_ROWS指定此区间中互不相同的行的数目(不算 RANGE_HI_KEY 值本身);DISTINCT_RANGE_ROWS = 1 / DENSITY。
AVG_RANGE_ROWS区间中每个特定值的平均行数;AVG_RANGE_ROWS = DENSITY * RANGE_ROWS。

sql server(WINDOWS平台上强大的数据库平台) 2000 中的直方图只用于单个列、多列统计中的第一列或者索引。

sql server(WINDOWS平台上强大的数据库平台) 2000 按照三个步骤从排序后的列值集合生成直方图。第一步,最多收集 200 个 RANGE_HI_KEY、EQ_ROWS、RANGE_ROWS 和 DISTINC_RANGE_ROWS 的值。第二步,对每个其他的列值进行处理:该值或者被添加到上一个区间中(对值进行排序),或者创建一个新区间。如果是创建一个新区间,则两个现有的相邻区间会合并到一个区间中。sql server(WINDOWS平台上强大的数据库平台) 2000 通过密度信息来选择要合并的区间,使密度最接近的两个相邻区间被合并,从而将信息的损失降到最低程度。第三步,合并更多的密度接近的区间。因此,即使列中的唯一值个数超过 200,直方图的步数也可能会小于 200。

如果通过抽样来生成直方图,那么 RANGE_ROWS、EQ_ROWS、DISTINCT_RANGE_ROWS 和 AVG_RANGE_ROWS 的值将为估计值,因此它们不必都是整数。

密度是关于给定列或列的组合中重复项数目的信息,其计算公式为 1/(互不相同的值的数目)。如果在相等条件判断表达式中使用了某个列,则会使用从直方图导出的密度来估算符合条件的行数。直方图通常用于估算不等条件判断表达式。

注意:  dbcc show_statistics 的第一行中会显示一个单独的密度值,但 sql server(WINDOWS平台上强大的数据库平台) 2000 中的优化器不使用该值。

一个列集合的多列统计包括以下信息:统计定义中第一个列的直方图,第一个列的密度值,以及每个列的前缀组合(单独包括第一个列)的密度值。每个统计集(一个直方图加上两个或多个密度值)都存储在 SYSINDEXES 表的一行中,同一行中还包括上次更新统计的时间戳、用于生成统计信息的抽样行数、直方图的步数和平均键数。sql server(WINDOWS平台上强大的数据库平台) 2000 只为编号为 0 或 1 的索引(堆索引或群集索引)维护行数的值(rowcnt 列),并在表中的所有索引中复制该值。同样,sql server(WINDOWS平台上强大的数据库平台) 2000 也为每个表和索引维护 dpages。如果收集统计信息时表中没有任何行,则该表的统计信息为空。

使用 sp_helpindexsp_helpstats 可以显示给定表中所有可用统计的列表,sp_helpindex 列出了表中的所有索引,而 sp_helpstats 则列出了表中的所有统计。每个索引都带有其中列的统计信息。在相同的列中,使用 CREATE STATISTICS 命令创建的统计信息与使用 CREATE INDEX 命令生成的统计信息等价。唯一的差别在于,CREATE STATISTICS 命令默认采用抽样方式,而 CREATE INDEX 命令则由于必须处理索引的所有行,因而使用 fullscan 收集统计信息。

下面是罗斯文数据库中 Order Details 表的所有索引和统计的示例。因为最初无索引的列上没有任何统计信息,所以在连接到罗斯文数据库后,请先运行 sp_createstats

表 3:罗斯文数据库中的 Order Details 表

sp_helpindex [Order Details]

index_nameindex_descriptionindex_keys
OrderIDPrima(最完善的虚拟主机管理系统)RY 上的非群集索引OrderID
PK_Order_DetailsPrima(最完善的虚拟主机管理系统)RY 上群集的唯一主键OrderID、ProductID
ProductIDPrima(最完善的虚拟主机管理系统)RY 上的非群集索引ProductID

sp_helpstats [Order Details]

statistics_namestatistics_keys
DiscountDiscount
QuantityQuantity
UnitPriceUnitPrice

也可以象下面这样使用 dbcc show_statistics 命令来显示统计信息:

dbcc show_statistics ([Order Details],PK_Order_Details)

如果没有返回任何信息,则表明上次已经更新了统计,或在表中没有任何行时就创建了索引。要更新 Order Details 表的统计,请运行 UPDATE STATISTICS [Order Details];要更新罗斯文数据库中所有表的统计,请运行 sp_updatestats

注意:  该命令的输出已经增强了可读性。

上一页  1 2 3 4 5 6 7  下一页

Tags:Microsoft SQL Server

编辑录入:coldstar [复制链接] [打 印]
赞助商链接