开发学院数据库 DB2 全面解析IBM DB2 9中的查询优化新特性阅读

全面解析IBM DB2 9中的查询优化新特性

　2008-08-30 16:25:53　来源：WEB开发网　　　

核心提示： 均匀分考虑以下数据C112333377910runstats（无分布）将提供关于 C1 的以下信息CARD = 10,COLCARD = 6,LOW2KEY = 2,HIGH2KEY = 9那么：◆C1=3 的行的数量将被估计为 10/6 = 1.67，◆C1=4 和 C1=8 之间的值域

均匀分

考虑以下数据

C1 1 2 3 3 3 3 7 7 9 10

runstats（无分布）将提供关于 C1 的以下信息

CARD = 10,

COLCARD = 6,

LOW2KEY = 2,

HIGH2KEY = 9

那么：

◆C1=3 的行的数量将被估计为 10/6 = 1.67。

◆C1=4 和 C1=8 之间的值域被估计为 ((8-4)/(9-2)) * 10 = 5.71。

但是，如果将数据变化一下，以反映数据不均匀、大跨度的分布，如下所示

C1 1 2 3 3 3 3 7 7 99 100

那么：

C1=3 的行的数量被估计为 10/6 = 1.67。

C1=4 与 C1=8 之间的值域被估计为 ((8-4)/(99-2)) * 10 = 0.41

如果数据是完全均匀分布的，如下所示

C1 1 2 3 4 5 6 7 8 9 在本文的讨论中，我们来看看优化指南和统计视图这两个最新的增强。通过本文，您可以了解这些增强的作用是什么，以及在某些情况下，在非数据分区（non-DPF）和数据分区（DPF）环境中，如何在应用程序内充分利用它们。 10

那么：

C1=3 的行的数量将被估计为 10/10 = 1。

C1=4 与 C1=8 之间的值域被估计为 ((8-4)/(9-2)) * 10 = 5.71。

C1=3 与 C1=7 之间的值域被估计为 ((7-3)/(9-2)) * 10 = 5.71。

所以，当数据均匀分布时，无论值和范围如何，真实的结果与估计的结果都更加一致。

即使拥有频率值和分位数值之类的分布统计信息（这些信息可以大大减少等于和范围谓词的估计错误），也仍然会出现估计错误无法接受的情况。

上一页 3 4 5 6 7 8 9 10 下一页

Tags：全面 解析 IBM

编辑录入：爽爽　[复制链接] [打印]

更多精彩

赞助商链接

热点阅读

焦点图片

最新推荐

精彩阅读

技术首页　|　关于本站　|　广告合作　|　联系我们　|　友情连接　|　网站地图

飞鹰联盟成员网站　Copyright © 2003-2013 CnCms.Com. All Rights Reserved　京ICP备10000768号