全面解析IBM DB2 9中的查询优化新特性
2008-08-30 16:25:53 来源:WEB开发网 闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧綊鏌熼梻瀵割槮缁炬儳缍婇弻鐔兼⒒鐎靛壊妲紒鐐劤缂嶅﹪寮婚悢鍏尖拻閻庨潧澹婂Σ顔剧磼閹冣挃闁硅櫕鎹囬垾鏃堝礃椤忎礁浜鹃柨婵嗙凹缁ㄧ粯銇勯幒瀣仾闁靛洤瀚伴獮鍥敍濮f寧鎹囬弻鐔哥瑹閸喖顬堝銈庡亝缁挸鐣烽崡鐐嶆棃鍩€椤掑嫮宓佸┑鐘插绾句粙鏌涚仦鎹愬闁逞屽墰閹虫捇锝炲┑瀣╅柍杞拌兌閻ゅ懐绱撴担鍓插剱妞ゆ垶鐟╁畷銉р偓锝庡枟閻撴洘銇勯幇闈涗簼缂佽埖姘ㄧ槐鎾诲礃閳哄倻顦板┑顔硷工椤嘲鐣烽幒鎴旀瀻闁规惌鍘借ⅵ濠电姷鏁告慨顓㈠磻閹剧粯鈷戞い鎺嗗亾缂佸鏁婚獮鍡涙倷閸濆嫮顔愬┑鐑囩秵閸撴瑦淇婇懖鈺冪<闁归偊鍙庡▓婊堟煛鐏炵硶鍋撻幇浣告倯闁硅偐琛ラ埀顒冨皺閺佹牕鈹戦悙鏉戠仸闁圭ǹ鎽滅划鏃堟偨缁嬭锕傛煕閺囥劌鐏犻柛鎰ㄥ亾婵$偑鍊栭崝锕€顭块埀顒佺箾瀹€濠侀偗婵﹨娅g槐鎺懳熺拠鑼舵暱闂備胶枪濞寸兘寮拠宸殨濠电姵纰嶉弲鎻掝熆鐠虹尨宸ョ€规挸妫濆铏圭磼濡搫顫嶇紓浣风劍閹稿啿鐣烽幋锕€绠婚悹鍥у级瀹撳秴顪冮妶鍡樺鞍缂佸鍨剁粋宥夋倷椤掍礁寮垮┑鈽嗗灣閸樠勭妤e啯鍊垫慨妯煎亾鐎氾拷

核心提示: 均匀分考虑以下数据C112333377910runstats(无分布)将提供关于 C1 的以下信息CARD = 10,COLCARD = 6,LOW2KEY = 2,HIGH2KEY = 9那么:◆C1=3 的行的数量将被估计为 10/6 = 1.67,◆C1=4 和 C1=8 之间的值域
均匀分
考虑以下数据
C1
1
2
3
3
3
3
7
7
9
10
runstats(无分布)将提供关于 C1 的以下信息
CARD = 10,
COLCARD = 6,
LOW2KEY = 2,
HIGH2KEY = 9
那么:
◆C1=3 的行的数量将被估计为 10/6 = 1.67。
◆C1=4 和 C1=8 之间的值域被估计为 ((8-4)/(9-2)) * 10 = 5.71。
但是,如果将数据变化一下,以反映数据不均匀、大跨度的分布,如下所示
C1
1
2
3
3
3
3
7
7
99
100
那么:
C1=3 的行的数量被估计为 10/6 = 1.67。
C1=4 与 C1=8 之间的值域被估计为 ((8-4)/(99-2)) * 10 = 0.41
如果数据是完全均匀分布的,如下所示
C1
1
2
3
4
5
6
7
8
9
在本文的讨论中,我们来看看优化指南和统计视图这两个最新的增强。
通过本文,您可以了解这些增强的作用是什么,以及在某些情况下,在
非数据分区(non-DPF)和数据分区(DPF)环境中,如何在应用程序
内充分利用它们。
10
那么:
C1=3 的行的数量将被估计为 10/10 = 1。
C1=4 与 C1=8 之间的值域被估计为 ((8-4)/(9-2)) * 10 = 5.71。
C1=3 与 C1=7 之间的值域被估计为 ((7-3)/(9-2)) * 10 = 5.71。
所以,当数据均匀分布时,无论值和范围如何,真实的结果与估计的结果都更加一致。
即使拥有频率值和分位数值之类的分布统计信息(这些信息可以大大减少等于和范围谓词的估计错误),也仍然会出现估计错误无法接受的情况。
更多精彩
赞助商链接