WEB开发网
开发学院数据库MSSQL Server 大数据量下的数据库日期操作问题 阅读

大数据量下的数据库日期操作问题

 2007-11-11 09:45:58 来源:WEB开发网   
核心提示:说明:以下数据库操作基于sql server(WINDOWS平台上强大的数据库平台) 2000问题出现:假设一个新闻系统,你需要获取最近一周的热点文章,大数据量下的数据库日期操作问题,一定会使用类似下面的SQL语句: select top 50 newsID, newsTitle, newsRead from news

说明:以下数据库操作基于sql server(WINDOWS平台上强大的数据库平台) 2000

问题出现:
假设一个新闻系统,你需要获取最近一周的热点文章,一定会使用类似下面的SQL语句:

select top 50 newsID, newsTitle, newsRead from newstable where datediff("d", newsTime, getdate())<7 order by newsRead desc
只要对newsID,newsRead,newsTime都有索引,用查询分析器分析成本发现成本非常小,在newstable数据量小的情况下,访问速度非常快。可是最近发现,当newstable到达200万条记录的时候,这条看似简单的语句执行居然要1分钟以上。

解决问题:
这个问题排查比较简单,去掉order by一样很慢,只能断定是datediff造成的。我们尝试把上面的语句分成2段:

第一条语句:select min(newsID) from newstable where datediff("d", newsTime, getdate())<7
第二条语句:select top 50 newsID, newsTitle, newsRead from newstable where newsID>[minID] order by newsRead desc
其中[minID]是第一条语句的结果,我们发现:第二条语句执行非常快,关键是第一条慢。newsID和newsTime均有索引,这是为什么呢?

换一个思路,第一条语句基本等价为

第三条语句:select max(newsID) from newstable where datediff("d", newsTime, getdate())>=7
奇怪了,第三条语句执行起来飞快,虽然问题是曲线解决了,可这又是为什么?难道和索引的排序次序有关?欢迎大家讨论。

Tags:数据 数据库 日期

编辑录入:coldstar [复制链接] [打 印]
赞助商链接