性能损伤SQL Server 2008的全文检索
2008-11-19 10:09:51 来源:WEB开发网 闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧綊鏌熼梻瀵割槮缁炬儳缍婇弻鐔兼⒒鐎靛壊妲紒鐐劤缂嶅﹪寮婚悢鍏尖拻閻庨潧澹婂Σ顔剧磼閹冣挃闁硅櫕鎹囬垾鏃堝礃椤忎礁浜鹃柨婵嗙凹缁ㄧ粯銇勯幒瀣仾闁靛洤瀚伴獮鍥敍濮f寧鎹囬弻鐔哥瑹閸喖顬堝銈庡亝缁挸鐣烽崡鐐嶆棃鍩€椤掑嫮宓佸┑鐘插绾句粙鏌涚仦鎹愬闁逞屽墰閹虫捇锝炲┑瀣╅柍杞拌兌閻ゅ懐绱撴担鍓插剱妞ゆ垶鐟╁畷銉р偓锝庡枟閻撴洘銇勯幇闈涗簼缂佽埖姘ㄧ槐鎾诲礃閳哄倻顦板┑顔硷工椤嘲鐣烽幒鎴旀瀻闁规惌鍘借ⅵ濠电姷鏁告慨顓㈠磻閹剧粯鈷戞い鎺嗗亾缂佸鏁婚獮鍡涙倷閸濆嫮顔愬┑鐑囩秵閸撴瑦淇婇懖鈺冪<闁归偊鍙庡▓婊堟煛鐏炵硶鍋撻幇浣告倯闁硅偐琛ラ埀顒冨皺閺佹牕鈹戦悙鏉戠仸闁圭ǹ鎽滅划鏃堟偨缁嬭锕傛煕閺囥劌鐏犻柛鎰ㄥ亾婵$偑鍊栭崝锕€顭块埀顒佺箾瀹€濠侀偗婵﹨娅g槐鎺懳熺拠鑼舵暱闂備胶枪濞寸兘寮拠宸殨濠电姵纰嶉弲鎻掝熆鐠虹尨宸ョ€规挸妫濆铏圭磼濡搫顫嶇紓浣风劍閹稿啿鐣烽幋锕€绠婚悹鍥у级瀹撳秴顪冮妶鍡樺鞍缂佸鍨剁粋宥夋倷椤掍礁寮垮┑鈽嗗灣閸樠勭妤e啯鍊垫慨妯煎亾鐎氾拷

首先,一些不熟悉全文检索背景的人。一般来说,计算机科学术语全文检索只是意味着你在文档中搜索所有的文本。对付全文检索的另一种选择是查找元数据,例如标题和关键字。
对SQL Server而言,全文检索提供了存储在关系数据库或者是文件系统上的文本的高级搜索能力。搜索并不局限于字符串,应用程序所能理解的例如词干分析。这使得搜索“swim”,也返回“swims”, “swimming”,和“swam”。 它也可以支持权重搜索,即某些词比其他的词更重要,并可以搜索两个彼此相邻的词语。根据搜索条件的结果可以进行一个排名。
之前版本的全文检索是一个外部服务,和SQL Server并排运行的服务。这样设计,参与索引的表和列的数据不得不从SQL Server运送到全文检索服务。全文检索编目不能与其他的数据库一起备份,而且两个服务不能轻松的共享内存和CPU资源。
为了处理这些和其他的问题,SQL Server 2008把全文检索移到数据库中。现在SQL Server自身可以动态管理服务器资源,为服务自动管理改变内存和CPU资源配额。不幸的是,开发人员遇到了这种设计的一些意外结果。
他们依然会碰到的特定问题是事务。在一个事务性的数据库中,SQL Server要时刻遵守ACID的规则。这意味着在搜索的时候行、页或甚至整个表都被锁定。通常情况下不会太坏,但是Brent Ozar解释说,错误的搜索会让事情变得复杂。
如果你在修正版(Revisions)上进行全文检索并且包含一些常见的关键字,像SQL滞留,则需要匹配数以万计的记录。当我们查看一下查询计划的时候,我们看到有50-100k的读操作。在表里面做这样的事情,也会获得沉重的表插入,事务性的灾难。
Jeff Attwodd继续说道,
我们的stackoverflow.com很大程度上依赖于全文检索, 在SQL Server 2005下面工作得很好。不幸的是在SQL Server 2008下的情况则不同。
Brent正在和SQL Server团队跟进这件事,他们用我们的数据库拷贝进行测试。[…] 根据目前为止出奇的差的SQL Server 2008全文检索和明显的体系结构更改,我对SQL团队能够为我们做些什么感到悲观。
他们所指的网站StackOverflow将计划不再长期使用全文索引。他们已经规划出迁移到竞争的搜索引擎Lucene.Net上。但是那些计划继续使用全文检索的人,在 SQL Server 2005升级到2008以后需要在这方面进行彻底的测试。
- ››SQL Server 2008 R2 下如何清理数据库日志文件
- ››sqlite 存取中文的解决方法
- ››SQL2005、2008、2000 清空删除日志
- ››SQL Server 2005和SQL Server 2000数据的相互导入...
- ››sql server 2008 在安装了活动目录以后无法启动服...
- ››sqlserver 每30分自动生成一次
- ››sqlite 数据库 对 BOOL型 数据的插入处理正确用法...
- ››sql server自动生成批量执行SQL脚本的批处理
- ››sql server 2008亿万数据性能优化
- ››SQL Server 2008清空数据库日志方法
- ››sqlserver安装和简单的使用
- ››SQL Sever 2008 R2 数据库管理
更多精彩
赞助商链接