Google桌面搜索中文版印象
2007-11-01 10:21:37 来源:WEB开发网一直很纳闷,Google到底是否真的在乎中国市场。桌面搜索(以下简称GDS)推出很长时间了,中文版一直没动静,这让国内的Google拥趸们很是郁闷。不早不晚,百度刚刚宣布推出硬盘搜索(以下简称BDS),Google桌面搜索中文版也跟着来了。看来,市场还是有些竞争好,竞争至少是一个推动力。昨天下午,Google的公关公司已经开始联系各大媒体,表示愿意提供有关这个新产品的采访机会。他们自己大概也意识到,稍微有点迟到了。GDS英文版已经去掉了BETA标记,中文版的BETA刚来。
正好,可以对Google和百度的这个竞争产品进行比较。从两者的安装程序看,GDS只有1.1兆,BDS则有3.2兆。百度的人说,光PDF文件的分析部分,就在1兆以上。可是GDS现在也支持PDF搜索,这显然不应该成为一个理由。从两者的内存占用看,GDS也明显低于BDS。
支持文件格式类型:
项目 | GDS | BDS |
Outlook/Outlook Express邮件 | 有 | 有 |
Netscape Mail / Thunderbird | 有 | 无 |
MSN Messenger聊天记录 | 无 | 有 |
AOL 即时通讯 | 有 | 无 |
Internet Explorer历史 | 有 | 有 |
Netscape / Firefox / Mozilla | 有 | 无 |
Word | 有 | 有 |
Excel | 有 | 有 |
Powerpoint | 有 | 有 |
TXT / RTF | 有 | 有 |
有 | 有 | |
音乐 | 有 | 有 |
图片 | 有 | 有 |
视频 | 有 | 有 |
RAR、ZIP、EXE | 无 | 有 |
双方支持的文件格式差不多,但在IM聊天记录方面,GDS支持AIM而不是MSNMessenger,对国内用户意义不大。在对Firefox的支持方面,GDS明显强于BDS,百度现在似乎尚未考虑Firefox用户。不到1%的中国Firefox用户,在大多数国内网站看来,是没什么商业价值的,不光百度如此。
索引速度没进行比较,感觉上两者的速度都比较快。在索引量上,两者的差别主要表现在对Firefox浏览历史的索引上,因为我主要使用Firefox,仅此一项,GDS就比BDS多出4000多个索引项。
一直令百度夸耀的中文分词方面,Google这一次似乎做得更好,至少不逊色于百度。在一些特殊的测试中,GDS的表现要好于BDS。比如很有名的“和服”测试,不好的分词技术,会搜出大量包含“和服务”的结果,如“软件和服务”、“产品和服务”等。在这个测试中,GDS就不会把“和服务”包含在“和服”的搜索结果中,而BDS却没有对此进行很好的分词。所以用BDS搜“和服”,可能根本找不到有关和服的内容。奇怪的是,百度网页搜索就好得多,大部分结果分词准确,看来BDS所用的分词技术跟百度网页搜索不同。再比如,搜索“派出所有”,GDS会把它分成“派出”和“所有”两个词,而BDS却搜出一堆“派出所”。
我没有进行仔细的测试,所以只能说“印象”。在一般的使用中,两者的搜索效率都很高。对于有大量本地文档需要搜索的人来说,桌面搜索工具确实有帮助,但我很少用到本地搜索,所以并不觉得桌面搜索是一个多么重要的工具。
虽然这次Google来得稍显匆忙,但技术功底还是比较扎实;虽然百度略占先机,但未来胜负尚难预料。
GDS已经开放了API,并提供开发工具,用户也可以下载更多的GDS插件,扩展GDS的应用范围。在这方面,还没看到百度有什么动作。
原文:http://blog.donews.com/keso/archive/2005/03/08/296660.aspx
更多精彩
赞助商链接