开发学院数据库 Oracle 在UNIX服务器上设置Oracle8i全文检索阅读

在UNIX服务器上设置Oracle8i全文检索

　2007-05-08 12:11:03　来源：WEB开发网　　　

核心提示： 修改完成后，重新启动listener (先用lsnrctl stop, 然后 lsnrctl start), 然后，在UNIX服务器上设置Oracle8i全文检索(3)，使用tnsping 来测试一下是否配置正确：tnsping extproc_connection_data 或者tnsp

修改完成后，重新启动listener (先用lsnrctl stop, 然后 lsnrctl start), 然后，使用tnsping 来测试一下是否配置正确：

tnsping extproc_connection_data 或者

tnsping extproc_connection_data.world,如果配置正确，会显示：

Attempting to contact (ADDRESS=(PROTOCOL=IPC)(KEY=EXTPROC)) OK（140毫秒）

否则请检查你的上述两个文件，并注意，在修改后一定要重新启动listener，但并不需要重新启动数据库。

3．设置词法分析器(lexer)

Oracle实现全文检索，其机制其实很简单。即通过Oracle专利的词法分析器(lexer),将文章中所有的表意单元（Oracle 称为 term）找出来，记录在一组以 dr$开头的表中，同时记下该term出现的位置、次数、hash 值等信息。检索时，Oracle 从这组表中查找相应的 term，并计算其出现频率，根据某个算法来计算每个文档的得分（score）,即所谓的‘匹配率’。而lexer则是该机制的核心，它决定了全文检索的效率。Oracle 针对不同的语言提供了不同的 lexer, 而我们通常能用到其中的三个：

basic_lexer: 针对英语。它能根据空格和标点来将英语单词从句子中分离，还能自动将一些出现频率过高已经失去检索意义的单词作为‘垃圾’处理，如if , is 等，具有较高的处理效率。但该lexer应用于汉语则有很多问题，由于它只认空格和标点，而汉语的一句话中通常不会有空格，因此，它会把整句话作为一个term,事实上失去检索能力。以‘中国人民站起来了’这句话为例，basic_lexer 分析的结果只有一个term ,就是‘中国人民站起来了’。此时若检索‘中国’，将检索不到内容。

chinese_vgram_lexer: 专门的汉语分析器，支持所有汉字字符集。该分析器按字为单元来分析汉语句子。‘中国人民站起来了’这句话，会被它分析成如下几个term: ‘中’，‘中国’，‘国人’，‘人民’，‘民站’，‘站起’，起来’，‘来了’，‘了’。可以看出，这种分析方法，实现算法很简单，并且能实现‘一网打尽’，但效率则是差强人意。

上一页 1 2 3 4 5 6 7 下一页