WEB开发网
开发学院数据库DB2 使用IBM OmniFind Enterprise Edition结合分类词典... 阅读

使用IBM OmniFind Enterprise Edition结合分类词典文件实现基于搜索结果分类

 2010-02-16 14:59:56 来源:WEB开发网   
核心提示:在弹出 Configure text analysis engines 页面中,单击Add Text Analysis Engine 按钮,使用IBM OmniFind Enterprise Edition结合分类词典文件实现基于搜索结果分类(10),添加之前生成的WFJ_UIMA.pear文件,并单击OK 完成,让我

在弹出 Configure text analysis engines 页面中,单击Add Text Analysis Engine 按钮,添加之前生成的WFJ_UIMA.pear文件,并单击OK 完成。如图 19 所示:
图 19. 添加文本分析引擎
添加文本分析引擎

完成以上步骤后,我们就可以使用IBM OmniFind Enterprise Edition 来对已经准备好的.txt文档进行测试了:

首先我们需要在IBM OmniFind Enterprise Edition中创建一个Collection命名为UIMADemo,用来crawl File system类型的文档(具体创建Crawler的方法参见IBM OmniFind Enterprise Edition使用说明);

创建好后 Collection后,我们在Collection 页面中单击已经创建好的UIMADemo的Parse/Edit 按钮,在之后页面中我们单击Configure text processing options 选项;

在Configure text processing options 页面中Text analysis engine name: 一项选择之前添加近来的UIMA,同时单击Select a mapping file 选项,并在Local path 一项中选择之前建立的WFJDescriptorCasToIndex.xml文件后单击OK,如图 20 所示:
图 20. 配置文本分析引擎
配置文本分析引擎

之后我们便对该 Collection 进行 crawl、Parse 以及 index。当全部完成后,我们便可以访问 http://<OFServerName>/ESSearchApplication 来进行查询。当我们输入关键字“王府井”时,会按关键词查询一个结果,同时查看详细概要文件时,我们会在详细概要的属性中查看到之前 WFJDescriptorCasToIndex.xml中定义好的分类类型:restaurant 和 shop,如图 21、22 所示:


图 21. restaurant搜索结果
restaurant搜索结果

图 22. shop搜索结果
shop搜索结果

结论

通过本实践,利用IBM OmniFind Enterprise Edition结合IBM开源非结构化信息管理体系结构Unstructured Information Management Architecture(UIMA),来实现IBM OmniFind Enterprise Edition搜索引擎的语义搜索及结果分类。让我们的搜索空间和功能更加的广泛。满足了当前部分用户的更高需求,同时也增加了客户应用程序的竞争性。

本文配套源码

上一页  5 6 7 8 9 10 

Tags:使用 IBM OmniFind

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接