WEB开发网
开发学院数据库DB2 使用 IBM OmniFind Enterprise Edition 结合分类词... 阅读

使用 IBM OmniFind Enterprise Edition 结合分类词典文件实现基于搜索结果分类

 2008-11-08 16:32:41 来源:WEB开发网   
核心提示: 正确安装了 UIMA 工具之后,需要将 UIMA 的一些插件加载到 Eclipse 中,使用 IBM OmniFind Enterprise Edition 结合分类词典文件实现基于搜索结果分类(7),我们会在 UIMA 的安装目录中发现 eclipsePlugin 文件夹,在这个文件夹中

正确安装了 UIMA 工具之后,需要将 UIMA 的一些插件加载到 Eclipse 中,我们会在 UIMA 的安装目录中发现 eclipsePlugin 文件夹,在这个文件夹中,我们会发现 uima_1.4.4_EclipsePlugins.zip 文件,需要将其解压缩至 Eclipse 的 plugins 文件夹中。

为了能够让 UIMA 的测试工具 Common Analysis Structure(CAS)正常的运行,保证我们在开发自己的文本语义分析引擎的过程中,能够方便的进行测试,我们需要在已安装的 UIMA 中加载 IBM OmniFind Enterprise Edition 基本文本分析器(IBM OmniFind Enterprise Editionbase text analysis)。我们会在已安装的 IBM OmniFind Edition 的安装目录 ES_INSTALL_ROOT/packages/uima 目录中,找到 OF_base_annotators.zip 文件,需要将其解压至之前安装的 UIMA SDK 根目录中。

建立自己的UIMA语义分析引擎

在完成了以上准备工作后,我们就可以建立满足自己需要的语义分析引擎了。在这一个部分中,我们会利用 Eclipse 编写 Java 程序,并利用正则表达式或其他方式来取得文本中我们需要的信息,并利用 UIMA 工具生成相应的语义分析引擎文件。

实质:首先从相关分类词典的 XML 文件中提取出关键词及其信息;之后在 Java 程序中,利用正则表达式对收集到的文本信息进行分析,通过内容的匹配,进行分类,并建立不同的分类索引。

创建 UIMA 语义分析引擎

建立语义分析引擎,步骤如下:

在 Eclipse 中建立新的 Java project,并将工程命名为“WFJ_UIMA”。之后我们需要为该工程指定 classpath:

右键单击工程,并选择 Properties/Java Build Path

在弹出窗口中右侧选择 Libraries 标签,并单击 Add Variable/Configure Variables/New

上一页  2 3 4 5 6 7 8 9 10  下一页

Tags:使用 IBM OmniFind

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接