WEB开发网
开发学院数据库DB2 使用 IBM OmniFind Enterprise Edition 结合分类词... 阅读

使用 IBM OmniFind Enterprise Edition 结合分类词典文件实现基于搜索结果分类

 2008-11-08 16:32:41 来源:WEB开发网   
核心提示: 单击 Eclipse 菜单中 Windows/Preferences 选项,并在弹出的窗口中左侧选择 UIMA Preferences,使用 IBM OmniFind Enterprise Edition 结合分类词典文件实现基于搜索结果分类(9),右侧取消标记 Automatically

单击 Eclipse 菜单中 Windows/Preferences 选项,并在弹出的窗口中左侧选择 UIMA Preferences,右侧取消标记 Automatically run JCasGen when Types change 一项,如图 7 所示:

图 7. 设置 UIMA 首选项

使用 IBM OmniFind Enterprise Edition 结合分类词典文件实现基于搜索结果分类

完成以上工作之后,我们就可以编写程序来实现语义分析引擎,步骤如下:

右键单击 src 文件夹,选择 New/Package 创建 Package 并命名为:com.ibm.uima.Analyze;

右键单击创建的 com.ibm.uima. Analyze 包,并选择单击 New/Class,创建分析引擎用来分析文本并分类的类,我们将其命名为:WFJAnnotator。这里需要注意的是:所创建的 WFJAnnotator 类的 superclass 不应该使用 java.lang.Object,我们应该选择 com.ibm.uima.analysis_engine.annotator.JTextAnnotator_ImplBase,如图 8 所示:

图 8. 建立 WFJAnnotator 类

使用 IBM OmniFind Enterprise Edition 结合分类词典文件实现基于搜索结果分类

在编写 WFJAnnotator.java 之前,我们首先需要创建一个描述文件,这个描述文件采用 XML 文件描述方式,其中包含了内容分析分类的结构信息,其创建过程步骤如下:

右键单击 desc 文件夹并选择单击 New/Other,之后在弹出的窗口中选择 UIMA/Analysis Engine Descriptor,并单击 Next;

在弹出的 New Analysis Engine Descriptor File 窗口中,我们定义文件名为 WFJDescriptor.xml 并单击 Finish 完成创建,之后 WFJDescriptor.xml 文件会以 UIMA descriptor editor 的方式打开。之后在编辑窗口的 Runtime Information 一栏中,需要填写 Name of the Java class file 一项,其内容为 com.ibm.uima.Analyze. WFJAnnotator,如图 9 所示:

上一页  4 5 6 7 8 9 10  下一页

Tags:使用 IBM OmniFind

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接