开发学院数据库 DB2 使用 IBM OmniFind Enterprise Edition 结合分类词... 阅读

使用 IBM OmniFind Enterprise Edition 结合分类词典文件实现基于搜索结果分类

　2008-11-08 16:32:41　来源：WEB开发网　　　

核心提示： 单击 Eclipse 菜单中 Windows/Preferences 选项，并在弹出的窗口中左侧选择 UIMA Preferences，使用 IBM OmniFind Enterprise Edition 结合分类词典文件实现基于搜索结果分类(9)，右侧取消标记 Automatically

单击 Eclipse 菜单中 Windows/Preferences 选项，并在弹出的窗口中左侧选择 UIMA Preferences，右侧取消标记 Automatically run JCasGen when Types change 一项，如图 7 所示：

图 7. 设置 UIMA 首选项

完成以上工作之后，我们就可以编写程序来实现语义分析引擎，步骤如下：

右键单击 src 文件夹，选择 New/Package 创建 Package 并命名为：com.ibm.uima.Analyze；

右键单击创建的 com.ibm.uima. Analyze 包，并选择单击 New/Class，创建分析引擎用来分析文本并分类的类，我们将其命名为：WFJAnnotator。这里需要注意的是：所创建的 WFJAnnotator 类的 superclass 不应该使用 java.lang.Object，我们应该选择 com.ibm.uima.analysis_engine.annotator.JTextAnnotator_ImplBase，如图 8 所示：

图 8. 建立 WFJAnnotator 类

使用 IBM OmniFind Enterprise Edition 结合分类词典文件实现基于搜索结果分类

在编写 WFJAnnotator.java 之前，我们首先需要创建一个描述文件，这个描述文件采用 XML 文件描述方式，其中包含了内容分析分类的结构信息，其创建过程步骤如下：

右键单击 desc 文件夹并选择单击 New/Other，之后在弹出的窗口中选择 UIMA/Analysis Engine Descriptor，并单击 Next；

在弹出的 New Analysis Engine Descriptor File 窗口中，我们定义文件名为 WFJDescriptor.xml 并单击 Finish 完成创建，之后 WFJDescriptor.xml 文件会以 UIMA descriptor editor 的方式打开。之后在编辑窗口的 Runtime Information 一栏中，需要填写 Name of the Java class file 一项，其内容为 com.ibm.uima.Analyze. WFJAnnotator，如图 9 所示：

上一页 4 5 6 7 8 9 10 下一页