WEB开发网
开发学院数据库DB2 使用IBM OmniFind Enterprise Edition结合分类词典... 阅读

使用IBM OmniFind Enterprise Edition结合分类词典文件实现基于搜索结果分类

 2010-02-16 14:59:56 来源:WEB开发网   
核心提示:右键单击刚刚创建的com.ibm.uima.Analyze 包,并选择单击New/Class,使用IBM OmniFind Enterprise Edition结合分类词典文件实现基于搜索结果分类(6),创建获取分类词典 XML文件内容的类,我们将其命名为:RestaurantXML.java 和 ShopXML.ja

右键单击刚刚创建的com.ibm.uima.Analyze 包,并选择单击New/Class,创建获取分类词典 XML文件内容的类,我们将其命名为:RestaurantXML.java 和 ShopXML.java。见“参考资源”中的源代码。

完成以上工作后,我们便可以根据建立好的WFJDescriptor.xml 描述文件来编写WFJAnnotator.java的内容了。见“参考资源”中的源代码。其中使用到的restaurant 类和 shop 类就是根据 WFJDescriptor.xml 描述文件自动创建的Java程序。

创建 UIMA 语义分析引擎

为了能够测试之前编写的语义分析分类引擎能够正常工作,我们需要运行 UIMA的测试工具Common Analysis Structure(CAS),实际上就是利用之前建立工程 WFJ_UIMA中的com.ibm.uima.annot_view.Gladis 来运行整个工程。

在运行之前,由于之前建立的描述文件 WFJDescriptor.xml中并不包含基本的of_tokenization.xml(该文件位于UIMA_HOME/docs/examples/descriptors/analysis_engine/文件夹中)描述文件,因此我们需要创建一个Aggregate 聚集类型的描述文件来同时包含of_tokenization.xml 和 WFJDescriptor.xml 描述文件,以便 CAS的运行。

创建 WFJAggregateDescriptor.xml 描述文件:

右键单击desc文件夹并选择单击New/Other,之后在弹出的窗口中选择UIMA/Analysis Engine Descriptor,并单击Next;

在弹出的New Analysis Engine Descriptor File窗口中,我们定义文件名为: WFJAggregateDescriptor.xml并单击Finish 完成创建,之后 WFJAggregateDescriptor.xml文件会以UIMA descriptor editor的方式打开。这时需要在编辑窗口的Runtime Information 一栏中,将Engine Type 一项改为 Aggregate 状态;

在编辑窗口中选择单击Aggregate 标签,在出现的Aggregate Delegates and Flows窗口中单击Add… 按钮,在弹出的Component Engine Selection窗口中,导入 of_tokenization.xml 和 WFJDescriptor.xml 描述文件,导入文件都需要按 Import by location 方式。需要注意的是:在Aggregate Delegates and Flows窗口右侧 Component Engine Flow 一栏中,必须让 of_tokenization.xml 位于WFJDescriptor.xml 之前,如图 11 所示:
图 11. 修改 Aggregate Delegates and Flows
修改 Aggregate Delegates and Flows

在编辑窗口中选择单击Type System 标签,之后单击JcasGen 按钮,我们会发现工程中自动生成了一些包及 Java程序文件,如图 12 所示:
图 12. 修改 Type System
修改 Type System

上一页  1 2 3 4 5 6 7 8 9 10  下一页

Tags:使用 IBM OmniFind

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接