WEB开发网
开发学院软件开发Java Text Analysis Perspective for IBM InfoSphere e... 阅读

Text Analysis Perspective for IBM InfoSphere eDiscovery Analyzer V2.1.1

 2010-04-16 00:00:00 来源:WEB开发网   
核心提示: 能够在自定义测试文档集合中测试分析引擎,来评估分析引擎内创建的词典和正则表达式规则的质量,Text Analysis Perspective for IBM InfoSphere eDiscovery Analyzer V2.1.1(2), 这些文档可以是来自文件系统,代表样例电子邮件和非电子邮

能够在自定义测试文档集合中测试分析引擎,来评估分析引擎内创建的词典和正则表达式规则的质量。 这些文档可以是来自文件系统,代表样例电子邮件和非电子邮件内容的文本文档。

能够跨测试比较分析结果,从而确定分析引擎中变化的影响。

能够对测试文档使用文本搜索以便确定要包含在词典中的合适的术语或者找到要在正则表达式规则中使用的合适的上下文术语。

工作方式

Text Analysis Perspective for eDiscovery Analyzer 支持用户通过必需的步骤,配置正则表达式规则和词典解决其业务问题。这些步骤如下:

创建 “Text Analysis Project”,该项目包含为文本分析配置任务量身定做的结构和操作。

导入样例文本或数据库列集合,测试注释器配置。

使用基于 Lucene 的文本搜索和一个用于常用术语分析的 Eclipse 插件研究这些文档,以便了解文档中出现的信息。

选择合适的分析引擎用于抽取任务。Text Analysis Perspective for eDiscovery Analyzer 包括两个内置分析引擎,它们都支持根据正则表达式和单词列表抽取信息。这些注释器合并在一个软件包 “Text Analysis Plug-ins” 中,它还包含处理这些注释器所需的所有必要的编辑器和查看器,无需文本分析技能。

在文档集合中运行分析引擎以便分析文档并抽取信息。结果存储在嵌入的 Derby 数据库中,用于结果评估。

了解并比较结果。Text Analysis Perspective for eDiscovery Analyzer 包含 Eclipse 查看器,用于查看文档集合中的结果以及比较不同测试的结果,以便了解配置变更(例如正则表达式规则的变化)的影响。

上一页  1 2 3 4 5 6 7  下一页

Tags:Text Analysis Perspective

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接