WEB开发网
开发学院数据库DB2 将 InfoSphere Warehouse 数据挖掘与 IBM Cognos ... 阅读

将 InfoSphere Warehouse 数据挖掘与 IBM Cognos 报告集成,第 1 部分: InfoSphere Warehouse 与 Cognos 集成架构概述

 2009-12-31 00:00:00 来源:WEB开发网   
核心提示: 数据挖掘是一项从大型数据集中发现有用信息的任务,一个典型的场景是医疗保健,将 InfoSphere Warehouse 数据挖掘与 IBM Cognos 报告集成,第 1 部分: InfoSphere Warehouse 与 Cognos 集成架构概述(3),本文将用它作为实例,如今可以收集到大

数据挖掘是一项从大型数据集中发现有用信息的任务。一个典型的场景是医疗保健,本文将用它作为实例。如今可以收集到大量的卫生保健数据,这些数据描述很多不同的病人数年来的状态。这种数据的一个重要用途是在早期发现潜伏性疾病的指标。例如,出于这个目的,可以收集患有心脏病的病人的数据,并分析什么因素与这种疾病有关,例如血压和体重。这种数据必须在收集后进行转换,使之能用于数据挖掘。更具体而言,需要有一个表,每个病人对应于其中的一行记录,表中有一些列,表示关于病人的信息。而且,还应该有一个专门的列表明这个病人是否真正患病。图 1 显示了一种可能的模式:


图 1. 心脏病数据库表的模式(InfoSphere Warehouse 例子的一部分)
将 InfoSphere Warehouse 数据挖掘与 IBM Cognos 报告集成,第 1 部分: InfoSphere Warehouse 与 Cognos 集成架构概述

基于这种数据,InfoSphere Warehouse 中的存储过程可以构建一个模型,对于任何新的病人,该模型可以预测他/她是否可能有潜伏性心脏病。这个过程称作 “建模”。这样得到的 XML 数据挖掘模型存储在数据库中,可以通过 SQL/XQuery 进行访问。这个模型可用于两个目的:首先,可以从这个模型提取信息,以洞察哪些是心脏病的重要指标以及其他统计信息。其次,可以将该模型自动应用到新的数据记录上。因此,对于在心脏病这一列上还没有值的任何记录,可以自动添加这个值,另外再添加一个表示预测的置信度的一个值。这个过程称作 “评价”。图 2 通过示意图显示了这个过程:

上一页  1 2 3 4 5 6 7 8  下一页

Tags:InfoSphere Warehouse 数据挖掘

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接