WEB开发网
开发学院数据库DB2 将 InfoSphere Warehouse 数据挖掘与 IBM Cognos ... 阅读

将 InfoSphere Warehouse 数据挖掘与 IBM Cognos 报告集成,第 2 部分: 使用 InfoSphere Warehouse 和 Cognos 检测偏差

 2009-12-31 00:00:00 来源:WEB开发网   
核心提示: 对于每个记录,添加将其划分为离群值的信息,将 InfoSphere Warehouse 数据挖掘与 IBM Cognos 报告集成,第 2 部分: 使用 InfoSphere Warehouse 和 Cognos 检测偏差(6),如前所述,每个记录被指定到一个集群,它们不是显式地在数据库中创建的

对于每个记录,添加将其划分为离群值的信息。如前所述,每个记录被指定到一个集群,一个集群的所有成员具有相同的偏差度。因此,可以使用一个集群的属性来描述离群值。例如,如果一个集群中大部分是年轻人,而他们有较高的平均余额,那么这可以很好地解释为什么这个集群被认为是离群值集群。

接下来的小节首先展示如何用附加信息扩展离群值。然后,您将创建一个交互式报告,该报告将客户按职业分组,并且允许使用 Cognos 的 “穿透钻取” 特性交互式地选择一个特定类别中的离群值。

从挖掘模型中提取附加信息

表 CUSTOMER_OL 包含关于离群值的相关信息。如前所述,每个记录被指定到一个集群。“Find Deviations” 操作符在后台创建一个集群模型,其中存储关于这些集群的详细信息。该信息以 PMML(Predictive Model Markup Language)格式存储在数据库中。它包含关于以下方面的信息:

集群中值的分布

集群中记录的数量

每个集群的偏差的重要性

集群的同质性

其他

可以使用 InfoSphere Warehouse 附带的存储过程将该信息提取到结果集中,以便 Cognos 进一步处理。这样的结果集可以看作是 “视图”,它们不是显式地在数据库中创建的,而是由存储过程动态地创建的。

如果要提取关于集群的文本信息,可使用以下命令:

SELECT ID, DESCRIPTION FROM TABLE(IDMMX.DM_GETCLUSTERS((SELECT MODEL FROM IDMMX.CLUSTERMODELS WHERE MODELNAME='IDMMX.OUTLIERMODEL'))) AS CT

这样可以得到一个包含以下列的表:

ID:集群的 id(对应于 CUSTOMER_OL 表中的 ID)

DESCRIPTION:集群的文本描述

上一页  1 2 3 4 5 6 7 8 9 10  下一页

Tags:InfoSphere Warehouse 数据挖掘

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接