WEB开发网
开发学院数据库DB2 将 InfoSphere Warehouse 数据挖掘与 IBM Cognos ... 阅读

将 InfoSphere Warehouse 数据挖掘与 IBM Cognos 报告集成,第 2 部分: 使用 InfoSphere Warehouse 和 Cognos 检测偏差

 2009-12-31 00:00:00 来源:WEB开发网   
核心提示: 图 1. 基于集群的偏差检测查看原图(大图)离群值与非离群值之间并没有明显的区别,实际上,将 InfoSphere Warehouse 数据挖掘与 IBM Cognos 报告集成,第 2 部分: 使用 InfoSphere Warehouse 和 Cognos 检测偏差(3),用户必须指定一个阈


图 1. 基于集群的偏差检测
将 InfoSphere Warehouse 数据挖掘与 IBM Cognos 报告集成,第 2 部分: 使用 InfoSphere Warehouse 和 Cognos 检测偏差

查看原图(大图)

离群值与非离群值之间并没有明显的区别。实际上,用户必须指定一个阈值,以便界定离群值。偏差度高于这个阈值的所有集群被标记为离群值集群,它们的成员都是离群值。这个阈值可通过两种方式来设置。首先,如果检查离群值的专家有限,那么可以使用具有最高偏差度的集群的数据记录。如果要寻找有投资前景的公司,那么可以先从具有最高偏差度的集群开始,然后在资源允许的情况下,逐渐转向偏差度较低的集群。其次,阈值可以是固定的。一个例子就是警报场景,在此场景中,当有新的数据记录分配到具有高于给定阈值的偏差度的集群时,则需要采取行动。InfoSphere Warehouse 同时支持这两种方式,您只需为每个数据记录赋予一个集群 id 和相应的偏差度。您可以过滤记录,也可以对它们进行排序,从而获得想要查看或必须检查的离群值。接下来的小节将提供一个例子,以逐步演示如何用 InfoSphere Warehouse 发现离群值,以及如何为各个数据记录赋予偏差度。

一个实例

接下来的例子对关于银行客户的条目应用偏差检测。图 2 中显示了相应表中的示例数据。表 BANK.BANKCUSTOMERS 是 InfoSphere Warehouse 的示例中附带的。


图 2. BANK.BANKCUSTOMERS 表中的示例数据
将 InfoSphere Warehouse 数据挖掘与 IBM Cognos 报告集成,第 2 部分: 使用 InfoSphere Warehouse 和 Cognos 检测偏差

上一页  1 2 3 4 5 6 7 8  下一页

Tags:InfoSphere Warehouse 数据挖掘

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接