WEB开发网
开发学院软件开发Java 用 WEKA 进行数据挖掘,第 2 部分: 分类和群集 阅读

用 WEKA 进行数据挖掘,第 2 部分: 分类和群集

 2010-06-23 00:00:00 来源:WEB开发网   
核心提示: 查看原图(大图)与我们在 用 WEKA 进行数据挖掘,第 1 部分:简介和回归 中对回归模型所做的类似,用 WEKA 进行数据挖掘,第 2 部分: 分类和群集(6),我们选择 Classify 选项卡,然后选择 trees 节点,请确保 Use training set 被选中以便我们使用刚刚加

查看原图(大图)

与我们在 用 WEKA 进行数据挖掘,第 1 部分:简介和回归 中对回归模型所做的类似,我们选择 Classify 选项卡,然后选择 trees 节点,然后是 J48 叶子(我不知道为何这就是正式的名称,不过还是接受吧)。

图 2. BMW 分类算法
用 WEKA 进行数据挖掘,第 2 部分: 分类和群集

查看原图(大图)

至此,我们已经准备好可以在 WEKA 内创建我们的模型了。请确保 Use training set 被选中以便我们使用刚刚加载的这个数据集来创建模型。单击 Start 并让 WEKA 运行。模型的输出应类似于清单 3 内的结果。

清单 3. WEKA 的分类模型的输出

Number of Leaves : 28 
 
Size of the tree : 43 
 
 
Time taken to build model: 0.18 seconds 
 
=== Evaluation on training set === 
=== Summary === 
 
Correctly Classified Instances    1774        59.1333 % 
Incorrectly Classified Instances   1226        40.8667 % 
Kappa statistic             0.1807 
Mean absolute error           0.4773 
Root mean squared error         0.4885 
Relative absolute error         95.4768 % 
Root relative squared error       97.7122 % 
Total Number of Instances       3000   
 
=== Detailed Accuracy By Class === 
 
        TP Rate  FP Rate  Precision  Recall F-Measure  ROC Area Class 
         0.662   0.481   0.587   0.662   0.622   0.616  1 
         0.519   0.338   0.597   0.519   0.555   0.616  0 
Weighted Avg.  0.591   0.411   0.592   0.591   0.589   0.616 
 
=== Confusion Matrix === 
 
  a  b  <-- classified as 
 1009 516 |  a = 1 
 710 765 |  b = 0

上一页  1 2 3 4 5 6 7 8 9 10  下一页

Tags:WEKA 进行 数据挖掘

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接