WEB开发网
开发学院软件开发Java 用 WEKA 进行数据挖掘,第 3 部分: 最近邻和服务器... 阅读

用 WEKA 进行数据挖掘,第 3 部分: 最近邻和服务器端库

 2010-06-23 00:00:00 来源:WEB开发网   
核心提示: WEKA 内的最近邻 我们为何要使用与分类例子中相同的数据集呢?这是因为分类模型得到的结果,只有 59 % 的准确率,用 WEKA 进行数据挖掘,第 3 部分: 最近邻和服务器端库(5),而这完全不能接受(比猜想好不到哪去),我们将提高准确率并为这个虚构的经销商提供一些有用的信息,让 WEKA

WEKA 内的最近邻

我们为何要使用与分类例子中相同的数据集呢?这是因为分类模型得到的结果,只有 59 % 的准确率,而这完全不能接受(比猜想好不到哪去)。我们将提高准确率并为这个虚构的经销商提供一些有用的信息。

将数据文件 bmw-training.arff 载入 WEKA,步骤与我们之前在 Preprocess 选项卡中使用的相同。加载数据后,屏幕应该类似于图 1。

图 1. WEKA 内的 BMW 最近邻数据
用 WEKA 进行数据挖掘,第 3 部分: 最近邻和服务器端库

查看原图(大图)

与我们在之前文章的回归和分类模型中所做的类似,我们接下来应该选择 Classify 选项卡。在这个选项卡上,我们应该选择 lazy,然后选择 IBk(IB 代表的是 Instance-Based,而 k 则允许我们指定要使用的邻的数量)。

图 2. BMW 最近邻算法
用 WEKA 进行数据挖掘,第 3 部分: 最近邻和服务器端库

查看原图(大图)

现在,我们就准备好可以在 WEKA 内创建我们的模型了。请确保选中 Use training set 以便我们使用刚载入的这个数据集来创建我们的模型。 单击 Start,让 WEKA 运行。图 3 显示了一个屏幕快照,清单 3 则包含了此模型的输出。

上一页  1 2 3 4 5 6 7 8 9 10  下一页

Tags:WEKA 进行 数据挖掘

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接