WEB开发网
开发学院软件开发Java Apache Mahout 简介:通过可伸缩、商业友好的机器... 阅读

Apache Mahout 简介:通过可伸缩、商业友好的机器学习来构建智能应用程序

 2009-10-15 00:00:00 来源:WEB开发网   
核心提示: 专注于实际用例,这与高新技术研究及未经验证的技巧相反,Apache Mahout 简介:通过可伸缩、商业友好的机器学习来构建智能应用程序(5),提供高质量文章和示例,特性虽然在开源领域中相对较为年轻,依照以下步骤安装示例代码:解压缩 sample.zipcd apache-mahout-exam

专注于实际用例,这与高新技术研究及未经验证的技巧相反。

提供高质量文章和示例。

特性

虽然在开源领域中相对较为年轻,但 Mahout 已经提供了大量功能,特别是在集群和 CF 方面。Mahout 的主要特性包括:

Map-Reduce 简介

Map-Reduce 是 Google 开发的一种分布式编程 API,并在 Apache Hadoop 项目中得到了实现。与分布式文件系统相结合,它可以为程序员提供一个定义良好的用于描述计算任务的 API,从而帮助他们简化并行化问题的任务。

Taste CF。Taste 是 Sean Owen 在 SourceForge 上发起的一个针对 CF 的开源项目,并在 2008 年被赠予 Mahout。

一些支持 Map-Reduce 的集群实现包括 k-Means、模糊 k-Means、Canopy、Dirichlet 和 Mean-Shift。

Distributed Naive Bayes 和 Complementary Naive Bayes 分类实现。

针对进化编程的分布式适用性功能。

Matrix 和矢量库。

上述算法的示例。

Mahout 入门

Mahout 的入门相对比较简单。首先,您需要安装以下软件:

JDK 1.6 或更高版本

Ant 1.7 或更高版本

如果要编译 Mahout 源代码,还需要安装 Maven 2.0.9 或 2.0.10

您还需要本文的示例代码(见 下载 部分),其中包括一个 Mahout 副本及其依赖关系。依照以下步骤安装示例代码:

解压缩 sample.zip

cd apache-mahout-examples

ant install

步骤 3 将下载必要的 Wikipedia 文件将编译代码。所使用的 Wikipedia 文件大约为 2.5 GB,因此下载时间将由您的宽带决定。

建立一个推荐引擎

上一页  1 2 3 4 5 6 7 8 9 10  下一页

Tags:Apache Mahout 简介

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接