wget http://mirrors.ustc.edu.cn/apache/mahout/0.8/mahout-distribution-0.8.tar.gz
tar -xzvf mahout-distribution-0.8.tar.gz
cd mahout-distribution-0.8
sudo vi /etc/profile
增加:
export PATH=$PATH:/home/ysc/mahout-distribution-0.8/bin
source /etc/profile
数据:hadoop fs -put clustering_material.txt testdata/clustering_material.txt
聚类1:mahoutorg.apache.mahout.clustering.syntheticcontrol.kmeans.Job
分析1:mahout clusterdump --input output/clusters-10-final --pointsDir output/clusteredPoints --output output/clusteranalyze_kmeans.txt
查看:
hadoopfs -lsr output
more output/clusteranalyze_kmeans.txt
VL-19代表这是一个cluster,n=161代表该cluster有161个点,c=[...]代表该cluster的中心向量点,r=[...]代表cluster的半径
聚类2:mahout org.apache.mahout.clustering.syntheticcontrol.canopy.Job
分析2:mahout clusterdump --input output/clusters-0-final --pointsDir output/clusteredPoints --output output/clusteranalyze_canopy.txt
聚类3:mahout org.apache.mahout.clustering.syntheticcontrol.fuzzykmeans.Job
分析3:mahout clusterdump --input output/clusters-6-final --pointsDir output/clusteredPoints --output output/clusteranalyze_fuzzykmeans.txt
聚类4:mahout org.apache.mahout.clustering.syntheticcontrol.dirichlet.Job
分析4:mahout clusterdump --input output/clusters-5-final --pointsDir output/clusteredPoints --output output/clusteranalyze_dirichlet.txt
聚类5:mahout org.apache.mahout.clustering.syntheticcontrol.meanshift.Job
分析5:mahout clusterdump --input output/clusters-3-final --pointsDir output/clusteredPoints --output output/clusteranalyze_meanshift.txt
相关推荐
NULL 博文链接:https://yangshangchuan.iteye.com/blog/1950172
使用mahout机器学习改进solr查询结果
Mahout机器学习领域分布式计算框架,详细介绍PPT
讲述了如何利用mahout机器学习改进solr查询结果
IT十八掌第三期大数据配套学习笔记! 1.Spark简介 2.Spark部署和运行 3.Spark程序开发 4. Spark编程模型 5.作业执行解析 6.Spark SQL与DataFrame ...8.Spark MLlib与机器学习 9.GraphX与SparkR 10.mahout
该数据包含两列,数据之间用空格进行划分,主要用来进行聚类分析,可以直接作为mahout机器学习平台的实验数据
机器学习 推荐引擎 聚类 分类 算法 数据挖掘
Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。 机器学习 • 机器学习是人工智能的一个分支,...
mahout_help,mahout的java api帮助文档,可以帮你更轻松掌握mahout
29.第二十九套:机器学习平台mahout,推荐系统算法与架构剖析视频教程
mahout聚类算法的介绍,例如:Canopy,KMeans,Fuzzy-KMeans,Spectral Clustering等参数介绍和适用场景介绍
mahout聚类算法学习必备,这只是一个最主要的kmeans算法,希望能帮到你们
Mahout机器学习库,可以提高开发效率;mahout安装图文介绍;详细步骤;
mahout mahout机器智能推荐系统
Mahout作为Apache的开源机器学习项目,把推荐系统、分类和聚类等领域的核心算法浓缩到了可扩展的现成的库中。使用Mahout,你可以立即在自己的项目中应用亚马逊、Netflix及其他互联网公司所采用的机器学习技术。, ...
mumu-crunch mahout机器学习算法 mumu-mahout是一个学习项目,主要通过这个项目来学习mahout的功能和使用方式。mahout是一款开源的机器学习算法,主要包括协同过滤推荐、聚类、分类等三大块内容。 推荐可以基于用户...
mahout 0.7 src, mahout 源码包, hadoop 机器学习子项目 mahout 源码包
Mahout是一个Java的机器学习库。Mahout的完整源代码,基于maven,可以轻易导入工程中
If you are a Java developer and want to use Mahout and Machine Learning to solve Big Data analytics use-cases then this book is for you. Familiarity with shell-scripts is assumed but no prior ...
它实现的算法都被归入机器学习或者集体智慧的范畴,但是在这里Mahout主要注重协同过滤/推荐引擎、聚类和分类。 Mahout是可伸缩的。Mahout致力于实现海量数据,单机无法处理情况下的机器学习工具。在目前阶段,这种...