如何在hadoop上运行 k-means算法

2025-01-07 05:25:34
推荐回答(1个)
回答1:

可以自己尝试写一个分布式的kmeans,也可以部署spark,使用spark-mllib里面的kmeans
如果对python比较熟悉,可以使用pyspark的mllib
如果只是hadoop,找找mahout算法包