如何将excel表中的数据用weka进行聚类分析

2025-03-21 06:12:00
推荐回答(2个)
回答1:

你用weka做二次开发,你也没说你哪些接口用的weka的,首先你生成的arff文件中,文档有没有先分词,分词后有没有离散化,确保你的arff文件中attribute必须是一个一个的词,当然训练时也要包含类别信息,用于聚类后的验证,离散化后转成vsm模式,聚类方法你估计用的weka接口实现的,kmeans的输入参数可以指定聚几个类。

回答2:

在分析之前要先转换下格式。
把excel表导出为.csv文件,然后在文件首行为每个属性加入名称(不加的话weka会把第一行数据当做每个属性的名称);
因为weka支持.csv格式的数据集,所以现在就可以使用weka
explorer或命令行调用相关的聚类算法进行分析了^^