[摘要] 利用模糊C均值算法解决文本聚类问题时,随机选取的初始聚类中心和聚类数会导致不同的聚类结果,且容易陷入局部最优。提出利用粒子群优化算法确定模糊c均值的初始聚类中心,并通过向量空间模型和特征提取,再利用模糊c均值进行文档聚类。实验表明,这种基于粒子群的模糊c均值聚类算法迭代次数少,能解决经典模糊c均值算法对初始值敏感和易陷入局部极小的缺点,且聚类速度和效果得到明显提高。
[关键词] 模糊C均值 粒子群 文本聚类
[分类号] TP391
注:“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文”