机器学习:聚类分析算法详解
本文介绍了机器学习中的聚类分析算法。首先定义了聚类分析作为一种无监督学习方法,旨在根据相似性将数据划分为若干簇。接着对比了聚类与分类在学习方式(无监督 vs 有监督)、目标(发现结构 vs 预测类别)及评估方式上的区别。文章列举了五种常见的聚类算法分类:划分法(如 K-Means)、层次法、基于密度的方法(如 DBSCAN)、基于网格的方法和基于模型的方法(如 GMM)。最后详细阐述了 K-Means 算法的原理、数学目标及具体执行步骤,包括初始化中心、分配簇、更新质心直至收敛的过程。






是簇 C_i 的质心。
