算法
scikit-learn实现近邻算法分类的示例
scikit-learn库 scikit-learn已经封装好很多数据挖掘的算法 现介绍数据挖掘框架的搭建方法 * 转换器(Transformer)用于数据预处理,数据转换 * 流水线(Pipeline)组合数据挖掘流程,方便再次使用(封装) * 估计器(Estimator)用于分类,聚类,回归分析(各种算法对象) * 所有的估计器都有下面2个函数 * fit() 训练 * 用法:estimator.fit(X_train, y_train), * estimator = KNeighborsClassifier() 是scikit-learn算法对象 * X_train = dataset.data 是numpy数组 * y_train = dataset.target 是numpy数组 * predict() 预测 * 用法:estimator.predict(X_test) * estimator = KNeighborsClassifier(