K-近邻算法（KNN）原理、流程与 Python 实战案例

K-近邻算法（KNN）原理、流程与 Python 实战案例 | 极客日志

import matplotlib.pyplot as plt 
import numpy as np 
# 训练数据 
X_train = np.array([[1,2],[2,3],[3,1],[6,5],[7,7],[8,6]]) 
y_train = np.array([0,0,0,1,1,1]) # 0: 蓝色，1: 红色 
plt.scatter(X_train[y_train==0,0], X_train[y_train==0,1], color='blue', label='Class 0') 
plt.scatter(X_train[y_train==1,0], X_train[y_train==1,1], color='red', label='Class 1') 
plt.xlabel('X1') 
plt.ylabel('X2') 
plt.title('KNN Training Data') 
plt.legend() 
plt.show()

import matplotlib.pyplot as plt 
import numpy as np 
from sklearn.neighbors import KNeighborsClassifier 
# 训练数据 
X_train = np.array([[1,2],[2,3],[3,1],[6,5],[7,7],[8,6]]) 
y_train = np.array([0,0,0,1,1,1]) # 0: 蓝色，1: 红色 
knn = KNeighborsClassifier(n_neighbors=3) 
knn.fit(X_train, y_train) 
# 新样本 
X_test = np.array([[3,4],[7,5]]) 
y_pred = knn.predict(X_test) 
print("Predicted classes:", y_pred)

import matplotlib.pyplot as plt 
import numpy as np 
from sklearn.neighbors import KNeighborsClassifier 
# 训练数据 
X_train = np.array([[1,2],[2,3],[3,1],[6,5],[7,7],[8,6]]) 
y_train = np.array([0,0,0,1,1,1]) # 0: 蓝色，1: 红色 
knn = KNeighborsClassifier(n_neighbors=3) 
knn.fit(X_train, y_train) 
# 新样本 
X_test = np.array([[3,4],[7,5]]) 
y_pred = knn.predict(X_test) 
print("Predicted classes:", y_pred) 
# 绘制决策边界 
h = .02 # 网格步长 
x_min, x_max = X_train[:, 0].min() - 1, X_train[:, 0].max() + 1 
y_min, y_max = X_train[:, 1].min() - 1, X_train[:, 1].max() + 1 
xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h)) 
Z = knn.predict(np.c_[xx.ravel(), yy.ravel()]) 
Z = Z.reshape(xx.shape) 
plt.contourf(xx, yy, Z, alpha=0.3, cmap=plt.cm.RdBu) 
plt.scatter(X_train[y_train==0,0], X_train[y_train==0,1], color='blue', label='Class 0') 
plt.scatter(X_train[y_train==1,0], X_train[y_train==1,1], color='red', label='Class 1') 
plt.scatter(X_test[:,0], X_test[:,1], color='green', marker='*', s=200, label='Test Points') 
plt.xlabel('X1') 
plt.ylabel('X2') 
plt.title('KNN Decision Boundary (K=3)') 
plt.legend() 
plt.show()

import numpy as np 
import matplotlib.pyplot as plt 
from sklearn.datasets import make_moons 
from sklearn.neighbors import KNeighborsClassifier 
from sklearn.model_selection import cross_val_score 
# 增加噪声、减少样本数 
X, y = make_moons(n_samples=60, noise=0.5, random_state=42) 
plt.scatter(X[y==0,0], X[y==0,1], color='blue', label='Class 0', alpha=0.6) 
plt.scatter(X[y==1,0], X[y==1,1], color='red', label='Class 1', alpha=0.6) 
plt.title('Noisy Moons Dataset (n=60, noise=0.5)') 
plt.legend() 
plt.show() 
cv = 5 
max_k = 20 
k_range = range(1, max_k+1) 
scores = [] 
for k in k_range: 
    knn = KNeighborsClassifier(n_neighbors=k) 
    score = cross_val_score(knn, X, y, cv=cv, scoring='accuracy').mean() 
    scores.append(score) 
plt.plot(k_range, scores, marker='o') 
plt.xlabel('K') 
plt.ylabel('Cross-validated Accuracy') 
plt.title('K Selection for KNN on Noisy Moons (n=60, noise=0.5)') 
plt.grid(True) 
plt.show() 
best_k = k_range[np.argmax(scores)] 
print(f"Best K: {best_k}, Best CV Accuracy: {max(scores):.3f}") 
print("All scores:", scores)

knn = KNeighborsClassifier(n_neighbors=3, metric='manhattan')

from sklearn.neighbors import KNeighborsClassifier 
import numpy as np 
# 训练数据 
X_train = np.array([[1,2],[2,3],[3,1],[6,5],[7,7],[8,6]]) 
y_train = np.array([0,0,0,1,1,1]) # 0: 蓝色，1: 红色 
# 曼哈顿距离（L1 范数） 
knn = KNeighborsClassifier(n_neighbors=3, metric='manhattan') 
knn.fit(X_train, y_train) 
# 测试数据 
X_test = np.array([[3,4],[7,5]]) 
y_pred = knn.predict(X_test) 
print("Manhattan KNN Predicted classes:", y_pred)

knn = KNeighborsClassifier(n_neighbors=3, weights='distance')

from sklearn.neighbors import KNeighborsClassifier 
import numpy as np 
import matplotlib.pyplot as plt 
# 训练数据 
X_train = np.array([[1,2],[2,3],[3,1],[6,5],[7,7],[8,6]]) 
y_train = np.array([0,0,0,1,1,1]) # 0: 蓝色，1: 红色 
# 加权 KNN（距离倒数加权） 
knn = KNeighborsClassifier(n_neighbors=3, weights='distance') 
knn.fit(X_train, y_train) 
# 测试数据 
X_test = np.array([[3,4],[7,5]]) 
y_pred = knn.predict(X_test) 
print("Weighted KNN Predicted classes:", y_pred) 
# 决策边界可视化 
h = .02 
x_min, x_max = X_train[:, 0].min() - 1, X_train[:, 0].max() + 1 
y_min, y_max = X_train[:, 1].min() - 1, X_train[:, 1].max() + 1 
xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h)) 
Z = knn.predict(np.c_[xx.ravel(), yy.ravel()]) 
Z = Z.reshape(xx.shape) 
plt.contourf(xx, yy, Z, alpha=0.3, cmap=plt.cm.RdBu) 
plt.scatter(X_train[y_train==0,0], X_train[y_train==0,1], color='blue', label='Class 0') 
plt.scatter(X_train[y_train==1,0], X_train[y_train==1,1], color='red', label='Class 1') 
plt.scatter(X_test[:,0], X_test[:,1], color='green', marker='*', s=200, label='Test Points') 
plt.xlabel('X1') 
plt.ylabel('X2') 
plt.title('Weighted KNN Decision Boundary (K=3)') 
plt.legend() 
plt.show()

import numpy as np 
import matplotlib.pyplot as plt 
from sklearn.neighbors import KNeighborsRegressor 
# 1. 生成带噪声的非线性训练数据 
np.random.seed(42) 
X_train = np.sort(5 * np.random.rand(40, 1), axis=0) 
y_train = np.sin(X_train).ravel() + 0.3 * np.random.randn(40) # 正弦 + 高斯噪声 
# 2. 创建测试数据用于预测（密集采样，便于画曲线） 
X_test = np.linspace(0, 5, 500)[:, np.newaxis] 
# 3. 创建两个 KNN 回归模型，分别用 uniform 和 distance 权重 
knn_uniform = KNeighborsRegressor(n_neighbors=5, weights='uniform') 
knn_distance = KNeighborsRegressor(n_neighbors=5, weights='distance') 
# 4. 训练模型 
knn_uniform.fit(X_train, y_train) 
knn_distance.fit(X_train, y_train) 
# 5. 预测 
y_pred_uniform = knn_uniform.predict(X_test) 
y_pred_distance = knn_distance.predict(X_test) 
# 6. 可视化 
plt.figure(figsize=(10, 6)) 
plt.scatter(X_train, y_train, color='darkorange', label='Training data') 
plt.plot(X_test, y_pred_uniform, color='navy', label='Uniform weights') 
plt.plot(X_test, y_pred_distance, color='c', label='Distance weights') 
plt.title('KNN Regression with Uniform and Distance Weights') 
plt.xlabel('X') 
plt.ylabel('y') 
plt.legend() 
plt.show()

K-近邻算法（KNN）原理、流程与 Python 实战案例

K-近邻算法（KNN）详细全流程详解与案例

一、KNN 算法简介

二、KNN 算法原理与数学表达

1. 距离度量

2. KNN 分类数学表达

3. KNN 回归数学表达

更多推荐文章

相关免费在线工具

三、KNN 算法详细流程

Step 1：准备数据

Step 2：选择距离度量方式

Step 3：确定 K 值

Step 4：预测新样本

Step 5：评估与调优

四、KNN 案例流程与完整代码演示

1. 数据准备与可视化

2. 用 KNN 预测新样本

3. 可视化决策边界

五、KNN 进阶内容与工程实践

1. K 值选择与模型表现

2. 距离度量的选择与影响

3. 加权 KNN

4. KNN 回归

1. 数据生成

2. 测试点

3. KNN 回归模型

4. 训练与预测

5. 可视化解析

6. 小结

KNN 回归示例：带噪声的正弦数据上，使用 uniform 和 distance 权重的预测曲线对比

5. KNN 的优缺点与工程建议

六、KNN 算法总结

更多推荐文章

相关免费在线工具

K-近邻算法（KNN）原理、流程与 Python 实战案例

K-近邻算法（KNN）详细全流程详解与案例

一、KNN 算法简介

二、KNN 算法原理与数学表达

1. 距离度量

2. KNN 分类数学表达

3. KNN 回归数学表达

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

三、KNN 算法详细流程

Step 1：准备数据

Step 2：选择距离度量方式

Step 3：确定 K 值

Step 4：预测新样本

Step 5：评估与调优

四、KNN 案例流程与完整代码演示

1. 数据准备与可视化

2. 用 KNN 预测新样本

3. 可视化决策边界

五、KNN 进阶内容与工程实践

1. K 值选择与模型表现

2. 距离度量的选择与影响

3. 加权 KNN

4. KNN 回归

1. 数据生成

2. 测试点

3. KNN 回归模型

4. 训练与预测

5. 可视化解析

6. 小结

KNN 回归示例：带噪声的正弦数据上，使用 uniform 和 distance 权重的预测曲线对比

5. KNN 的优缺点与工程建议

六、KNN 算法总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具