机器学习：支持向量机 SVM 原理与 Python 实战

一、前言

支持向量机（Support Vector Machine，SVM）是机器学习领域经典的有监督分类算法，自诞生以来凭借扎实的数学理论、优秀的小样本学习能力、强大的非线性拟合能力，在分类、回归等任务中得到了广泛应用。本文将从通俗的原理讲解入手，深入拆解 SVM 的核心逻辑，再基于 Python+sklearn 实现完整的 SVM 分类任务，包含可视化、模型训练、评估全流程，帮助读者从入门到实战彻底掌握 SVM。

二、SVM 核心原理（从通俗到深入）

2.1 什么是 SVM？一个通俗的小故事

我们用一个经典的故事理解 SVM 的核心思想：很久以前，公主被魔鬼绑架，王子需要完成魔鬼的挑战：用一根棍子分开桌子上两种颜色的球，并且要求后续加入更多球时，这根棍子依然能有效分类。

文章配图

第一次王子随便放了棍子，结果新增的球直接越界，分类失效；

文章配图

后来王子把棍子放在了两类球的中间，让棍子两边到最近的球的距离尽可能大，此时哪怕新增更多球，棍子依然能稳定分类；

文章配图

魔鬼又把球摆成了非线性的布局，二维平面里根本没法用一根直线分开，王子一拍桌子让球飞到空中，用一张纸完美隔开了两类球。

文章配图

对应到 SVM 的核心概念里：

两种颜色的球 = 我们的训练数据棍子 / 纸 = 分类决策边界（超平面）让棍子两边间隙最大的操作 = 最大间隔最优化拍桌子让球飞起来 = 核函数（低维映射到高维）离棍子最近、决定棍子位置的球 = 支持向量

2.2 核心目标：最优超平面与最大间隔

SVM 的核心目标，就是找到一个最优超平面，让不同类别的样本被完美分开，且两类样本到超平面的最小距离（间隔）最大化。

2.2.1 超平面方程

超平面是分类的决策边界，在不同维度空间有不同的表达形式：

二维平面：一条直线，方程为 $w^T x + b = 0$

三维空间：一个平面，方程为 $w^T x + b = 0$

更高维空间：超平面，通用方程为 $w^T x + b = 0$。

其中 $\omega$ 为超平面的法向量（决定超平面方向），$b$ 为偏置项（决定超平面的位置）。

最终的分类决策函数为：$f(x) = \text{sign}(\omega^T x + b)$。

其中 sign 为符号函数，输入大于 0 输出 1（正例），小于 0 输出 -1（负例）。

参数名	作用	核心说明
C	惩罚因子	浮点数，默认 1.0。C 越大，对误分类惩罚越重，易过拟合；C 越小，容错率越高，易欠拟合
kernel	核函数	默认 `rbf`，可选 `linear`（线性核）、`poly`（多项式核）、`sigmoid`
degree	多项式维度	整数，默认 3，仅对 `poly` 核生效，其他核函数会忽略该参数
gamma	核函数系数	仅对 `rbf`、`poly`、`sigmoid` 生效。gamma 越大，过拟合风险越高；gamma 越小，泛化能力越强
random_state	随机种子	固定随机种子，保证实验结果可复现

机器学习：支持向量机 SVM 原理与 Python 实战

一、前言

二、SVM 核心原理（从通俗到深入）

2.1 什么是 SVM？一个通俗的小故事

2.2 核心目标：最优超平面与最大间隔

2.2.1 超平面方程

2.2.2 点到超平面的距离

更多推荐文章

相关免费在线工具

2.2.3 最大间隔的优化目标

2.2.4 什么是支持向量？

2.3 软间隔：解决噪声与线性不可分

2.4 核函数：低维解决高维非线性问题

2.5 SVM 的优缺点

优点

缺点

三、SVM 实战：基于 Python+sklearn 实现

3.1 环境准备

3.2 实战一：二维特征线性 SVM 可视化

3.2.1 完整代码实现

3.2.2 结果可视化与解读

3.3 实战二：鸢尾花数据集全特征 SVM 多分类

3.3.1 数据集与预处理

3.3.2 完整代码实现

3.3.3 模型评估结果解读

训练集混淆矩阵

测试集混淆矩阵

测试集分类报告

四、SVM 核心 API 参数详解

五、总结

更多推荐文章

相关免费在线工具

机器学习：支持向量机 SVM 原理与 Python 实战

一、前言

二、SVM 核心原理（从通俗到深入）

2.1 什么是 SVM？一个通俗的小故事

2.2 核心目标：最优超平面与最大间隔

2.2.1 超平面方程

2.2.2 点到超平面的距离

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.2.3 最大间隔的优化目标

2.2.4 什么是支持向量？

2.3 软间隔：解决噪声与线性不可分

2.4 核函数：低维解决高维非线性问题

2.5 SVM 的优缺点

优点

缺点

三、SVM 实战：基于 Python+sklearn 实现

3.1 环境准备

3.2 实战一：二维特征线性 SVM 可视化

3.2.1 完整代码实现

3.2.2 结果可视化与解读

3.3 实战二：鸢尾花数据集全特征 SVM 多分类

3.3.1 数据集与预处理

3.3.2 完整代码实现

3.3.3 模型评估结果解读

训练集混淆矩阵

测试集混淆矩阵

测试集分类报告

四、SVM 核心 API 参数详解

五、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具