Lasso 回归算法详解与应用 | 极客日志

PythonAI算法

Lasso 回归算法详解与应用

综述由AI生成Lasso 回归是一种引入 L1 正则化的线性回归技术，通过惩罚系数绝对值之和实现特征选择并防止过拟合。其核心机制是将不重要特征的系数压缩至零，从而简化模型。 Lasso 回归的原理、目标函数及坐标下降法求解过程，并通过 Python 代码示例展示了如何使用 scikit-learn 进行数据标准化、模型训练及结果可视化，适用于高维数据挖掘及追求模型可解释性的场景。

女王发布于 2026/3/27更新于 2026/6/126 浏览

1. 什么是回归算法？

回归算法是一类用于预测数值型结果的机器学习方法。

它的核心目标是建立自变量（如年龄、收入、教育背景）与因变量（如房价、销售额）之间的关系模型。一旦这个关系被确定，模型就可以根据新的自变量输入来预测对应的因变量值。

文章配图

举个例子：如果我们想依据身高预测体重，可以先收集一批包含身高和体重的样本数据。

基于这些数据，回归算法会拟合出一个数学公式（模型）来描述二者之间的关系。

之后，对于任何一个已知身高但未知体重的人，我们就可以利用这个模型来估算其体重。

2. 什么是 Lasso 回归？

Lasso 回归（最小绝对收缩和选择算子）是一种改进的线性回归技术。

它通过引入'L1 正则化'来防止模型在训练数据上过度拟合。

文章配图

其关键机制在于，它在模型优化的目标函数中增加了一项惩罚项，该惩罚项与模型系数的绝对值之和成正比。这一机制会倾向于将那些不重要的特征系数压缩至零，从而实现特征自动选择，并最终产生一个更简洁、解释性更强的稀疏模型。

Lasso 回归的核心作用主要体现在两个方面：

特征选择：它能够自动地将不重要的自变量的系数压缩至零，从而将这些特征从模型中完全排除。这相当于一个自动的特征筛选过程，有助于我们识别出最关键的影响因素。
防止过拟合：通过对模型系数的大小施加惩罚，Lasso 回归限制了模型的复杂度。这可以有效避免模型过度迎合训练数据中的噪声，从而提升其在未知数据上的预测能力，即泛化能力。

Lasso 回归的目标函数由两部分组成：

目标函数 = 残差平方和 + λ × 系数绝对值之和

用数学公式表示为：

minimize {∑(yi - ∑xijβj)² + λ∑|βj|}

第一部分：∑(yi - ∑xijβj)² 这是普通线性回归的目标，即最小化预测值与真实值之间的误差平方和（残差平方和），旨在让模型更好地拟合数据。
第二部分：λ∑|βj| 这是 Lasso 回归特有的L1 正则化项（惩罚项）。它惩罚的是模型系数 βj 的绝对值之和。参数 λ（lambda） 控制着惩罚的力度：λ 越大，惩罚越重，被压缩至零的系数就越多，模型就越简单。

一个简单案例

假设我们的目标是预测某个地区的房价（单位：千元），并认为其主要受「房屋面积」、「房间数」和「房屋年份」三个因素影响。我们拥有以下数据样本：

样本编号	面积（平方米）	房间数	房屋年份	房价（千元）
1	120	3	10	300
2	80	2	15	180
3	150	4	8	350
4

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.linear_model import Lasso
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error

# 1. 生成模拟数据
np.random.seed(42)
n_samples = 1000
n_features = 10

# 模拟生成宏观经济特征
X = np.random.randn(n_samples, n_features) * 10
columns = [f'feature_{i+1}' for i in range(n_features)]
df = pd.DataFrame(X, columns=columns)

# 设置特征的权重（真实情况会更复杂）
true_weights = np.array([2, -1.5, 3, 0, 0, 4, 0, 0, -2, 1])
y = df.values @ true_weights + np.random.randn(n_samples) * 5

# 加入噪声
df['Stock_Price'] = y

# 2. 数据标准化和特征选择（使用 Lasso）
X_train, X_test, y_train, y_test = train_test_split(df[columns], df['Stock_Price'], test_size=0.3, random_state=42)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

lasso = Lasso(alpha=0.1)  # 设置 L1 正则化系数
lasso.fit(X_train_scaled, y_train)

# 获得选择的特征
selected_features = [columns[i] for i in range(n_features) if lasso.coef_[i] != 0]
print(f"Selected features by Lasso: {selected_features}")

# 3. 绘制图形
# 图 1：各特征与股票价格的相关性热力图
plt.figure(figsize=(12, 8))
correlation = df.corr()
sns.heatmap(correlation, annot=True, cmap='coolwarm', center=0, fmt='.2f', annot_kws={"size": 8}, linewidths=0.5)
plt.title("Heatmap of Feature Correlations with Stock Price", fontsize=16)
plt.xticks(rotation=45)
plt.yticks(rotation=45)
plt.show()

# 图 2：预测值和真实股票价格的对比
y_pred = lasso.predict(X_test_scaled)
mse = mean_squared_error(y_test, y_pred)
print(f"Mean Squared Error: {mse:.2f}")

plt.figure(figsize=(14, 8))
plt.plot(y_test.values, label="True Stock Price", color='blue', linewidth=2)
plt.plot(y_pred, label="Predicted Stock Price by Lasso", color='red', linestyle='--', linewidth=2)
plt.fill_between(range(len(y_test)), y_test, y_pred, color='purple', alpha=0.3)
plt.title("True vs Predicted Stock Price (Lasso Regression)", fontsize=16)
plt.xlabel("Sample Index", fontsize=12)
plt.ylabel("Stock Price", fontsize=12)
plt.legend(loc='upper left', fontsize=12)
plt.show()

Lasso 回归算法详解与应用

1. 什么是回归算法？

2. 什么是 Lasso 回归？

更多推荐文章

相关免费在线工具

3. Lasso 回归：数学原理与深入解析

4. 完整代码

更多推荐文章

相关免费在线工具

Lasso 回归算法详解与应用

1. 什么是回归算法？

2. 什么是 Lasso 回归？

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. Lasso 回归：数学原理与深入解析

4. 完整代码

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具