机器学习中的逻辑回归与 Softmax 回归多分类应用 | 极客日志

PythonAI算法

机器学习中的逻辑回归与 Softmax 回归多分类应用

综述由AI生成机器学习中逻辑回归与 Softmax 回归的原理及实现。涵盖二分类与多分类场景，讨论了类别不平衡问题的重采样解决方案，并通过 Iris 数据集案例演示了模型训练、标准化处理及评估流程。实验表明在简单线性可分数据上逻辑回归表现优异。

念念不忘发布于 2026/3/28更新于 2026/6/231 浏览

引言

在机器学习中，分类问题是最常见的一类问题。无论是二分类还是多分类，解决这些问题的算法有很多，其中逻辑回归、Softmax 回归和集成学习方法在实际应用中被广泛使用。但在实际数据中，类别不平衡问题可能会影响模型的效果，如何有效地解决这一问题也是一个亟待解决的难题。

逻辑回归

概述：逻辑回归（Logistic Regression）是一种用于二分类问题的经典线性分类器，目标是通过训练数据集的特征来预测某一类别的概率。

模型原理：逻辑回归的核心是使用 sigmoid 函数将线性组合的输出映射到 [0,1] 区间，用于二分类问题。

代码实现

from sklearn.linear_model import LogisticRegression
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report

# 生成数据集
X, y = make_classification(n_samples=1000, n_features=20, n_informative=10, random_state=42)
# 数据分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 训练模型
model = LogisticRegression()
model.fit(X_train, y_train)
# 预测
y_pred = model.predict(X_test)
# 评估
print(classification_report(y_test, y_pred))

优缺点：

优点：模型简单，计算开销小，容易解释。
缺点：对于非线性问题效果差，容易受到异常值影响。

Softmax 回归

概述：Softmax 回归（Softmax Regression）是逻辑回归的扩展，处理多分类问题。它将输入的线性组合映射到多个类别的概率值。

模型原理：Softmax 函数是对逻辑回归的扩展。

代码实现

from sklearn.linear_model import LogisticRegression

# 使用 Softmax 回归处理多分类问题
model = LogisticRegression(multi_class='multinomial', solver='lbfgs')
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
print(classification_report(y_test, y_pred))

优缺点：

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

from sklearn.ensemble import RandomForestClassifier

# 随机森林分类器
rf = RandomForestClassifier(n_estimators=100)
rf.fit(X_train, y_train)
y_pred = rf.predict(X_test)
print(classification_report(y_test, y_pred))

from imblearn.over_sampling import SMOTE

# 过采样
smote = SMOTE()
X_res, y_res = smote.fit_resample(X_train, y_train)
# 训练模型
model = LogisticRegression()
model.fit(X_res, y_res)
y_pred = model.predict(X_test)
print(classification_report(y_test, y_pred))

import numpy as np
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report, confusion_matrix
import seaborn as sns
import matplotlib.pyplot as plt

# 1. 加载 Iris 数据集
iris = load_iris()
X = iris.data # 特征
y = iris.target # 标签

# 2. 数据分割：80% 训练数据，20% 测试数据
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 3. 数据标准化：逻辑回归对特征的尺度比较敏感
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# 4. 训练逻辑回归模型
logreg = LogisticRegression(max_iter=200)
logreg.fit(X_train, y_train)

# 5. 在测试集上进行预测
y_pred = logreg.predict(X_test)

# 6. 模型评估
print("分类报告：")
print(classification_report(y_test, y_pred))

# 7. 混淆矩阵
cm = confusion_matrix(y_test, y_pred)
print("混淆矩阵：")
print(cm)

# 可视化混淆矩阵
sns.heatmap(cm, annot=True, fmt="d", cmap="Blues", xticklabels=iris.target_names, yticklabels=iris.target_names)
plt.xlabel('Predicted')
plt.ylabel('True')
plt.title('Confusion Matrix')
plt.show()

机器学习中的逻辑回归与 Softmax 回归多分类应用

引言

逻辑回归

代码实现

Softmax 回归

代码实现

更多推荐文章

相关免费在线工具

集成学习

类别不平衡问题

代码示例（重采样）

逻辑回归案例（Iris 数据集）

评估结果

结论

更多推荐文章

相关免费在线工具

机器学习中的逻辑回归与 Softmax 回归多分类应用

引言

逻辑回归

代码实现

Softmax 回归

代码实现

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

集成学习

类别不平衡问题

代码示例（重采样）

逻辑回归案例（Iris 数据集）

评估结果

结论

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具