机器学习模型评估：8 种算法对比实战 | 极客日志

PythonAI算法

机器学习模型评估：8 种算法对比实战

综述由AI生成对比了逻辑回归、随机森林、支持向量机、AdaBoost、高斯贝叶斯、XGBoost、全连接神经网络及卷积神经网络共 8 种算法在矿物分类任务上的表现。通过网格搜索调优，XGBoost 测试集准确率达 97%，CNN 达 100%，MLP 为 94.88%。高斯贝叶斯因准确率过低被弃用。结论显示集成学习与深度学习模型在该数据集上泛化能力更强，其中 XGBoost 与 CNN 效果最佳。

追风少年发布于 2026/3/29更新于 2026/5/3126 浏览

将得到的训练数据集和测试数据集通过 8 种算法来进行模型评估，对比结果得到最优的模型评估。

1. LR 逻辑回归算法

数据提取（本文以平均填充值为例子）

import pandas as pd
from sklearn import metrics

train_data = pd.read_excel(r'训练数据集 [平均填充].xlsx')
train_data_x = train_data.iloc[:, 1:]  # 训练数据集的特征
train_data_y = train_data.iloc[:, 0]  # 训练数据集的标签 label
test_data = pd.read_excel(r'测试数据集 [平均值填充].xlsx')
test_data_x = test_data.iloc[:, 1:]  # 测试数据集的特征
test_data_y = test_data.iloc[:, 0]  # 测试数据集的标签 label
result_data = {}

逻辑回归 LR 算法实现代码

from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import GridSearchCV

param_grid = {
    'C': [0.01],
    'penalty': ['l2'],
    'solver': ['lbfgs'],
    'max_iter': [3000],
    'class_weight': ['balanced']
}
logreg = LogisticRegression()
grid_search = GridSearchCV(logreg, param_grid, cv=5)  # 创建 GridSearchCV 对象
grid_search.fit(train_data_x, train_data_y)  # 在训练集上执行网格搜索
print("best parameters set found on development set:")  # 输出最佳参数
print(grid_search.best_params_)

建立最优模型

LR_result = {}  # 用来保存训练之后的结果
lr = LogisticRegression(C=, max_iter=, penalty=, solver=)
lr.fit(train_data_x, train_data_y)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

train_predicted = lr.predict(train_data_x)  # 训练数据集的预测结果
print('LR 的 train:\n', metrics.classification_report(train_data_y, train_predicted))
test_predicted = lr.predict(test_data_x)  # 测试数据集的预测结果
print('LR 的 test:\n', metrics.classification_report(test_data_y, test_predicted))
a = metrics.classification_report(test_data_y, test_predicted, digits=6)  # digits 表示保留有效位小数
b = a.split()
LR_result['recall_0'] = float(b[8])  # 添加类别为 0 的召回率
LR_result['recall_1'] = float(b[11])  # 添加类别为 1 的召回率
LR_result['recall_2'] = float(b[16])  # 添加类别为 2 的召回率
LR_result['recall_3'] = float(b[21])  # 添加类别为 3 的召回率
LR_result['acc'] = float(b[25])  # 添加 accuracy 的结果
result_data['acc'] = LR_result  # result_data 是总体的结果
print('lr 结束')

import pandas as pd
from sklearn import metrics

'''数据提取'''
train_data = pd.read_excel(r'训练数据集 [平均值填充].xlsx')
train_data_x = train_data.iloc[:, 1:]  # 训练数据集的特征
train_data_y = train_data.iloc[:, 0]  # 训练数据集的标签 label
test_data = pd.read_excel(r'测试数据集 [平均值填充].xlsx')
test_data_x = test_data.iloc[:, 1:]  # 测试数据集的特征
test_data_y = test_data.iloc[:, 0]  # 测试数据集的标签 label
result_data = {}  # 用来保存后面 6 种算法的结果

'''----------------------RF 算法实现代码------------------------------'''
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV

param_grid = {
    'n_estimators': [50, 100, 200],  # 树的数量
    'max_depth': [None, 10, 20, 30],  # 树的深度
    'min_samples_split': [2, 5, 10],  # 节点分裂所需的最小样本数
    'min_samples_leaf': [1, 2, 5],  # 叶子节点所需的最小样本数
    'max_features': ['auto', 'sqrt', 'log2'],  # 最大特征数
    'bootstrap': [True, False]  # 是否使用自举样本
}
rf = RandomForestClassifier()
grid_search = GridSearchCV(rf, param_grid, cv=5)  # 创建 GridSearchCV 对象
grid_search.fit(train_data_x, train_data_y)  # 在训练集上执行网格搜索
print("Best parameters set found on development set:")  # 输出最佳参数
print(grid_search.best_params_)

# """建立最优模型"""
RF_result = {}  # 用来保存训练之后的结果
rf = RandomForestClassifier(
    bootstrap=False,
    max_depth=20,
    max_features='log2',
    min_samples_leaf=1,
    n_estimators=50,
    random_state=487
)
rf.fit(train_data_x, train_data_y)

# '''测试结果 [含训练数据集的测试 + 测试数据集的测试]'''
train_predicted = rf.predict(train_data_x)  # 训练数据集的预测结果
print('RF 的 train:\n', metrics.classification_report(train_data_y, train_predicted))
test_predicted = rf.predict(test_data_x)  # 测试数据集的预测结果
print('RF 的 test:\n', metrics.classification_report(test_data_y, test_predicted))
a = metrics.classification_report(test_data_y, test_predicted, digits=6)  # digits 表示保留有效位数
b = a.split()
RF_result['recall_0'] = float(b[8])  # 添加类别为 0 的召回率
RF_result['recall_1'] = float(b[11])  # 添加类别为 1 的召回率
RF_result['recall_2'] = float(b[16])  # 添加类别为 2 的召回率
RF_result['recall_3'] = float(b[21])  # 添加类别为 3 的召回率
RF_result['acc'] = float(b[25])  # 添加 accuracy 的结果
result_data['acc'] = RF_result  # result_data 是总体的结果
print('rf 结束')

import pandas as pd
from sklearn import metrics

'''数据提取'''
train_data = pd.read_excel(r'训练数据集 [平均值填充].xlsx')
train_data_x = train_data.iloc[:, 1:]  # 训练数据集的特征
train_data_y = train_data.iloc[:, 0]  # 训练数据集的标签 label
test_data = pd.read_excel(r'测试数据集 [平均值填充].xlsx')
test_data_x = test_data.iloc[:, 1:]  # 测试数据集的特征
test_data_y = test_data.iloc[:, 0]  # 测试数据集的标签 label
result_data = {}  # 用来保存后面 6 种算法的结果

# ''''--------------------支持向量机----------------------------------''''
from sklearn.svm import SVC
from sklearn.model_selection import GridSearchCV

# 定义参数网络
param_grid = {
    'C': [0.01, 0.1, 1, 2],
    'kernel': ['linear', 'poly', 'rbf', 'sigmoid'],  # 核函数类型
    'degree': [2, 3, 4, 5],  # 多项式核函数的阶数，仅在'poly'核函数下有效
    'gamma': ['scale', 'auto'] + [1],  # RBF, poly 和 sigmoid 的核函数参数
    'coef0': [0.1]  # 和函数中的独立项，仅在'poly'和'sigmoid'核函数下有效
}
svc = SVC()  # 创建 SVC 分类器实例
# 创建 GridSearchCV 对象
grid_search = GridSearchCV(svc, param_grid, cv=5)  # 五折交叉验证
# 在训练集上执行网络搜索
grid_search.fit(train_data_x, train_data_y)
# 输出最佳参数
print("Best parameters set found on development set:")
print()
print(grid_search.best_params_)

# 下面的参数均已通过网格搜索算法调优
SVM_result = {}
svm = SVC(C=1, coef0=0.1, degree=4, gamma=1, kernel='poly', probability=True, random_state=100)
svm.fit(train_data_x, train_data_y)
test_predicted = svm.predict(test_data_x)  # 测试数据集的预测结果
print('SVM 的 test:\n', metrics.classification_report(test_data_y, test_predicted))
a = metrics.classification_report(test_data_y, test_predicted, digits=6)
b = a.split()
print(a)
SVM_result['recall_0'] = float(b[6])  # 添加类别为 0 的召回率
SVM_result['recall_1'] = float(b[11])  # 添加类别为 1 的召回率
SVM_result['recall_2'] = float(b[16])  # 添加类别为 2 的召回率
SVM_result['recall_3'] = float(b[25])  # 添加类别为 3 的召回率
SVM_result['acc'] = float(b[25])  # 添加 accuracy 的结果
result_data['SVM'] = SVM_result

import pandas as pd
from sklearn import metrics
import warnings
warnings.filterwarnings('ignore', category=FutureWarning)  # 屏蔽 FutureWarning

'''数据提取'''
train_data = pd.read_excel(r'训练数据集 [平均值填充].xlsx').dropna(how='any')
train_data_x = train_data.iloc[:, 1:]  # 训练数据集的特征
train_data_y = train_data.iloc[:, 0]  # 训练数据集的标签 label
test_data = pd.read_excel(r'测试数据集 [平均值填充].xlsx').dropna(how='any')
test_data_x = test_data.iloc[:, 1:]  # 测试数据集的特征
test_data_y = test_data.iloc[:, 0]  # 测试数据集的标签 label
result_data = {}  # 用来保存后面 6 种算法的结果

# --------------------AdaBoost 算法-------------------------
from sklearn.ensemble import AdaBoostClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import GridSearchCV

ada = AdaBoostClassifier(algorithm='SAMME', random_state=0)
param_grid = {
    'n_estimators': [50, 100, 200],  # 弱分类器的数量
    'learning_rate': [0.01, 0.1, 0.5, 1.0],  # 学习率
    'algorithm': ['SAMME', 'SAMME.R'],  # 提升算法的类型
    'estimator': [DecisionTreeClassifier(max_depth=1), DecisionTreeClassifier(max_depth=2)]
}
abf = AdaBoostClassifier(n_estimators=100, random_state=0)  # 创建 AdaBoost 分类器
grid_search = GridSearchCV(abf, param_grid, cv=5)  # 创建 GridSearchCV 对象
# 在训练集上执行网格搜索
grid_search.fit(train_data_x, train_data_y)
# 输出最佳参数
print("Best parameters set found on development set :\n ")
print(grid_search.best_params_)

AdaBoostClassifier_result = {}
abf = AdaBoostClassifier(
    algorithm='SAMME',
    estimator=DecisionTreeClassifier(max_depth=2),
    n_estimators=200,
    learning_rate=1.0,
    random_state=0
)  # 创建 AdaBoost 分类器
abf.fit(train_data_x, train_data_y)
train_predicted = abf.predict(train_data_x)  # 训练数据集的预测结果
print("AdaBoost 的 train:\n", metrics.classification_report(train_data_y, train_predicted))
test_predicted = abf.predict(test_data_x)  # 测试数据集的预测结果
print("AdaBoost 的 test:\n", metrics.classification_report(test_data_y, test_predicted))
a = metrics.classification_report(test_data_y, test_predicted, digits=6)
b = a.split()
AdaBoostClassifier_result['recall_0'] = float(b[6])
AdaBoostClassifier_result['recall_1'] = float(b[11])
AdaBoostClassifier_result['recall_2'] = float(b[16])
AdaBoostClassifier_result['recall_3'] = float(b[21])
AdaBoostClassifier_result['acc'] = float(b[25])
result_data['AdaBoost'] = AdaBoostClassifier_result

from sklearn import metrics
import warnings
warnings.filterwarnings('ignore', category=FutureWarning)  # 屏蔽 FutureWarning

'''数据提取'''
train_data = pd.read_excel(r'训练数据集 [平均值填充].xlsx').dropna(how='any')
train_data_x = train_data.iloc[:, 1:]  # 训练数据集的特征
train_data_y = train_data.iloc[:, 0]  # 训练数据集的标签 label
test_data = pd.read_excel(r'测试数据集 [平均值填充].xlsx').dropna(how='any')
test_data_x = test_data.iloc[:, 1:]  # 测试数据集的特征
test_data_y = test_data.iloc[:, 0]  # 测试数据集的标签 label
result_data = {}  # 用来保存后面 6 种算法的结果

# ---------------------GNB 高斯贝叶斯算法------------------------------
from sklearn.naive_bayes import GaussianNB
GNB_result = {}
gnb = GaussianNB()  # 创建高斯朴素贝叶斯分类器
gnb.fit(train_data_x, train_data_y)
train_predicted = gnb.predict(train_data_x)  # 训练数据的预测结果
print('GNB 的 train:\n', metrics.classification_report(train_data_y, train_predicted))
test_predicted = gnb.predict(test_data_x)  # 测试数据集的预测结果
print('GNB 的 test:\n', metrics.classification_report(test_data_y, test_predicted))
a = metrics.classification_report(test_data_y, test_predicted, digits=6)
b = a.split()

import pandas as pd
from sklearn import metrics
import warnings
warnings.filterwarnings('ignore', category=FutureWarning)  # 屏蔽 FutureWarning

'''数据提取'''
train_data = pd.read_excel(r'训练数据集 [平均值填充].xlsx').dropna(how='any')
train_data_x = train_data.iloc[:, 1:]  # 训练数据集的特征
train_data_y = train_data.iloc[:, 0]  # 训练数据集的标签 label
test_data = pd.read_excel(r'测试数据集 [平均值填充].xlsx').dropna(how='any')
test_data_x = test_data.iloc[:, 1:]  # 测试数据集的特征
test_data_y = test_data.iloc[:, 0]  # 测试数据集的标签 label
result_data = {}  # 用来保存后面 6 种算法的结果

import xgboost as xgb

# ---------------------------XGBoost 算法----------------
XGBoost_result = {}
xgb_model = xgb.XGBClassifier(
    learning_rate=0.05,  # 学习率（越小越稳定）
    n_estimators=200,  # 树的数量
    num_class=5,
    max_depth=7,
    min_child_weight=1,
    gamma=0,
    subsample=0.6,
    colsample_bytree=0.8,
    objective='multi:softmax',
    seed=0
)  # 学习率
xgb_model.fit(train_data_x, train_data_y)
train_predicted = xgb_model.predict(train_data_x)  # 训练数据集的预测结果
print("XGBoost 的 train:\n", metrics.classification_report(train_data_y, train_predicted))
test_predicted = xgb_model.predict(test_data_x)  # 测试数据集的预测结果
print("XGBoost 的 test:\n", metrics.classification_report(test_data_y, test_predicted))
a = metrics.classification_report(test_data_y, test_predicted, digits=6)
b = a.split()
XGBoost_result['recall_0'] = float(b[6])
XGBoost_result['recall_1'] = float(b[11])
XGBoost_result['recall_2'] = float(b[16])
XGBoost_result['recall_3'] = float(b[21])
XGBoost_result['acc'] = float(b[25])

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
from sklearn.model_selection import train_test_split

# 定义神经网络结构
''' 1. 网络结构定义：包括输入层、隐含层和输出层的神经元数量。
2. 初始化方法：通过继承 nn.Module 类，初始化父类并进行自定义层的创建。
3. 权重初始化：全连接层的权重参数通过随机初始化进行赋值
'''
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        # 输入层（13 维特征）→ 隐藏层 1（32 神经元）
        self.fc1 = nn.Linear(13, 32)
        # 隐藏层 1 → 隐藏层 2（64 神经元）
        self.fc2 = nn.Linear(32, 64)
        # 隐藏层 2 → 输出层（4 分类）
        self.fc3 = nn.Linear(64, 4)

    def forward(self, x):  # 覆盖父类的方法
        # 前向传播，ReLU 激活函数，防止梯度爆炸
        x = torch.relu(self.fc1.forward(x))  # 隐藏层 1 激活
        x = torch.relu(self.fc2(x))  # 隐藏层 2 激活
        x = self.fc3(x)  # 输出层不激活（CrossEntropyLoss 内置 Softmax）
        return x

# 数据预处理：转换为 PyTorch 张量
# Pandas 数据框需转换为张量（Tensor）才能输入 PyTorch 模型：
X_train = torch.tensor(train_data_x.values, dtype=torch.float32)  # 精度
Y_train = torch.tensor(train_data_y.values)
X_test = torch.tensor(test_data_x.values, dtype=torch.float32)
Y_test = torch.tensor(test_data_y.values)  # values 将表格类型的数据转化为矩阵数据

# 实例化网络，损失函数和优化器
model = Net()
# 多分类损失函数：CrossEntropyLoss（Softmax+ 交叉熵）
criterion = nn.CrossEntropyLoss()  # 损失函数 - 交叉熵损失函数，煤矿数据为多分类
# 优化器：Adam（自适应学习率，优于基础梯度下降）
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)  # 用 Adam 优化器

def evaluate_model(model, X_data, Y_data, train_or_test):
    size = len(X_data)
    model.eval()  # 模型切换为评估模式（禁用 Dropout/BN 等）
    with torch.no_grad():  # 禁用梯度计算，提升速度并节省显存
        predictions = model(X_data)  # 计算准确率：argmax(1) 取概率最大的类别，与真实标签对比
        correct = (predictions.argmax(1) == Y_data).type(torch.float).sum().item()
        correct /= size  # 准确率=正确数/总数
        loss = criterion(predictions, Y_data).item()  # 计算损失
        print(f"{train_or_test}:\t 准确率:{(100*correct):.2f}%，损失:{loss:.4f}")
    model.train()  # 切回训练模式
    return correct

epochs = 15000  # 训练轮数
accs = []  # 记录测试集准确率
for epoch in range(epochs):  # 训练网络
    # 前向传播
    outputs = model(X_train)  # model 前向传播
    loss = criterion(outputs, Y_train)  # 反向传播与参数更新
    optimizer.zero_grad()  # 梯度的初始化，梯度清零
    loss.backward()  # 反向传播计算梯度
    optimizer.step()  # 更新模型参数
    # 每 100 轮打印一次结果，评估模型
    if (epoch + 1) % 100 == 0:
        print(f'Epoch[{epoch + 1}/{epochs},Loss:{loss.item():.4f}')
        train_acc = evaluate_model(model, X_train, Y_train, 'train')
        test_acc = evaluate_model(model, X_test, Y_test, 'test')
        accs.append(test_acc * 100)

net_result = {}
net_result['acc'] = max(accs)
result_data['net'] = net_result

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np

class ConvNet(nn.Module):
    def __init__(self, num_features, hidden_size, num_classes):
        super(ConvNet, self).__init__()
        # 1D 卷积层：输入通道 1，输出通道 16，卷积核长度 3，padding=1（保持序列长度）
        self.conv1 = nn.Conv1d(in_channels=1, out_channels=16, kernel_size=3, padding=1)
        self.conv2 = nn.Conv1d(in_channels=16, out_channels=32, kernel_size=3, padding=1)
        self.conv3 = nn.Conv1d(in_channels=32, out_channels=64, kernel_size=3, padding=1)
        self.relu = nn.ReLU()
        self.fc = nn.Linear(64, num_classes)

    def forward(self, x):  # x[1472*1*13]
        # 由于 Conv1d 期望的输入维度是 (batch_size, channels, length)，我们需要增加一个维度
        x = x.unsqueeze(1)  # 增加 channels 维度
        # 卷积 + 激活：提取局部序列特征
        x = self.conv1(x)
        x = self.relu(x)
        x = self.conv2(x)
        x = self.relu(x)
        x = self.conv3(x)
        # 全局平均池化：压缩维度➡️ [batch,64]
        x = self.relu(x)
        x = x.mean(dim=2)  # 这里使用平均池化作为简化操作
        x = self.fc(x)
        return x

卷积类型	输入维度	卷积核形态	滑动维度	核心应用场景
Conv1d	[batch, C, L]（序列）	[out_C, in_C, kL]	沿长度 L 滑动	时间序列、语音、文本
Conv2d	[batch, C, H, W]（图像）	[out_C, in_C, kH, kW]	沿 H/W 滑动	RGB 图片、灰度图、二维特征图
Conv3d	[batch, C, D, H, W]（3D）	[out_C, in_C, kD, kH, kW]	沿 D/H/W 滑动	3D 医学影像、视频、点云数据

# 1. 将 Pandas DataFrame 格式的训练特征数据转换为 PyTorch 张量
# - train_data_x.values：把表格数据转为 numpy 矩阵（Pandas 表格无法直接输入神经网络）
# - dtype=torch.float32：特征数据必须是浮点型（神经网络的权重是浮点型，输入需匹配）
X_train = torch.tensor(train_data_x.values, dtype=torch.float32)
# 2. 训练标签数据转张量（分类任务标签默认转为 long 型，适配 CrossEntropyLoss）
Y_train = torch.tensor(train_data_y.values)
# 3. 测试特征数据转张量（同训练集格式）
X_test = torch.tensor(test_data_x.values, dtype=torch.float32)
# 4. 测试标签数据转张量
Y_test = torch.tensor(test_data_y.values)

# 冗余参数
hidden_size = 10
# 分类任务的类别数：4 分类
num_classes = 4
# 实例化一维卷积神经网络模型
# 参数说明：13=输入特征长度（序列长度），hidden_size=冗余参数，num_classes=4 分类
model = ConvNet(13, hidden_size, num_classes)
# 定义损失函数：交叉熵损失（多分类任务的标配损失函数）
# 作用：衡量模型预测结果与真实标签的差距，值越小预测越准
criterion = nn.CrossEntropyLoss()
# 定义优化器：Adam 自适应优化器（比 SGD 收敛更快）
# 参数说明：model.parameters()=优化模型所有参数，lr=0.001=学习率（参数更新步长）
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 训练模型
# 训练轮数：遍历全部训练数据的次数
num_epochs = 15000
# 用于保存每 100 轮的训练精度，后续取最大值
accs = []
# 遍历每一轮训练
for epoch in range(num_epochs):
    # 1. 前向传播：将训练数据输入模型，得到预测输出
    # outputs.shape = [batch_size, 4]（每个样本输出 4 个类别的预测值）
    outputs = model(X_train)  # 向前传播
    # 2. 计算损失：对比预测输出和真实标签的差
    loss = criterion(outputs, Y_train)
    # 3. 反向传播 + 参数优化：
    # - optimizer.zero_grad()：清空上一轮的梯度（避免梯度累加）
    # - loss.backward()：自动计算所有参数的梯度（损失对参数的偏导数）
    # - optimizer.step()：根据梯度更新模型参数（最小化损失）
    optimizer.zero_grad()  # 反向传播和优化
    loss.backward()
    optimizer.step()
    # 每训练 100 轮，打印训练结果并评估精度
    if (epoch + 1) % 100 == 0:
        # 打印当前轮数和损失值（loss.item() 取出张量的数值）
        print(f'Epoch[{epoch + 1}/{num_epochs},Loss:{loss.item():.4f}')
        # 测试模型
        # with torch.no_grad()：关闭梯度计算
        with torch.no_grad():
            # 用训练集数据预测
            predictions = model(X_train)
            # 取预测值中概率最大的维度作为预测类别（argmax(dim=1)：按行取最大值索引）
            # 例如：predictions=[[0.1,0.8,0.05,0.05]] → predicted_classes=1（第 2 类）
            predicted_classes = predictions.argmax(dim=1)
            accuracy = (predicted_classes == Y_train).float().mean()
            print(f'Train Accuracy:{accuracy.item()*100:.2f}%')
            predictions = model(X_test)
            predicted_classes = predictions.argmax(dim=1)
            accuracy = (predicted_classes == Y_test).float().mean()
            print(f'Test Accuracy:{accuracy.item()*100:.2f}%')
            accs.append(accuracy * 100)

accs.append(accuracy * 100)
# 创建字典保存 CNN 模型的最优结果
cnn_result = {}
# 取 accs 列表中的最大值（训练过程中的最高准确率），.item() 转为 Python 数值
cnn_result['acc'] = max(accs).item()
result_data['cnn'] = cnn_result
# 打印最终结果字典（包含 CNN 的最高准确率）
print(result_data)

# 导入 json 库：用于将字典数据保存为 JSON 文件
import json
# 数据格式，网络传输。保存提取 json 类型的数据。
# csv：表格类型的数据
# 使用 'w' 模式打开文件，确保如果文件已存在则会被覆盖
result = {}
result['mean fill'] = result_data
with open(r'temp_data/平均值填充 result.json', 'w', encoding='utf-8') as file:
    # 使用 json.dump() 方法将字典转换为 JSON 格式并写入文件，JSON 一般来是字典
    json.dump(result, file, ensure_ascii=False, indent=4)

机器学习模型评估：8 种算法对比实战

1. LR 逻辑回归算法

更多推荐文章

相关免费在线工具

2. 随机森林算法

3. 支持向量机算法

4. AdaBoost 算法

5. 高斯贝叶斯（GNB）算法

6. XGBoost 算法

7. 神经网络算法

8. 卷积神经网络算法

更多推荐文章

相关免费在线工具

机器学习模型评估：8 种算法对比实战

1. LR 逻辑回归算法

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 随机森林算法

3. 支持向量机算法

4. AdaBoost 算法

5. 高斯贝叶斯（GNB）算法

6. XGBoost 算法

7. 神经网络算法

8. 卷积神经网络算法

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具