深度学习实战：卷积神经网络（CNN）原理与 LeNet-5 构建 | 极客日志

PythonAI算法

深度学习实战：卷积神经网络（CNN）原理与 LeNet-5 构建

综述由AI生成卷积神经网络是深度学习处理图像的核心架构。了卷积层与池化层的工作原理，并通过 TensorFlow 实战搭建 LeNet-5 模型完成手写数字识别。内容涵盖数据预处理、模型编译训练及过拟合优化策略，如引入 Dropout 层与 ReLU 激活函数，旨在帮助开发者掌握 CNN 基础开发流程与调优技巧。

BackendPro发布于 2026/3/20更新于 2026/6/1016 浏览

深度学习实战：卷积神经网络（CNN）原理与 LeNet-5 构建

CNN 核心组件解析

卷积层：提取图像局部特征

卷积层是 CNN 的核心，负责通过卷积核对输入图像进行局部特征提取。卷积核本质上是一个小型的权重矩阵，它按照设定的步长在图像上滑动，每滑动一次便与对应区域的像素值做内积运算，输出一个特征值。这个过程能有效捕捉图像的边缘、纹理等基础信息。

需要注意的是，卷积核的数量决定了输出特征图的通道数，数量越多，提取的特征维度越丰富。

在实际操作中，我们通常定义一个 3×3 大小的卷积核，步长设为 1，填充方式为 SAME，对 28×28 单通道的手写数字图像进行卷积操作。这样输出特征图的尺寸保持 28×28，通道数则由卷积核数量决定。

import tensorflow as tf
from tensorflow.keras.layers import Conv2D

# 定义卷积层
conv_layer = Conv2D(
    filters=32, 
    kernel_size=(3, 3), 
    strides=(1, 1), 
    padding="SAME", 
    input_shape=(28, 28, 1)
)

# 模拟输入：1 张 28×28 单通道图像
input_image = tf.random.normal(shape=(1, 28, 28, 1))

# 执行卷积运算
output_feature = conv_layer(input_image)
print("输出特征图形状：", output_feature.shape)

池化层：降低特征维度与防止过拟合

池化层的作用是对卷积层输出的特征图进行降采样。它能在保留关键特征的同时，显著减少参数数量和计算量。常见的池化方式有两种：最大池化和平均池化。最大池化选取局部区域内的最大值作为输出，能更好地保留纹理特征；平均池化则选取平均值，有助于保留背景特征。

实战中，我们常定义 2×2 大小的最大池化层，步长设为 2。对卷积层输出的特征图进行池化后，输出特征图的尺寸会缩小为原来的 1/2。

from tensorflow.keras.layers import MaxPooling2D

# 定义最大池化层
pool_layer = MaxPooling2D(pool_size=(2, 2), strides=(2, 2), padding="SAME")


pool_output = pool_layer(output_feature)
(, pool_output.shape)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

from tensorflow.keras import Sequential
from tensorflow.keras.layers import Flatten, Dense, Conv2D, MaxPooling2D

# 搭建 LeNet-5 模型
lenet5 = Sequential([
    # 卷积层 1：6 个 5×5 卷积核，步长 1，无填充
    Conv2D(filters=6, kernel_size=(5, 5), strides=(1, 1), 
           padding="VALID", input_shape=(28, 28, 1), activation="tanh"),
    # 池化层 1：2×2 最大池化，步长 2
    MaxPooling2D(pool_size=(2, 2), strides=(2, 2), padding="VALID"),
    # 卷积层 2：16 个 5×5 卷积核，步长 1，无填充
    Conv2D(filters=16, kernel_size=(5, 5), strides=(1, 1), 
           padding="VALID", activation="tanh"),
    # 池化层 2：2×2 最大池化，步长 2
    MaxPooling2D(pool_size=(2, 2), strides=(2, 2), padding="VALID"),
    # 展平层：将特征图转为一维向量
    Flatten(),
    # 全连接层 1：120 个神经元
    Dense(units=120, activation="tanh"),
    # 全连接层 2：84 个神经元
    Dense(units=84, activation="tanh"),
    # 输出层：10 个神经元对应 10 个数字类别，Softmax 激活
    Dense(units=10, activation="softmax")
])

# 查看模型结构
lenet5.summary()

from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical

# 1. 加载并预处理数据
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 归一化：将像素值从 0-255 转为 0-1
x_train = x_train / 255.0
x_test = x_test / 255.0

# 增加通道维度：(样本数，28, 28) → (样本数，28, 28, 1)
x_train = tf.expand_dims(x_train, axis=-1)
x_test = tf.expand_dims(x_test, axis=-1)

# 标签独热编码
y_train = to_categorical(y_train, num_classes=10)
y_test = to_categorical(y_test, num_classes=10)

# 2. 编译模型
lenet5.compile(optimizer="adam", loss="categorical_crossentropy", metrics=["accuracy"])

# 3. 训练模型
history = lenet5.fit(x_train, y_train, batch_size=32, epochs=10, validation_split=0.1)

# 4. 评估模型
test_loss, test_acc = lenet5.evaluate(x_test, y_test)
print(f"测试集准确率：{test_acc:.4f}")

from tensorflow.keras.layers import Dropout

# 修改模型，加入 Dropout 层
lenet5_with_dropout = Sequential([
    Conv2D(6, (5, 5), strides=1, padding="VALID", input_shape=(28, 28, 1), activation="tanh"),
    MaxPooling2D((2, 2), strides=2, padding="VALID"),
    Conv2D(16, (5, 5), strides=1, padding="VALID", activation="tanh"),
    MaxPooling2D((2, 2), strides=2, padding="VALID"),
    Flatten(),
    Dense(120, activation="tanh"),
    Dropout(0.2),  # 丢弃 20% 的神经元
    Dense(84, activation="tanh"),
    Dropout(0.2),
    Dense(10, activation="softmax")
])

lenet5_with_dropout.compile(optimizer="adam", loss="categorical_crossentropy", metrics=["accuracy"])

深度学习实战：卷积神经网络（CNN）原理与 LeNet-5 构建

深度学习实战：卷积神经网络（CNN）原理与 LeNet-5 构建

CNN 核心组件解析

卷积层：提取图像局部特征

池化层：降低特征维度与防止过拟合

更多推荐文章

相关免费在线工具

经典架构：LeNet-5 实战

网络结构搭建

模型编译与训练

常见问题与优化策略

过拟合问题处理

模型优化技巧

总结

更多推荐文章

相关免费在线工具

深度学习实战：卷积神经网络（CNN）原理与 LeNet-5 构建

深度学习实战：卷积神经网络（CNN）原理与 LeNet-5 构建

CNN 核心组件解析

卷积层：提取图像局部特征

池化层：降低特征维度与防止过拟合

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

经典架构：LeNet-5 实战

网络结构搭建

模型编译与训练

常见问题与优化策略

过拟合问题处理

模型优化技巧

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具