人工智能：循环神经网络（RNN）与序列数据处理实战

Ne0inhk

24 Mar 2026 — 8 min read

循环神经网络（RNN）与序列数据处理实战

1.1 本章学习目标与重点

💡 学习目标：掌握循环神经网络的核心原理、经典变体结构，以及在文本序列任务中的实战开发流程。
💡 学习重点：理解 RNN 的循环计算机制，学会使用 TensorFlow/Keras 搭建基础 RNN 与 LSTM 模型，完成文本分类任务。

1.2 循环神经网络核心原理

1.2.1 为什么需要 RNN

💡 传统的前馈神经网络（如 CNN、全连接网络）的输入和输出是相互独立的。它们无法处理序列数据的上下文关联特性。
序列数据在现实中十分常见，比如自然语言文本、语音信号、时间序列数据等。这些数据的核心特点是，当前时刻的信息和之前时刻的信息紧密相关。
循环神经网络通过引入隐藏状态，可以存储历史信息，从而有效捕捉序列数据的上下文依赖关系。

1.2.2 RNN 的循环计算机制

💡 RNN 的核心结构是循环核。它的本质是一个带有自连接的神经元结构。循环核会在每一个时间步接收输入数据和上一个时间步的隐藏状态，计算当前时间步的输出和新的隐藏状态。

RNN 的计算过程可以分为三个核心步骤：
① 初始化隐藏状态 h0h_0h0，通常设置为全零向量
② 对每个时间步 ttt，计算当前隐藏状态 ht=tanh⁡(Wxhxt+Whhht−1+bh)h_t = \tanh(W_{xh}x_t + W_{hh}h_{t-1} + b_h)ht=tanh(Wxhxt+Whhht−1+bh)
③ 根据隐藏状态计算当前时间步输出 yt=Whyht+byy_t = W_{hy}h_t + b_yyt=Whyht+by

⚠️ 注意：基础 RNN 存在梯度消失或梯度爆炸问题。它无法有效捕捉长序列的依赖关系，因此实际应用中更多使用其变体模型。

import tensorflow as tf from tensorflow.keras.layers import SimpleRNN # 定义基础 RNN 层# units: 隐藏状态维度，return_sequences: 是否返回所有时间步输出 rnn_layer = SimpleRNN(units=64, return_sequences=True, input_shape=(10,20))# 模拟输入：批次大小 32，序列长度 10，每个时间步特征维度 20 input_seq = tf.random.normal(shape=(32,10,20))# 执行 RNN 计算 output_seq = rnn_layer(input_seq)print("RNN 输出形状：", output_seq.shape)# 输出形状 (32, 10, 64)

1.2.3 RNN 的梯度问题与改进方向

⚠️ 基础 RNN 在处理长序列时，梯度在反向传播过程中会随着时间步的增加而指数级衰减或膨胀。这会导致模型无法学习到长距离的依赖关系。
为了解决这个问题，研究者提出了两种经典的 RNN 变体：长短期记忆网络（LSTM） 和 门控循环单元（GRU）。它们通过引入门控机制，来控制信息的遗忘和更新，从而有效缓解梯度消失问题。

1.3 经典 RNN 变体——长短期记忆网络（LSTM）

💡 LSTM 是最常用的 RNN 变体。它由 Hochreiter & Schmidhuber 于 1997 年提出。LSTM 通过输入门、遗忘门和输出门的协同作用，实现对历史信息的选择性记忆和遗忘。

1.3.1 LSTM 的门控机制解析

LSTM 的每个循环核内部包含三个关键门控和一个细胞状态：

遗忘门：决定哪些历史信息需要被丢弃。通过 sigmoid 函数输出 0~1 之间的数值，0 表示完全遗忘，1 表示完全保留。
输入门：决定哪些新信息需要被加入到细胞状态中。分为两步，先通过 sigmoid 函数筛选信息，再通过 tanh 函数生成候选信息。
输出门：决定当前细胞状态中哪些信息需要输出作为隐藏状态。通过 sigmoid 函数筛选，再与 tanh 处理后的细胞状态相乘得到输出。
细胞状态：LSTM 的核心记忆单元，负责存储长序列的历史信息，通过门控机制实现信息的更新和传递。

1.3.2 LSTM 层的代码实现

from tensorflow.keras.layers import LSTM # 定义 LSTM 层# return_state: 是否返回最终的隐藏状态和细胞状态 lstm_layer = LSTM(units=128, return_sequences=False, return_state=True, input_shape=(10,20))# 执行 LSTM 计算 output, final_hidden_state, final_cell_state = lstm_layer(input_seq)print("LSTM 输出形状：", output.shape)# 输出形状 (32, 128)print("最终隐藏状态形状：", final_hidden_state.shape)# 形状 (32, 128)print("最终细胞状态形状：", final_cell_state.shape)# 形状 (32, 128)

1.4 实战：基于 LSTM 的文本分类任务

1.4.1 任务介绍与数据集准备

💡 本次实战任务是情感分类。我们将使用 IMDB 电影评论数据集。这个数据集包含 50000 条标注为“正面”或“负面”的电影评论。我们的目标是搭建 LSTM 模型，实现对评论情感倾向的自动判断。

① 加载 IMDB 数据集，限制词汇表大小为 10000，序列长度统一为 200
② 将文本序列转换为整数索引序列，超出长度的截断，不足的补零
③ 划分训练集和测试集，训练集 25000 条，测试集 25000 条

from tensorflow.keras.datasets import imdb from tensorflow.keras.preprocessing.sequence import pad_sequences # 1. 加载数据集 vocab_size =10000 max_seq_len =200(x_train, y_train),(x_test, y_test)= imdb.load_data(num_words=vocab_size)# 2. 序列填充与截断 x_train = pad_sequences(x_train, maxlen=max_seq_len, padding="post", truncating="post") x_test = pad_sequences(x_test, maxlen=max_seq_len, padding="post", truncating="post")print("训练集形状：", x_train.shape)# (25000, 200)print("测试集形状：", x_test.shape)# (25000, 200)

1.4.2 搭建 LSTM 文本分类模型

💡 本次模型结构分为三层：嵌入层、LSTM 层、全连接分类层。
嵌入层将整数索引转换为稠密向量，解决文本稀疏问题。LSTM 层捕捉文本序列的上下文依赖。全连接层通过 sigmoid 函数输出情感分类结果。

from tensorflow.keras import Sequential from tensorflow.keras.layers import Embedding, Dense # 定义模型 embedding_dim =128 model = Sequential([# 嵌入层：input_dim=词汇表大小, output_dim=嵌入维度, input_length=序列长度 Embedding(input_dim=vocab_size, output_dim=embedding_dim, input_length=max_seq_len),# LSTM 层：128 个隐藏单元 LSTM(units=128, dropout=0.2, recurrent_dropout=0.2),# 全连接分类层：输出 1 个值，sigmoid 激活 Dense(units=1, activation="sigmoid")])# 查看模型结构 model.summary()

1.4.3 模型编译与训练

① 编译模型：选择 Adam 优化器，二分类交叉熵损失函数，评估指标为准确率
② 训练模型：设置批次大小 64，训练轮数 5 轮，使用 10% 的训练数据作为验证集
③ 保存训练历史，用于后续绘制损失和准确率曲线

# 1. 编译模型 model.compile(optimizer="adam", loss="binary_crossentropy", metrics=["accuracy"])# 2. 训练模型 batch_size =64 epochs =5 history = model.fit( x_train, y_train, batch_size=batch_size, epochs=epochs, validation_split=0.1)# 3. 评估模型 test_loss, test_acc = model.evaluate(x_test, y_test)print(f"测试集准确率：{test_acc:.4f}")

1.4.4 模型优化技巧

💡 技巧 1：使用预训练词向量（如 Word2Vec、GloVe）替换随机初始化的嵌入层，提升文本特征表示能力。
💡 技巧 2：加入双向 LSTM（Bidirectional LSTM），同时捕捉文本的正向和反向上下文依赖。
💡 技巧 3：使用早停法（EarlyStopping），当验证集损失不再下降时停止训练，防止过拟合。

双向 LSTM 层的代码示例：

from tensorflow.keras.layers import Bidirectional # 替换原 LSTM 层为双向 LSTM Bidirectional(LSTM(units=128, dropout=0.2, recurrent_dropout=0.2))

早停法的代码示例：

from tensorflow.keras.callbacks import EarlyStopping # 定义早停回调函数 early_stopping = EarlyStopping(monitor="val_loss", patience=2, restore_best_weights=True)# 在训练时加入回调 model.fit(x_train, y_train, callbacks=[early_stopping])

1.5 门控循环单元（GRU）简介

💡 GRU 是 LSTM 的简化版本。它将遗忘门和输入门合并为更新门，同时取消了细胞状态，直接使用隐藏状态传递信息。
GRU 的参数数量比 LSTM 更少，训练速度更快。在很多场景下，GRU 可以取得和 LSTM 相当的效果。

GRU 层的代码实现：

from tensorflow.keras.layers import GRU # 定义 GRU 层 gru_layer = GRU(units=128, return_sequences=True, input_shape=(10,20)) gru_output = gru_layer(input_seq)print("GRU 输出形状：", gru_output.shape)

1.6 本章总结

✅ 循环神经网络通过隐藏状态存储历史信息，能够有效处理序列数据的上下文依赖关系。
✅ LSTM 引入门控机制，解决了基础 RNN 的梯度消失问题，是处理长序列任务的核心模型。
✅ 在文本分类等序列任务中，LSTM 结合嵌入层可以取得良好效果，双向 LSTM 和早停法等技巧能进一步优化模型性能。

Python 小工具实战：图片水印批量添加工具

Python 小工具实战：图片水印批量添加工具 Python 小工具实战：图片水印批量添加工具，本文详细介绍了使用 Python开发给图片加水印的工具，该工具基于 Pillow 和 tkinter 库构建，可解决单图处理耗时、专业软件操作复杂的问题。工具支持单图与批量处理，用户能自定义水印文字、字体大小、透明度及颜色，还可选择 9 个常用水印位置或设置行列重复分布。新增的全屏水印模式可通过调整旋转角度与间距，生成铺满图片的版权保护水印，且界面采用卡片式布局，搭配浅灰背景与蓝色按钮，简洁美观，底部状态栏实时显示操作进度。文中提供完整可运行代码，并给出参数校验、字体兼容、常见报错解决等实用内容，新手按步骤即可上手，或者直接运行使用。前言 Python作为一门简洁、易读、功能强大的编程语言，其基础语法是入门学习的核心。掌握好基础语法，能为后续的编程实践打下坚实的基础。本文将全面讲解Python3的基础语法知识，适合编程初学者系统学习。Python以其简洁优雅的语法和强大的通用性，成为当今最受欢迎的编程语言。本专栏旨在系统性地带你从零基础入门到精通Python核心。无论你是

用 Python 批量下载全量 A 股历史行情数据：基于 AKShare 的高效实践

关键词：AKShare, A股数据, 股票历史行情, 量化分析, Python 金融, 断点续传适用读者：量化交易初学者、金融数据分析师、Python 爱好者、学术研究者 💡 为什么需要本地化 A 股历史数据？在量化投资、策略回测、因子挖掘等场景中，高质量、完整、本地存储的历史行情数据是不可或缺的基础。然而： * 商业数据接口（如 Wind、Tushare Pro）往往收费或有调用限制； * 免费接口（如早期 Tushare）可能不稳定或字段不全； * 网页爬虫易被反爬，维护成本高。幸运的是，开源项目 AKShare 提供了免费、稳定、覆盖全面的中国金融市场数据接口，包括： * A 股日线、分钟线 * 指数、基金、期货、期权

Python + AI：打造你的智能害虫识别助手

Python + AI：打造你的智能害虫识别助手在农业生产中，病虫害是影响作物产量和品质的“隐形杀手”。传统的害虫识别依赖人工巡查，不仅耗时耗力，还容易因经验不足导致误判、漏判。而随着智慧农业的普及，AI技术正成为破解这一难题的关键——今天，我们就用Python从零搭建一个智能害虫识别助手，让电脑替你“火眼金睛”辨害虫，轻松搞定农作物病虫害预警！一、为什么要做这个项目？智慧农业的核心是“精准、高效、低成本”，而害虫识别正是其中的典型场景： * 对农户：无需专业植保知识，拍照就能识别害虫种类，快速匹配防治方案； * 对开发者：这是一个“小而美”的实战项目，覆盖AI开发全流程，从数据处理到模型部署，学完就能落地； * 技术价值：融合Python、深度学习、Web部署，是入门AI+垂直领域应用的绝佳案例。这个项目不需要你有深厚的AI功底，只要掌握Python基础，跟着步骤走，就能做出一个能实际使用的智能识别工具。二、项目核心技术栈先明确我们要用到的工具，都是行业主流、

【C++ 继承】—— 青花分水、和而不同，继承中的“明明德”与“止于至善”

欢迎来到ZyyOvO的博客✨，一个关于探索技术的角落，记录学习的点滴📖，分享实用的技巧🛠️，偶尔还有一些奇思妙想💡 本文由ZyyOvO原创✍️，感谢支持❤️！请尊重原创📩！欢迎评论区留言交流🌟 个人主页 👉 ZyyOvO 本文专栏➡️C++ 进阶之路继承中的“明明德”与“止于至善” * 继承 * 继承的概念 * 基本语法 * 继承类模板 * 基类和派生类的转换 * 内存布局与继承的关系 * 向上转型 * 向下转型 * 继承中的作用域 * 作用域嵌套规则 * 隐藏规则 * 多层继承的作用域链 * 派生类的默认成员函数 * 默认构造函数 * 拷贝构造函数 * 拷贝赋值运算符 * 析构函数 * 继承和友元 * 继承和静态成员 * 静态成员的可见性 * 静态数据成员的初始化 * 静态成员函数与多态(TODO) * 同名静态成员的隐藏 * 多继承及其菱形继承 * 单继承 * 多继承 * 菱形继承 * I0库中的菱形虚拟继承 * 继承和