大模型开发与微调技术指南
本文基于 PyTorch 2.0 框架,结合 ChatGLM 开源大模型,系统讲解大模型开发、应用及微调的全流程技术。涵盖从深度学习基础环境搭建到高级微调策略,旨在帮助开发者掌握人工智能与大模型的核心技能。
第一章 人工智能与大模型概述
介绍人工智能的历史演进与未来趋势,重点阐述深度学习在其中的核心地位。详细分析大模型带来的产业变革,特别是清华大学开源的 ChatGLM 中文大模型的技术优势与应用前景。
第二章 PyTorch 2.0 环境搭建
详解 Python 环境配置,包括 Miniconda 与 PyCharm 的安装。重点讲解 PyTorch 2.0 的 GPU 版本安装,适配 Nvidia 10/20/30/40 系列显卡。通过 Hello PyTorch 示例及古诗词生成、图像降噪实战,快速上手第一个深度学习模型。
第三章 PyTorch 2.0 核心学习
通过 MNIST 手写体识别实战,深入理解数据获取、标签处理及模型可视化(Netron)。讲解自定义神经网络框架的设计与实现,掌握抽象层与具体层的构建逻辑。
第四章 深度学习基础算法
解析反向传播神经网络的历史与原理,详解最小二乘法与梯度下降算法。推导反馈神经网络的链式求导法则,并通过 Python 实现激活函数与反向传播过程。
第五章 卷积神经网络实战
深入卷积运算、池化操作及 Softmax 激活函数。实战基于卷积的 MNIST 分类,并详解深度可分离膨胀卷积的原理与参数优化,提升模型识别效率。
第六章 数据处理与可视化
使用 torch.utils.data 工具箱封装自定义数据集,掌握 DataLoader 批量输出。利用 tensorboardX 组件进行训练过程的可视化监控,直观展示损失函数变化与模型性能。
第七章 ResNet 残差网络
解析 ResNet 诞生的背景与残差模块设计。实战 CIFAR-10 数据集分类,演示 PyTorch 2.0 模块工具的使用及网络结构的实现细节。
第八章 词嵌入与文本处理
介绍 Ag_news 数据集清洗、停用词处理及 Word2Vec 训练。对比 TF-IDF 与 TextRank 主题提取方法,详解 FastText 预训练词向量。讲解字符卷积与词卷积模型(Conv1d/Conv2d)在文本分类中的应用。
第九章 循环神经网络情感分析
实战循环神经网络(RNN)与 GRU 单元,讲解双向 RNN 结构。完成中文情感分类任务,理解序列数据的编码与解码机制。
第十章 自然语言处理编码器
深入注意力模型(Attention),解析自注意力层、多头注意力机制及 Layer Normalization。实战拼音汉字转化模型,完成编码器架构的前馈层设计与训练。
第十一章 BERT 预训练模型
解析 BERT 的基本架构、预训练任务与微调策略。利用 Hugging Face 获取预训练模型,实战中文文本分类任务,探索更多预训练模型的应用。
第十二章 自然语言处理解码器
详解解码器的输入交互、掩码操作及移位训练方法。实战拼音汉字翻译模型,完成数据集处理、模型训练及推理使用全流程。
第十三章 强化学习实战
基于火箭回收场景,介绍强化学习环境参数。详解 PPO 算法、TD-error 理论及奖励倒序构成,掌握强化学习基本算法的实现。
第十四章 GPT-2 模型解析
分析 GPT-2 的自回归性输入输出结构,详解 Hugging Face 源码中的 LMHeadModel、Block、Attention 及 MLP 类。实战评论描述微调,调整创造性参数 temperature 与 topK。
第十五章 训练自己的 ChatGPT
讲解 RLHF 技术分解与 PPO 算法在 RLHF 中的实现。构建带有评分函数的 ChatGPT 模型,分析 KL 散度与损失函数,生成正向评论。
第十六章 ChatGLM 使用详解
对比大模型与普通模型的区别,探讨大模型的涌现能力。详解 ChatGLM 的下载、Prompt 构建及应用前景。


