跳到主要内容

极客日志面向AI+效率的开发者社区

首页博客 GitHub 精选镜像 AI 生图工具 UI配色美学隐私政策关于联系

搜索内容 / 工具 / 仓库 / 镜像...⌘K 搜索

大模型技术详解：架构、训练与微调 | 极客日志

PythonAI算法

大模型技术详解：架构、训练与微调

深入解读大语言模型（LLM）的技术细节，涵盖 GPT、LLaMA、ChatGLM 等模型的架构差异，包括 Tokenizer、位置编码、层归一化及激活函数选择。同时概述了分布式训练技术，如数据并行、张量并行、流水线并行及 ZeRO 优化器。最后探讨了参数高效微调方法，如 Prompt Tuning、LoRA 等，旨在帮助开发者理解大模型核心原理与工程实践。

狂少发布于 2025/2/7更新于 2026/7/939 浏览

大模型技术详解：架构、训练与微调

大模型技术详解：架构、训练与微调

在深入研究 LLaMA、ChatGLM 和 Falcon 等大语言模型时，我们不难发现它们在技术实现上有着诸多共通之处与独特差异。例如，这些模型在 tokenizer（分词器）的选择上，可能会根据模型的特性和应用场景来定制；位置编码（Positional Encoding）的实现方式也各具特色，对模型性能的影响不容忽视。此外，Layer Normalization（层归一化）和激活函数（Activation Function）的选择与运用，都直接影响到模型的训练速度和准确性。

Transformer 与 LLM 关系图

1. 大语言模型的细节

1.0 Transformer 与 LLM

Transformer 与 LLM 关系图

1.1 模型结构

模型结构图

1.2 训练目标

训练目标图

1.3 Tokenizer

Tokenizer 示意图

1.4 位置编码

位置编码示意图

1.5 层归一化

层归一化示意图

1.6 激活函数

激活函数示意图

1.7 Multi-query Attention 与 Grouped-query Attention

Attention 机制示意图

1.8 并行 Transformer Block

并行 Transformer Block 示意图

1.9 总结 - 训练稳定性

训练稳定性总结图

2. LLM 的分布式预训练

LLM 分布式预训练概览

2.0 点对点通信与集体通信

通信机制示意图

2.1 数据并行

数据并行示意图

2.2 张量并行

张量并行示意图

张量并行补充图

2.3 流水线并行

流水线并行示意图

2.4 3D 并行

3D 并行示意图

2.5 混合精度训练

混合精度训练示意图

2.6 激活重计算

激活重计算示意图

2.7 ZeRO，零冗余优化器

ZeRO 优化器示意图

2.8 CPU-offload，ZeRO-offload

CPU Offload 示意图

2.9 Flash Attention

Flash Attention 示意图

2.10 vLLM: Paged Attention

Paged Attention 示意图

3. LLM 的参数高效微调

3.0 为什么进行参数高效微调？

微调必要性示意图

3.1 Prompt Tuning

Prompt Tuning 示意图

3.2 Prefix Tuning

Prefix Tuning 示意图

3.3 Adapter

Adapter 示意图

3.4 LLaMA Adapter

LLaMA Adapter 示意图

3.5 LoRA

LoRA 示意图

3.6 实验比较

实验比较示意图

4. 参考文献

参考文献汇总

目录

免费图片AI生成工具免费生成了解详情

Magick API 一键接入全球大模型注册送1000万token查看
免费图片视频在线生成30秒，将你的创意变成现实开始设计
X/Twitter免费视频下载器免登陆无限额度免费视频解析下载了解详情
100+免费在线小游戏爽一把

极客日志微信公众号二维码

微信扫一扫，关注极客日志

微信公众号「极客日志V2」，在微信中扫描左侧二维码关注。展示文案：极客日志V2 zeeklog

更多推荐文章

Java NFC 开发痛点分析及 nfctools 库应用指南
鸿蒙金融理财全栈：运维监控、性能优化与安全加固实战
大模型训练流水线并行（PP）性能评价指标与分析方法
代价驱动的 SQL 连接条件下推实践
算法：双指针解法 - 复写零
低代码平台Python插件开发指南
使用 Python 构建机器学习预测模型全流程指南
LabVIEW 巡检机器人高精度轨迹跟踪虚拟仿真系统
通义万相 2.1 文生图技术优势与部署解析
Java 模拟算法题目练习
Visual C++运行库修复指南：解决程序启动失败问题
AIGC 时代的医学统计学：Python 数据分析实战
智能体工作流导出导入实战：12345 政务热线分拨示例
LeetCode 962. 最大宽度坡 C 语言解法
Spring Boot RESTful API 开发、测试与安全实战
机器学习回归算法：线性回归与逻辑回归
学术写作合规挑战：智能降重与 AIGC 检测应对方案
从零搭建 AI Agent 框架：原理、ReAct 与实现
C++ STL list 容器详解：使用与模拟实现
哈希表核心原理与 C++ 实战应用

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online