大模型技术系统学习书单推荐
当前,大模型(Large Language Model, LLM)已成为人工智能领域最热门的技术方向。无论是学术界还是工业界,构建和应用大模型的能力正成为核心竞争力。然而,面对海量的资料和技术栈,许多开发者往往难以找到系统的学习路径。
本文精选了十二本涵盖理论基础、工程实践、多模态应用及 Agent 开发等领域的大模型相关书籍。内容从预训练、微调、RAG 框架到 LangChain 应用,旨在帮助读者构建完整的知识体系,从入门到精通,掌握构建 LLM 应用程序的核心技能。
核心基础与理论篇
1. 《大规模语言模型:从理论到实践》
作者: 张奇,桂韬,郑锐,黄萱菁
本书由复旦大学张奇教授团队历时 8 个月撰写,结合自然语言处理研究经验与分布式系统教学背景。全书详细介绍了构建大语言模型的四个主要阶段:预训练、有监督微调、奖励建模和强化学习。
- 核心内容: 解码大语言模型奥秘,解读 ChatGPT 背后的核心技术。
- 适用人群: 对大语言模型感兴趣的读者,高年级本科生和研究生。
- 配套资源: 配全书 PPT 课件。
2. 《大语言模型:原理与工程实践》
作者: 杨青
本书用 10 章对大语言模型进行全面且深入的介绍,手把手教你训练 7B LLM。
- 技术覆盖: 基础概念、预训练数据构建、预训练技术、有监督微调、强化对齐、提示工程。
- 实战导向: 介绍如何从零开始微调大语言模型,辅以代码示例。
- 价值: 无论研究人员、工程师还是产品经理,都能获得有价值的知识框架。
应用开发与工具篇
3. 《大语言模型应用指南:以 ChatGPT 为起点,从入门到精通的 AI 实践教程(全彩)》
作者: 万俊
本书对人工智能小白读者非常友好,通过实例和案例讲解大语言模型的工作原理和工作流程。
- 技术点: 提示工程、长短期记忆、GPTs、Agent 系统、微调与安全技术、GPT-4V 与 Gemini。
- 特点: 通俗易懂解释复杂概念,紧跟技术更新动态,包括无梯度优化、自主 Agent 系统。
8. 《LangChain 入门指南:构建高可复用、可扩展的 LLM 应用程序》
作者: 李特丽,康轶文
本书由 LangChain 中文网联合创始人编著,专门为对自然语言处理技术感兴趣的读者提供系统的 LLM 应用开发指南。
- 章节结构: 11 章内容,涵盖模型 I/O、数据增强、链、记忆等 6 大模块。
- 实战项目: 第 9 章通过构建 PDF 问答程序,帮助读者将知识应用于实践。
- 目标: 引导读者一步一步掌握 LLM 应用开发流程。
9. 《LangChain 实战:从原型到生产,动手打造 LLM 应用》
作者: 张海立,曹士圯,郭祖龙
本书基于 LangChain 0.1 长期维护版本,重点介绍多个核心应用场景。
- 全流程展现: 全方位展现从原型到生产 LLM 应用开发全流程。
- 生态解析: 探讨 LangChain、LangServe 和 LangSmith,帮助全面了解生成式人工智能领域的布局。
- 环境搭建: 介绍开源模型运行工具,引入本地免费的实验环境。


