大模型技术系统学习书单推荐：从理论到实践

大模型技术系统学习书单推荐

当前，大模型（Large Language Model, LLM）已成为人工智能领域最热门的技术方向。无论是学术界还是工业界，构建和应用大模型的能力正成为核心竞争力。然而，面对海量的资料和技术栈，许多开发者往往难以找到系统的学习路径。

本文精选了十二本涵盖理论基础、工程实践、多模态应用及 Agent 开发等领域的大模型相关书籍。内容从预训练、微调、RAG 框架到 LangChain 应用，旨在帮助读者构建完整的知识体系，从入门到精通，掌握构建 LLM 应用程序的核心技能。

核心基础与理论篇

1. 《大规模语言模型：从理论到实践》

作者： 张奇，桂韬，郑锐，黄萱菁

本书由复旦大学张奇教授团队历时 8 个月撰写，结合自然语言处理研究经验与分布式系统教学背景。全书详细介绍了构建大语言模型的四个主要阶段：预训练、有监督微调、奖励建模和强化学习。

核心内容： 解码大语言模型奥秘，解读 ChatGPT 背后的核心技术。
适用人群： 对大语言模型感兴趣的读者，高年级本科生和研究生。
配套资源： 配全书 PPT 课件。

2. 《大语言模型：原理与工程实践》

作者： 杨青

本书用 10 章对大语言模型进行全面且深入的介绍，手把手教你训练 7B LLM。

技术覆盖： 基础概念、预训练数据构建、预训练技术、有监督微调、强化对齐、提示工程。
实战导向： 介绍如何从零开始微调大语言模型，辅以代码示例。
价值： 无论研究人员、工程师还是产品经理，都能获得有价值的知识框架。

应用开发与工具篇

3. 《大语言模型应用指南：以 ChatGPT 为起点，从入门到精通的 AI 实践教程（全彩）》

作者： 万俊

本书对人工智能小白读者非常友好，通过实例和案例讲解大语言模型的工作原理和工作流程。

技术点： 提示工程、长短期记忆、GPTs、Agent 系统、微调与安全技术、GPT-4V 与 Gemini。
特点： 通俗易懂解释复杂概念，紧跟技术更新动态，包括无梯度优化、自主 Agent 系统。

8. 《LangChain 入门指南：构建高可复用、可扩展的 LLM 应用程序》

作者： 李特丽，康轶文

本书由 LangChain 中文网联合创始人编著，专门为对自然语言处理技术感兴趣的读者提供系统的 LLM 应用开发指南。

章节结构： 11 章内容，涵盖模型 I/O、数据增强、链、记忆等 6 大模块。
实战项目： 第 9 章通过构建 PDF 问答程序，帮助读者将知识应用于实践。
目标： 引导读者一步一步掌握 LLM 应用开发流程。

9. 《LangChain 实战：从原型到生产，动手打造 LLM 应用》

作者： 张海立，曹士圯，郭祖龙

本书基于 LangChain 0.1 长期维护版本，重点介绍多个核心应用场景。

全流程展现： 全方位展现从原型到生产 LLM 应用开发全流程。
生态解析： 探讨 LangChain、LangServe 和 LangSmith，帮助全面了解生成式人工智能领域的布局。
环境搭建： 介绍开源模型运行工具，引入本地免费的实验环境。

大模型技术系统学习书单推荐：从理论到实践