大模型技术系统学习书单推荐:从理论到实践
精选了十二本大模型技术相关书籍,涵盖理论基础、工程实践、多模态应用及 Agent 开发等领域。内容包括《大规模语言模型:从理论到实践》《LangChain 入门指南》等经典著作,解析预训练、微调、RAG 及扩散模型核心技术。适合希望系统构建 LLM 知识体系的研究人员与开发者参考。

精选了十二本大模型技术相关书籍,涵盖理论基础、工程实践、多模态应用及 Agent 开发等领域。内容包括《大规模语言模型:从理论到实践》《LangChain 入门指南》等经典著作,解析预训练、微调、RAG 及扩散模型核心技术。适合希望系统构建 LLM 知识体系的研究人员与开发者参考。

当前,大模型(Large Language Model, LLM)已成为人工智能领域最热门的技术方向。无论是学术界还是工业界,构建和应用大模型的能力正成为核心竞争力。然而,面对海量的资料和技术栈,许多开发者往往难以找到系统的学习路径。
本文精选了十二本涵盖理论基础、工程实践、多模态应用及 Agent 开发等领域的大模型相关书籍。内容从预训练、微调、RAG 框架到 LangChain 应用,旨在帮助读者构建完整的知识体系,从入门到精通,掌握构建 LLM 应用程序的核心技能。
作者: 张奇,桂韬,郑锐,黄萱菁
本书由复旦大学张奇教授团队历时 8 个月撰写,结合自然语言处理研究经验与分布式系统教学背景。全书详细介绍了构建大语言模型的四个主要阶段:预训练、有监督微调、奖励建模和强化学习。
作者: 杨青
本书用 10 章对大语言模型进行全面且深入的介绍,手把手教你训练 7B LLM。
作者: 万俊
本书对人工智能小白读者非常友好,通过实例和案例讲解大语言模型的工作原理和工作流程。
作者: 李特丽,康轶文
本书由 LangChain 中文网联合创始人编著,专门为对自然语言处理技术感兴趣的读者提供系统的 LLM 应用开发指南。
作者: 张海立,曹士圯,郭祖龙
本书基于 LangChain 0.1 长期维护版本,重点介绍多个核心应用场景。
作者: 刘伟舟,张婉平
本书结构由浅入深,适合 AI 应用程序开发者及高等院校学生阅读。
作者: 彭勇,彭旋,郑志军,茹炳晟
本书详细介绍了大语言模型和多模态大模型的发展历史、技术原理和亮点。
作者: 刘阳,林倞
本书以深入浅出的方式介绍多模态大模型的技术方法、开源平台和应用场景。
作者: 张俊祺,曲东奇,张正,占冰强 等
本书共包括 7 章,涵盖了从基础理论到实际应用的全方位内容。
作者: 杨灵,张至隆,张文涛,崔斌
本书深入浅出地介绍了扩散模型的知识,案例丰富,讲解细致。
作者: 吴畏 译
本书探讨了 AI 领域的 AI Agent(智能体)和生成式 AI 的前沿进展。
作者: 肖凯
本书主要介绍如何使用 Python 来学习和应用人工智能算法。
在掌握了上述书籍的基础知识后,建议按照以下路径进行深化学习:
通过系统性地阅读和实践这些书籍,开发者可以建立起扎实的大模型技术知识体系,从而在未来的 AI 浪潮中获得竞争优势。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online