大模型书籍精选:从理论到工程实践的快速选型指南
本文整理了大模型领域的核心书籍推荐,涵盖基础理论、多模态技术、扩散模型、模型压缩、开源模型及 LangChain 框架等方向。针对初学者和从业者,提供了《大规模语言模型》《解构大语言模型》《多模态大模型》《扩散模型》《Llama 大模型实践指南》等多本经典著作的简介与适用场景分析,帮助读者根据自身需求快速筛选适合的学习资料,建立系统的大模型知识体系。

本文整理了大模型领域的核心书籍推荐,涵盖基础理论、多模态技术、扩散模型、模型压缩、开源模型及 LangChain 框架等方向。针对初学者和从业者,提供了《大规模语言模型》《解构大语言模型》《多模态大模型》《扩散模型》《Llama 大模型实践指南》等多本经典著作的简介与适用场景分析,帮助读者根据自身需求快速筛选适合的学习资料,建立系统的大模型知识体系。

大模型的书这么多,该怎么选呢?本期书单教大家怎么快速地从众多大模型书中选到你想要的那一本。
作者: 张奇,桂韬,郑锐,黄萱菁 著
解码大语言模型奥秘,引领机器智能新时代。详细介绍构建 LLM 的四个主要阶段:预训练、有监督微调、奖励建模和强化学习。解读 ChatGPT 背后的核心技术,配全书 PPT 课件。
复旦大学张奇教授团队结合他们在自然语言处理领域的研究经验,以及分布式系统和并行计算的教学经验,历时 8 个月完成本书的撰写。希望这本书能够帮助读者快速入门大模型的研究和应用,并解决相关技术问题。
本书详细介绍了构建大语言模型的四个主要阶段:预训练、有监督微调、奖励建模和强化学习。每个阶段都有算法、代码、数据、难点及实践经验的详细讨论。
本书以大语言模型的基础理论开篇,探讨了大语言模型预训练数据的构建方法,以及大语言模型如何理解并服从人类指令,介绍了大语言模型的应用和评估方法,为读者提供了更全面的视野。
本书旨在为对大语言模型感兴趣的读者提供入门指南,也可作为高年级本科生和研究生自然语言处理相关课程的补充教材!
作者: 杨青 编著
揭开 LLM 的神秘面纱,解读其机理和工程实践,手把手教你训练 7B LLM。本书用 10 章对大语言模型进行全面且深入的介绍。首先对大语言模型的基本概念进行介绍。其次,从大语言模型的基础技术、预训练数据构建、预训练技术等方面展开讨论,帮助读者深入了解大语言模型的构建和训练过程。然后,详细介绍有监督微调和强化对齐等技术,以及如何评估大语言模型的性能。此外,介绍提示工程和工程实践等方面的内容,帮助读者了解大语言模型的应用和实际操作过程。最后,介绍如何从零开始微调大语言模型,辅以代码示例,帮助读者更好地应用这些技术。
通过阅读本书,读者可以获得全面且深入的大语言模型的知识框架。无论您是研究人员、工程师,还是产品经理,都能从中获得有价值的知识。
作者: 唐亘 著
从模型结构和数据基础两大角度解构大语言模型。详解经典模型的核心结构及实现过程,夯实基础。模型开发与调优,重构 ChatGPT,GitHub 配套代码。融合统计分析/机器学习/经济学等知识,全彩印刷。
本书从模型的结构和数据基础两个方面解构大语言模型,以便帮助读者理解和搭建类似 ChatGPT 的系统。在模型的结构方面,大语言模型属于深度神经网络,其设计核心是注意力机制,因此,本书涵盖了多层感知器、卷积神经网络和循环神经网络等经典模型。在模型的数据基础方面,本书既涉及模型训练的工程基础,如反向传播,又涉及数据的使用方式,如迁移学习、强化学习,以及传统的监督学习和无监督学习。此外,本书还阐述了如何从计量经济学和经典机器学习模型中汲取灵感,以提高模型的稳定性和可解释性。
本书既适用于希望深入了解大语言模型、通过人工智能技术解决实际问题的读者,也适合作为高等院校计算机及相关专业的师生参考用书。
作者: 万俊 著
大语言模型的应用与二次开发。探索智能前沿,驾驭模型力量,对人工智能或编程技术小白读者友好。技术点包含提示工程、长短期记忆、GPTs、Agent 系统、微调与安全技术、GPT-4V 与 Gemini、尺度定律与压缩即智能等。
本书是一本对人工智能小白读者非常友好的大语言模型应用指南,有两大特点:一是以通俗易懂的方式解释复杂概念,通过实例和案例讲解大语言模型的工作原理和工作流程、基本使用方法,包括大语言模型常用的三种交互格式、提示工程、工作记忆与长短期记忆,以及外部工具等,使读者能够全面了解和掌握这一先进技术的应用和二次开发;二是紧跟当前大语言模型技术的更新动态,介绍 GPTs 的创建,以 GPT-4V 和 Gemini 为例讲述多模态模型的应用,还包括无梯度优化、自主 Agent 系统、大语言模型微调、RAG 框架微调、大语言模型安全技术等。
无论是学术研究者、工程师,还是对大语言模型感兴趣的普通读者,都可以通过本书获得大语言模型的前沿研究成果、技术进展和应用案例,从而更好地应用大语言模型解决实际问题。
了解了以上大模型的基础内容,再来看看如今已经实现了文本 - 图像 - 语音 - 视频'大统一'的多模态大模型!
作者: 刘阳,林倞 著
多模态大模型基础、核心、模型详细剖析。AIGC、具身智能、视觉问答等典型应用案例。因果推理、世界模型、Sora、AGI Agent 等前沿技术探究。
本书以深入浅出的方式介绍多模态大模型的技术方法、开源平台和应用场景,并详细阐述因果推理、世界模型及多智能体与具身智能等前沿技术领域,有助于读者全面了解多模态大模型的特点及发展方向,对新一代人工智能技术范式和通用人工智能的发展起到重要推动作用。
本书内容共 5 章,第 1 章引领读者深入探索最具代表性的大模型结构,包括 BERT、Chat-GPT 和 ChatGLM 等,为建立对多模态大模型的全面认知打下基础。第 2 章深度剖析多模态大模型的核心技术,如提示学习、上下文学习、思维链和人类反馈强化学习等,揭示多模态大模型的独特之处和引人入胜的技术内涵。第 3 章介绍多个具有代表性的多模态基础模型,如 CLIP、LLaMA、SAM 和 PaLM-E 等,为读者呈现多样和广泛的技术解决方案。第 4 章深入分析视觉问答、AIGC 和具身智能这三个典型应用,展示多模态大模型在实际场景中的强大能力。第 5 章探讨实现 AGI 的可行思路,包括因果推理、世界模型、超级智能体与具身智能等前沿技术方向。
本书不仅适合高校相关专业高年级本科生和研究生作为教材使用,更是各类 IT 从业者的必备参考之作。
作者: 彭勇,彭旋,郑志军,茹炳晟 著
读懂 ChatGPT 的核心技术、GPT 的进化史和创新点。详述多模态大模型的核心技术和应用场景。让中小公司可以从 0 到 1 部署多模态大模型,打开通往通用人工智能的大门。
本书详细介绍了大语言模型和多模态大模型的发展历史、技术原理和亮点、主要的开源框架、配套工具、部署细则和实战案例。为了让读者更好地进行大模型的应用实战,本书还详细介绍了使用大模型为商业赋能的 3 个应用案例。期望本书能够帮助读者打开通往大模型尤其是多模态大模型的学习、实战和商业成功之路。
作者: 杨灵,张至隆,张文涛,崔斌 著
本书作者团队来自著名学府,且与国际知名研究机构、院校有众多交流,其提供的内容具有权威性,并获得众多专家、学者认可。本书从理论和实践两个方面进行了细致介绍。阅读本书的读者,即可获得学术收益,又可进行实践应用。
为方便进行理论实践,本书提供了可配套运行的代码文件,读者可以进行下载。本书深入浅出地介绍了扩散模型的知识,案例丰富,讲解细致。第 1 章介绍 AIGC 与相关技术,第 2 章从三个视角介绍扩散模型的基本理论、算法,此外介绍了扩散模型的神经网络架构和代码实现。第 3 章、第 4 章、第 5 章分别从高效采样、似然优化、数据结构三个方面系统介绍了扩散模型的特点,以及后续的改进工作。第 6 章讨论了扩散模型与其他生成模型的关联,包括变分自编码器、生成对抗网络、归一化流、自回归模型和基于能量的模型。第 7 章介绍了扩散模型的应用,包括计算机视觉、自然语言处理、时间数据建模、多模态学习、鲁棒学习和跨学科应用。第 8 章讨论了扩散模型的未来,以及与 GPT 和大模型的关联。
本书适合高等院校计算机科学、人工智能和医学、生物学等交叉学科专业的师生,以及相关人工智能应用程序的开发人员阅读。
作者: 汪玉,宁雪妃 著
高效模型压缩与设计,释放大模型潜能,赋能千行百业。清华大学电子工程系汪玉,宁雪妃作品。权威:出自芯片领域著名专家之手。系统:系统梳理模型压缩与设计关键技术。经验:提供实践中总结的分析思路和经验。
本书系统地介绍了高效模型压缩和模型设计的方法,在编写上兼顾理论和实践。本书主体部分详细介绍了模型压缩的方法论,包括高效模块设计、模型剪枝、模型量化、模型二值化、神经网络架构搜索、知识蒸馏几大部分。另外,简要介绍了定制化硬件加速器的设计及大语言模型的加速和压缩。
作者: 张俊祺,曲东奇,张正,占冰强 等 著
全面介绍 Llama 的入门指南;实用案例和示例代码助你快速上手;本书配套 AI 助手答疑解惑。
本书共包括 7 章,涵盖了从基础理论到实际应用的全方位内容。第 1 章深入探讨了大模型的基础理论。第 2 章和第 3 章专注于 Llama 2 大模型的部署和微调,提供了一系列实用的代码示例、案例分析和最佳实践。第 4 章介绍了多轮对话难题,这是许多大模型开发者和研究人员面临的一大挑战。第 5 章探讨了如何基于 Llama 2 定制行业大模型,以满足特定业务需求。第 6 章介绍了如何利用 Llama 2 和 LangChain 构建高效的文档问答模型。第 7 章展示了多语言大模型的技术细节和应用场景。本书既适合刚入门的学生和研究人员阅读,也适合有多年研究经验的专家和工程师阅读。
通过阅读本书,读者不仅能掌握 Llama 2 大模型的核心概念和技术,还能学会如何将这些知识应用于实际问题,从而在这一快速发展的领域中取得优势。
作者: 李特丽,康轶文 著
全面介绍 LangChain 技术。逐步构建自己的 LLM 应用程序。内容注重高可复用性和可扩展性。实用案例和示例代码助你快速上手。与社区互动,共享经验与解决难题。
本书由 LangChain 中文网联合创始人李特丽与创始人康轶文共同编著!本书专门为那些对自然语言处理技术感兴趣的读者提供了系统的 LLM 应用开发指南。全书分为 11 章,从 LLM 基础知识开始,通过 LangChain 这个开源框架为读者解读整个 LLM 应用开发流程。第 1~2 章概述 LLM 技术的发展背景和 LangChain 框架的设计理念。从第 3 章开始,分章深入介绍 LangChain 的 6 大模块,包括模型 I/O、数据增强、链、记忆等,通过大量代码示例让读者了解其原理和用法。第 9 章通过构建 PDF 问答程序,帮助读者将之前学习的知识应用于实践。第 10 章则介绍集成,可拓宽 LangChain 的用途。第 11 章为初学者简要解析 LLM 的基础理论,如 Transformer 模型等。
本书以 LangChain 这个让人熟悉的框架为主线,引导读者一步一步掌握 LLM 应用开发流程,适合对大语言模型感兴趣的开发者、AI 应用程序开发者阅读。
作者: 刘伟舟,张婉平 著
揭秘大语言模型和 LangChain,由浅入深讲解基础概念和实践案例。本书的结构由浅入深,第 1 章和第 2 章介绍大语言模型和 LangChain 的基础知识,使读者能够对本书内容有整体的认识,并完成运行环境的安装配置,为后续实践奠定基础。第 3 章至第 8 章详细介绍 LangChain 的重要模块,包括模型调用、链、智能体等,深入浅出地介绍了各模块的原理和使用方式。第 9 章至第 11 章涉及实践项目,包括对话机器人、代码理解、检索增强生成,通过这些项目,读者能更好地理解如何基于 LangChain 构建自己的大语言模型应用系统。
本书适合 AI 应用程序开发者、对大语言模型感兴趣的开发者,以及对大语言模型感兴趣的高等院校学生阅读。
作者: 张海立,曹士圯,郭祖龙 著
基于 Langchain 0.1 长期维护版本。全方位展现从原型到生产 LLM 应用开发全流程。8 位产学研界专家赞誉力荐。
本书是专为初学者和对 LangChain 应用及大语言模型(LLM)应用感兴趣的开发者而编写的。本书以 LangChain 团队于 2024 年 1 月发布的长期维护版本 0.1 为基础,重点介绍了多个核心应用场景,并且深入探讨了 LCEL 的应用方式。同时,本书围绕 LangChain 生态系统的概念,详细探讨 LangChain、LangServe 和 LangSmith,帮助读者全面了解 LangChain 团队在生成式人工智能领域的布局。此外,本书还介绍了开源模型运行工具,为读者引入本地免费的实验环境,让读者能够亲自动手进行实际操作。
通过本书,读者可以真正体验到 LangChain 在从原型到生产的 LLM 应用开发和上线闭环体验方面的优势,全面了解 LangChain 的概念、原理和应用,并且获得实际开发 LangChain 应用的经验。本书示例丰富,内容通俗易懂,既可作入门教程,也可供相关技术人员参考。
作者: 王浩帆 编著
内容全面:包含 Langchain 的新版本、新动态及全新表达式语言。系统深入:书中融入了 LangGraph、Langsmith 等核心组件,讲解细致入微。结构流畅:章节设计自然衔接,有助于读者掌握 Langchain 的运行逻辑。深度拓展:深入讲解了 Langchain 的隐私与安全、数据评估等高级主题。实战性强:提供了丰富的代码实例和结果截图,读者可快速上手实践。源码开放:在作者的 GitHub 中提供了各章节源码,读者可独立运行学习。
本书共 10 章,分别介绍了 LangChain 的开发环境搭建、模型、提示、数据连接、链、记忆、代理、回调及周边生态等内容,并用三个案例,即基于 Streamlit 实现聊天机器人、基于 Chainlit 实现 PDF 问答机器人、零代码 AI 应用构建平台 Flowise,将前面大语言模型的内容学以致用。通过本书,读者既能提升自身的技术素养,又能拓展自己解决实际难题的能力。
本书适合刚入门或想加入 AI 行业的技术从业者、需要结合大语言模型相关技术为业务赋能的产品经理、计算机相关专业的学生,以及 AI 爱好者和自学者。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online