《构建与理解大型语言模型》:从原理到实战的大模型入门
本书由新加坡科技研究局人工智能高级研究员黄佳编写,采用问答与图解形式讲解大型语言模型。内容涵盖自然语言处理技术演进,包括起源、基于规则、统计、深度学习及大数据驱动阶段。详细解析 N-Gram、Word2Vec、RNN、Transformer 及 GPT 等核心技术,提供 WikiGPT 和 miniChatGPT 等实战项目代码,适合初学者及从业者系统掌握大模型构建原理与应用。

本书由新加坡科技研究局人工智能高级研究员黄佳编写,采用问答与图解形式讲解大型语言模型。内容涵盖自然语言处理技术演进,包括起源、基于规则、统计、深度学习及大数据驱动阶段。详细解析 N-Gram、Word2Vec、RNN、Transformer 及 GPT 等核心技术,提供 WikiGPT 和 miniChatGPT 等实战项目代码,适合初学者及从业者系统掌握大模型构建原理与应用。

本书由新加坡科技研究局人工智能高级研究员黄佳编写,旨在帮助读者系统地理解大型语言模型(LLM)的构建与核心原理。不同于市面上百科全书式的知识罗列,本书采用一问一答的方式,结合趣味图解,梳理生成式语言模型的发展脉络,带领读者从 0 到 1 搭建语言模型。
作者黄佳深耕数据科学领域多年,拥有 NLP 大模型研发、持续学习及 AI 在金融科技等领域的应用实战经验。书中不仅涵盖理论模型,更包含详尽的代码和实例数据集,适合 NLP 领域学生、研究人员、AI 初学者及从业者阅读。
人工智能的概念萌芽于 20 世纪 40 年代和 50 年代,直到 1956 年的达特茅斯会议才成为独立学科。AI 技术发展经历了多次兴衰,前期突破多与计算机视觉(CV)相关(如 CNN、AlexNet),后期突破则多与自然语言处理(NLP)相关(如 Transformer、ChatGPT)。
自然语言处理是人工智能的子领域,关注计算机如何理解、解释和生成人类语言。其核心任务是为人类的语言编码并解码,充当人类与计算机沟通的桥梁。黄佳老师将 NLP 技术的演进过程分为四个阶段:
本书循着技术演进路线,详细讲解了以下关键技术点:
作为语言模型的雏形,N-Gram 通过统计词序列出现的概率来预测下一个词。Bag-of-Words(词袋模型)则是另一种基础表示方法,忽略词序仅关注词频。这是理解后续复杂模型的基础。
为了解决稀疏性问题,Word2Vec 将单词映射到低维稠密向量空间。Embedding 层进一步提升了模型对语义关系的捕捉能力,使得相似含义的词在向量空间中距离更近。
RNN 及其变体(LSTM、GRU)能够处理序列数据,解决了传统模型无法保留上下文信息的问题。Seq2Seq(Sequence-to-Sequence)架构引入了编码器 - 解码器模式,广泛应用于机器翻译等任务。
注意力机制允许模型在处理当前词时关注输入序列中的其他部分,极大地缓解了长序列训练中的梯度消失问题,是 Transformer 架构的核心组件之一。
Transformer 摒弃了 RNN 和 CNN,完全依赖注意力机制。其并行计算能力强,表达能力更强,是现代大语言模型的基石。书中详细解析了 Self-Attention、Multi-Head Attention 等核心组件。
GPT(Generative Pre-trained Transformer)系列采用自回归方式生成文本。从 GPT 到 GPT-4,模型规模不断扩大,能力显著增强。书中还介绍了基于人类反馈的强化学习(RLHF)在 ChatGPT 中的应用,以及如何使用强大的 GPT API。
本书提供了多个实战项目,帮助读者动手实践:
每个项目均配有代码注释和说明,确保读者能够复现并理解背后的逻辑。
本书通过生动的插画、古诗词命名的章节以及详尽的代码,降低了大模型的学习门槛。无论是对 AI 感兴趣的新手,还是希望深入底层原理的开发者,都能从中获得扎实的理论与实践经验,真正掌握大模型的构建方法。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online