大模型书籍精选:从理论到工程实践的快速选型指南
大模型的书这么多,该怎么选呢?本期书单教大家怎么快速地从众多大模型书中选到你想要的那一本。
大模型基础
《大规模语言模型:从理论到实践》
作者: 张奇,桂韬,郑锐,黄萱菁 著
解码大语言模型奥秘,引领机器智能新时代。详细介绍构建 LLM 的四个主要阶段:预训练、有监督微调、奖励建模和强化学习。解读 ChatGPT 背后的核心技术,配全书 PPT 课件。
复旦大学张奇教授团队结合他们在自然语言处理领域的研究经验,以及分布式系统和并行计算的教学经验,历时 8 个月完成本书的撰写。希望这本书能够帮助读者快速入门大模型的研究和应用,并解决相关技术问题。
本书详细介绍了构建大语言模型的四个主要阶段:预训练、有监督微调、奖励建模和强化学习。每个阶段都有算法、代码、数据、难点及实践经验的详细讨论。
本书以大语言模型的基础理论开篇,探讨了大语言模型预训练数据的构建方法,以及大语言模型如何理解并服从人类指令,介绍了大语言模型的应用和评估方法,为读者提供了更全面的视野。
本书旨在为对大语言模型感兴趣的读者提供入门指南,也可作为高年级本科生和研究生自然语言处理相关课程的补充教材!
《大语言模型:原理与工程实践》
作者: 杨青 编著
揭开 LLM 的神秘面纱,解读其机理和工程实践,手把手教你训练 7B LLM。本书用 10 章对大语言模型进行全面且深入的介绍。首先对大语言模型的基本概念进行介绍。其次,从大语言模型的基础技术、预训练数据构建、预训练技术等方面展开讨论,帮助读者深入了解大语言模型的构建和训练过程。然后,详细介绍有监督微调和强化对齐等技术,以及如何评估大语言模型的性能。此外,介绍提示工程和工程实践等方面的内容,帮助读者了解大语言模型的应用和实际操作过程。最后,介绍如何从零开始微调大语言模型,辅以代码示例,帮助读者更好地应用这些技术。
通过阅读本书,读者可以获得全面且深入的大语言模型的知识框架。无论您是研究人员、工程师,还是产品经理,都能从中获得有价值的知识。
《解构大语言模型:从线性回归到通用人工智能(全彩)》
作者: 唐亘 著
从模型结构和数据基础两大角度解构大语言模型。详解经典模型的核心结构及实现过程,夯实基础。模型开发与调优,重构 ChatGPT,GitHub 配套代码。融合统计分析/机器学习/经济学等知识,全彩印刷。
本书从模型的结构和数据基础两个方面解构大语言模型,以便帮助读者理解和搭建类似 ChatGPT 的系统。在模型的结构方面,大语言模型属于深度神经网络,其设计核心是注意力机制,因此,本书涵盖了多层感知器、卷积神经网络和循环神经网络等经典模型。在模型的数据基础方面,本书既涉及模型训练的工程基础,如反向传播,又涉及数据的使用方式,如迁移学习、强化学习,以及传统的监督学习和无监督学习。此外,本书还阐述了如何从计量经济学和经典机器学习模型中汲取灵感,以提高模型的稳定性和可解释性。
本书既适用于希望深入了解大语言模型、通过人工智能技术解决实际问题的读者,也适合作为高等院校计算机及相关专业的师生参考用书。
《大语言模型应用指南:以 ChatGPT 为起点,从入门到精通的 AI 实践教程(全彩)》
作者: 万俊 著
大语言模型的应用与二次开发。探索智能前沿,驾驭模型力量,对人工智能或编程技术小白读者友好。技术点包含提示工程、长短期记忆、GPTs、Agent 系统、微调与安全技术、GPT-4V 与 Gemini、尺度定律与压缩即智能等。
本书是一本对人工智能小白读者非常友好的大语言模型应用指南,有两大特点:一是以通俗易懂的方式解释复杂概念,通过实例和案例讲解大语言模型的工作原理和工作流程、基本使用方法,包括大语言模型常用的三种交互格式、提示工程、工作记忆与长短期记忆,以及外部工具等,使读者能够全面了解和掌握这一先进技术的应用和二次开发;二是紧跟当前大语言模型技术的更新动态,介绍 GPTs 的创建,以 GPT-4V 和 Gemini 为例讲述多模态模型的应用,还包括无梯度优化、自主 Agent 系统、大语言模型微调、RAG 框架微调、大语言模型安全技术等。
无论是学术研究者、工程师,还是对大语言模型感兴趣的普通读者,都可以通过本书获得大语言模型的前沿研究成果、技术进展和应用案例,从而更好地应用大语言模型解决实际问题。
多模态大模型
了解了以上大模型的基础内容,再来看看如今已经实现了文本 - 图像 - 语音 - 视频'大统一'的多模态大模型!
《多模态大模型:新一代人工智能技术范式(全彩)》
作者: 刘阳,林倞 著
多模态大模型基础、核心、模型详细剖析。AIGC、具身智能、视觉问答等典型应用案例。因果推理、世界模型、Sora、AGI Agent 等前沿技术探究。
本书以深入浅出的方式介绍多模态大模型的技术方法、开源平台和应用场景,并详细阐述因果推理、世界模型及多智能体与具身智能等前沿技术领域,有助于读者全面了解多模态大模型的特点及发展方向,对新一代人工智能技术范式和通用人工智能的发展起到重要推动作用。


