程序员入门大模型:2024 年畅销书单推荐
引言
随着人工智能技术的飞速发展,大模型(Large Language Models)已成为开发者必须掌握的核心技能之一。为了帮助程序员系统性地入门大模型应用开发,本文精选了 2024 年最畅销的大模型相关书籍,涵盖基础理论、应用开发及实战指南。
核心概念与技术背景
在深入阅读具体书籍之前,了解大模型背后的核心技术至关重要。当前主流的大模型基于 Transformer 架构,利用自注意力机制处理序列数据。理解 Tokenization、Embedding、Attention Mechanism 以及 Decoder-only 架构是学习的基础。此外,预训练(Pre-training)、指令微调(Instruction Tuning)和人类反馈强化学习(RLHF)构成了现代大模型训练的主要流程。掌握这些概念有助于读者更好地理解后续书籍中的技术细节。
大模型入门
1. GPT 图解 大模型是怎样构建的
本书以生动活泼的笔触,将枯燥的技术细节化作轻松幽默的故事和缤纷多彩的图画,引领读者穿梭于不同技术的时空。内容涵盖自然语言处理技术的传承、演进与蜕变,帮助读者深入理解核心原理,并动手从零开始搭建语言模型。适合对 NLP 感兴趣但畏惧复杂数学公式的初学者。
2. 大模型应用开发 动手做 AI Agent
人工智能时代一种全新的技术——Agent 正在崛起。本书探索 Agent 的奥秘,内容包括从技术框架到开发工具,从实操项目到前沿进展。通过带着读者动手做 7 个功能强大的 Agent,全方位解析 Agent 的设计与实现,展望其发展前景和未来趋势。重点在于如何让模型具备规划、记忆和执行工具的能力。
3. ChatGPT 原理与应用开发
本书主要介绍基于 ChatGPT 开发算法相关的应用或服务,侧重于介绍与自然语言处理相关的常见任务和应用,以及如何使用类似 ChatGPT 的大语言模型服务来实现以前只有算法工程师才能完成的工作。内容涉及 API 调用、Prompt Engineering 以及业务场景集成。
4. AIGC 自动化编程:基于 ChatGPT 和 GitHub Copilot
全书从 AI 的基本概念和背景入手,逐渐深入到如何使用具有代表性的 AIGC 工具—ChatGPT、GitHub Copilot 和 Claude2 等进行自动化编程。针对桌面应用、Web 应用、游戏、办公自动化等场景,提供了丰富的实例,助力提升编程效率。书中还探讨了代码生成的准确性验证与安全性问题。
5. 生成式 AI 入门与 AWS 实战
本书是专注于如何在 AWS 上开发和应用生成式 AI 的实用指南,旨在为技术领导者、机器学习实践者、应用开发者等提供深入了解和应用生成式 AI 的策略与方法。适合对生成式 AI 感兴趣的学生、研究人员及软件开发人员阅读,特别是需要云原生部署方案的团队。
人工智能基础
1. 动手学深度学习(PyTorch版)
《动手学深度学习》全新 PyTorch 版本,李沐和亚马逊科学家阿斯顿·张等大咖作者强强联合之作。作为机器学习、深度学习领域重磅教程,提供交互式实战环境,配套资源丰富,适合初学者与实践者。书中包含大量代码示例,强调理论与实践的结合。
2. 深度学习
深度学习领域奠基性经典畅销书,数据科学家和机器学习从业者必读,长期位居美亚 AI 和机器学习类图书榜首,图灵奖获奖作品,全彩印刷。本书囊括了数学及相关概念的背景知识,包括线性代数、概率论、信息论、数值优化以及机器学习中的相关内容,是构建坚实理论基础的首选。
3. 人工智能:现代方法(第 4 版)(上下册)
本书全面、深入地探讨了人工智能(AI)领域的理论和实践,以统一的风格将当今流行的人工智能思想和术语融合到引起广泛关注的应用中,真正做到理论和实践相结合。可作为高等院校人工智能相关专业本科生、研究生教材,也是相关领域专业人员的一本参考书,涵盖了搜索、逻辑推理、机器学习等多个子领域。
4. 机器学习公式详解 第 2 版
本书从本科数学基础的视角进行讲解,帮助读者快速掌握各个机器学习算法背后的数学原理。思路清晰,视角独特,结构合理,可作为高等院校计算机及相关专业的本科生、研究生教材,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。重点解析了梯度下降、反向传播等核心算法的推导过程。
5. 动手学强化学习
本书系统地介绍了强化学习的原理和实现,是一本理论扎实、落地性强的图书。从强化学习基础、进阶、前沿三方面进行深入阐述。同时提供了配套的线上代码实践平台,展示源码的编写和运行过程,能让读者进一步掌握强化学习算法的运行机制,如 Q-Learning、Policy Gradient 等。


