引言
大型语言模型 (LLM) 极大地提升了自然语言处理 (NLP) 的上限,为理解和生成人类语言提供了精确而有效的方法。这些模型现在已成为众多行业中各种应用程序不可或缺的一部分,包括聊天机器人、语言翻译、文本摘要和情感分析。然而,由于 LLM 的复杂性及其背后的复杂算法,掌握 LLM 可能具有挑战性。为了帮助开发者系统性地建立知识体系,以下整理了十二本在 LLM 和 NLP 领域极具价值的书籍,涵盖了从理论基础到工程实践的全方位内容。
1. GPT-3:使用大型语言模型构建创新的 NLP 产品——O'Reilly
本书深入探讨了 GPT-3 的功能,GPT-3 是当今最先进的 LLM 之一。它提供了使用 GPT-3 构建创新 NLP 产品的见解,涵盖了模型微调、检索增强生成 (RAG) 和从人类反馈中进行强化学习 (RLHF) 等主题。本书是希望在其应用程序中利用 GPT-3 功能的开发人员和企业的实用指南,详细解析了如何调整模型以适应特定业务需求。
2. 大型语言模型快速入门指南 - 使用 ChatGPT 和其他 LLM 的策略和最佳实践 — O'Reilly
本指南提供了使用大型语言模型的快速入门指南,重点介绍 ChatGPT 和其他 LLM。它提供了在项目中实施 LLM 的策略和最佳实践,涵盖模型选择、微调和部署等主题。对于希望快速将 LLM 集成到其应用程序中的开发人员和企业来说,这本书是一份绝佳资源,强调了提示词工程的重要性。
3. 使用 Transformer 进行自然语言处理 — O'Reilly
本书由 Lewis Tunstall、Leandro von Werra 和 Thomas Wolf 撰写,深入介绍了 transformers,即在 NLP 中实现最先进成果的主要架构。自 2017 年推出以来,transformers 彻底改变了该领域,与以前的模型相比有了显著的改进。这本书是了解 transformers 的底层机制以及如何将它们应用于各种 NLP 任务的宝贵资源。它涵盖了使用基于 Python 的深度学习库 Hugging Face Transformers 训练和扩展这些大型模型的实际方面,并提供了对 transformers 的实际应用的见解,例如撰写真实的新闻报道和创建聊天机器人。
4. 用于自然语言处理的 Transformers——Packt
本书深入探讨了 Transformer 的世界,重点介绍了它们在 NLP 中的应用。它涵盖了 Transformer 的核心概念,包括自注意力机制,并探讨了如何使用这些模型来增强语言建模能力。对于那些希望了解 Transformer 的技术方面及其在 NLP 中的作用的人来说,这本书是一本绝佳的资源。它提供了 Transformer 架构的全面指南,从原始 Transformer 开始,然后转到 RoBERTa、BERT 和 DistilBERT 模型。本书还介绍了在某些情况下可以胜过 GPT-3 的小型 Transformer 的训练方法,以及高级语言理解技术,例如优化社交网络数据集和假新闻识别。
5. 使用 Transformers 和扩散模型进行生成式人工智能实践 — O'Reilly
本书是一本实用的生成式人工智能指南,重点介绍转换器和扩散模型。它涵盖了生成式人工智能项目的生命周期,包括用例定义、模型选择、微调和部署。本书旨在帮助读者将生成式人工智能应用于他们的业务用例,并提供有关模型选择、微调和与现有软件生态系统集成的实用建议。特别关注了图像生成与文本生成的结合,拓展了 NLP 的应用边界。
6. 构建大型语言模型(从头开始)
本书提供了从头开始构建大型语言模型的分步指南。它涵盖了构建 LLM 的技术方面,包括模型架构、训练和部署。对于希望构建自己的 LLM 的开发人员和研究人员来说,本书是一份绝佳资源,提供有关模型架构、训练和部署的实用建议。书中详细讲解了分布式训练策略和数据预处理流程,适合有深厚机器学习背景的工程师。
7. 使用 Python 预训练视觉和大型语言模型
本书提供了使用 Python 预训练视觉和大型语言模型的全面指南。它涵盖了预训练模型的技术方面,包括模型架构、训练和部署。对于希望预训练自己的模型的开发人员和研究人员来说,本书是一本绝佳的资源,提供有关模型架构、训练和部署的实用建议。内容涉及多模态学习的最新进展,帮助开发者理解视觉与语言模型的融合技术。
8. AWS 上的生成式人工智能 — O'Reilly
本书由 Chris Fregly、Antje Barth 和 Shelbee Eigenbrode 撰写,提供了在 AWS 上应用生成式 AI 的全面指南。它涵盖了生成式 AI 项目生命周期,包括模型选择、微调和部署。本书旨在帮助读者将生成式 AI 应用于他们的业务用例,并提供有关模型选择、微调和与现有软件生态系统集成的实用建议。详细介绍了如何利用云原生服务降低 LLM 的运维成本。


