上海交大《动手学大模型应用开发》教程指南
本项目是一个面向开发者的大模型应用开发教程,旨在结合个人知识库助手项目,通过系统化的课程完成大模型开发的重点入门。内容涵盖大模型应用开发的方方面面,主要包括微调与部署、提示学习与思维链、知识编辑、模型水印、越狱攻击、多模态模型以及大模型智能体与安全等核心领域。
教程大纲概览
本教程基于上海交大更新的系列编程实践教程,命名致敬李沐老师的《动手学深度学习》。从更新内容来看,侧重安全垂直方向,适合希望深入理解大模型内部机制与外部应用的开发者。
核心章节主题
- 微调与部署:掌握模型适配特定任务及私有化部署的关键技术。
- 提示学习与思维链:学习如何通过 Prompt Engineering 激发模型推理能力。
- 知识编辑:了解如何在不重新训练的情况下修改模型内部知识。
- 模型水印:探讨生成内容的版权保护与溯源技术。
- 越狱攻击:分析模型的安全边界与防御策略。
- 多模态模型:探索文本、图像等多模态数据的联合处理。
- 大模型智能体与安全:研究 Agent 自主任务执行及系统安全性。
学习指南
本教程出发点在于降低大模型开发的学习门槛,帮助更多初学者入门。受众为所有具备基础 Python 能力的开发者,对人工智能或算法基础无硬性要求,仅需掌握基本 Python 语法及初级开发技能即可。
硬件与环境要求
本项目对本地硬件基本没有强制要求,不需要 GPU 环境,个人电脑及服务器均可用于学习。建议配置至少 8GB 内存的机器以流畅运行相关代码示例。
学习方法建议
- 理论先行:先阅读并充分理解教程本身内容,掌握大模型开发的基本理念与技能。
- 实战复现:结合提供的个人知识库助手项目源码,深入理解项目的构建过程,尝试基于教程学习内容复现搭建。
- 独立开发:在完成教程后,应具备独立搭建一个简单大模型应用的能力。
- 拓展创新:在教程基础上结合奇思妙想,搭建具有个人特色的大模型应用。
大模型应用开发是一个充分面向实际、面向需求、面向创意的新领域。欢迎每一位学习者不断拓展、自我学习,以自己的智慧,打造更精彩的大模型宇宙。
如何系统地学习大模型 LLM?
大模型时代,LLM(Large Language Model)让程序员们开始重新评估自己的本领。与其焦虑 AI 是否会取代行业,不如成为「掌握 AI 工具的技术人」。AI 时代,谁先尝试,谁就能占得先机。
针对自学遇到困难的同学们,以下梳理了大模型学习脉络,包括经典书籍、行业报告、视频教程、开源教程及学习路线。
一、LLM 大模型经典书籍
AI 大模型已成为科技领域热点,经典书籍是夯实理论基础的重要资源。建议阅读涵盖 Transformer 架构、注意力机制及预训练原理的著作。
二、640 套 LLM 大模型报告合集
这套包含 640 份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对 AI 大模型感兴趣的爱好者,都将为您提供宝贵的信息和启示。
三、LLM 大模型系列视频教程
视频课程适合视觉型学习者,通过演示代码和架构图解,快速建立对复杂概念的理解。
四、LLM 大模型开源教程
关注主流开源模型如 LLaMA、Meta、ChatGLM、ChatGPT 等的官方文档与社区教程,跟进最新技术动态。
LLM 大模型学习路线详解
阶段 1:AI 大模型时代的基础理解
目标:了解 AI 大模型的基本概念、发展历程和核心原理。
内容详解:
- L1.1 人工智能简述与大模型起源:回顾 AI 发展史,从专家系统到深度学习,再到 Transformer 的诞生。


