前言
自 ChatGPT 爆火以来,AI 技术再次受到广泛关注,国内外各大厂商纷纷布局。作为程序员,我们无不时刻感受着 AI 带来的冲击。从最初的新奇到焦虑,再到尝试了解、应用,这是大多数技术人员的必经之路。
无论是 IT 行业还是非 IT 行业,都在不同程度上去了解或学习使用大模型。面对新的变革技术,体系性的学习是理解和掌握它的必要途径。这不仅能帮助我们全面了解技术原理,还能明确自身在变革中的定位,减少不必要的焦虑。
学习路线调研
在决心开始体系性学习时,首要问题是:如何入手?按照什么路线和方向?自媒体时代,信息铺天盖地,很难理清头绪。许多课程大纲虽然存在,但实际教学中往往处于探索阶段,示例程序可能随时因版本更新而失效。
对于普通程序员而言,尤其是以 Java 工程应用为主、Python 为辅的开发者,学习大模型的目标应聚焦于解决工程化和应用层面的问题,而非成为算法科学家。因此,我的学习思路遵循以下原则:
- 实用优先:不过度纠结底层数学推导,先上手调用和应用。
- 循序渐进:从概念理解到提示工程,再到应用开发,最后涉及微调。
- 场景驱动:结合具体业务场景(如 RAG、Agent)进行实践。
基础篇:概念与提示工程
1. 核心概念辨析
首先需要厘清 AI、AGI、AIGC、NLP、LLM 等基本概念的区别与联系。理解大模型的基本工作原理,包括 Transformer 架构、预训练与微调的区别,以及 Token 的概念。
2. 提示工程(Prompt Engineering)
提示工程是与大模型交互的核心技能。
- 基本原理:理解模型如何通过上下文生成内容。
- 技巧掌握:包括零样本(Zero-shot)、少样本(Few-shot)提示,以及思维链(Chain of Thought)和思维树(Tree of Thoughts)等进阶方法。
- 优化策略:学习如何让 LLM 自我优化提示词,提高生成内容的质量和稳定性。
- 安全与合规:了解 Prompt 攻击类型及防范措施,掌握内容审核机制。
进阶篇:应用开发与架构
1. API 调用与集成
掌握主流大模型平台(如 OpenAI、国内云厂商)的 API 调用方式。重点在于 Python 调用 GPT-API,实现交互式多轮对话功能,并处理流式输出。
2. 插件与智能体(Plugins & Agents)
- GPTs 与 Plugins:了解大模型扩展能力的生态,理解如何通过插件连接外部工具。
- Agent 实现:学习构建自主智能体(如 AutoGPT),使模型具备规划、记忆和执行任务的能力。
- 业务架构:从 AI Embedded 到 Copilot,再到 Agent 的应用模式演进,设计合理的业务架构和技术架构。
3. Function Calling
利用 Function Calling 连接大模型与后端业务系统,用自然语言驱动系统认知,实现语义与代码的无缝对接。
高阶应用:RAG 与知识库
检索增强生成(RAG)是目前企业级应用的主流方案。
1. RAG 原理与选型
深入理解 RAG 的工作流程,对比 RAG 与 Fine-Tuning 的优劣,根据数据敏感性和更新频率选择合适的方案。
2. 向量检索实战
- 关键字检索 vs 向量检索:理解混合检索的优势。
- 搭建流程:从零搭建一个 RAG 系统,包括文档切片、向量化存储、检索策略优化。
- 混合增强策略:探索 RAG + Fine-Tuning 的组合拳,提升特定领域的回答准确率。


