AI 学习路线规划
本规划为从零基础到进阶的完整 AI 学习路线,建议按阶段循序渐进学习。
生成日期:2026年03月14日
第一阶段:Python编程基础(4-6周)
目标:打好编程底子,能独立写脚本
周次 | 内容 | 学习资源 |
1-2 | Python基础语法、数据类型、控制流 | 《Python编程:从入门到实践》 |
3-4 | 函数、面向对象、文件操作、异常处理 | 官方文档 + 练习项目 |
5-6 | 常用库:NumPy、Pandas、Matplotlib | Kaggle Learn、B站教程 |
实践项目:
- • 数据分析:分析CSV销售数据,生成报表
- • 小游戏:猜数字、2048
第二阶段:数学与算法基础(3-4周)
目标:理解AI背后的数学原理
主题 | 重点内容 | 学习建议 |
线性代数 | 矩阵运算、向量空间 | 3Blue1Brown视频(可视化) |
概率统计 | 条件概率、分布、假设检验 | 可汗学院 |
微积分 | 导数、梯度、链式法则 | 了解即可,不用深入证明 |
机器学习算法 | 线性回归、决策树、KNN | 吴恩达《机器学习》课程 |
推荐资源:
- • 吴恩达 Coursera《Machine Learning》(中文字幕)
- • 《统计学习方法》李航(经典中文书)
第三阶段:机器学习实战(6-8周)
目标:能独立完成ML项目
核心技能:
- 监督学习:分类、回归
- 无监督学习:聚类、降维
- 模型评估:准确率、召回率、F1、交叉验证
- 特征工程:数据清洗、特征选择
推荐框架学习顺序:
- Scikit-learn(必学,传统ML)
- XGBoost/LightGBM(竞赛神器)
- TensorFlow 或 PyTorch(选其一)
实践项目:
- • 房价预测(回归)
- • 手写数字识别(分类)
- • 客户分群(聚类)
第四阶段:深度学习(8-10周)
目标:理解神经网络,能调模型
模块 | 内容 | 实践 |
神经网络基础 | 感知机、激活函数、反向传播 | 用PyTorch实现MLP |
CNN卷积网络 | 图像分类、目标检测 | 训练猫狗分类器 |
RNN/LSTM | 序列建模、文本生成 | 古诗生成器 |
Transformer | Attention机制、BERT | 情感分析模型 |
推荐资源:
- • 吴恩达《深度学习》专项课程
- • PyTorch官方教程(60分钟入门)
- • 《动手学深度学习》(李沐,免费)
第五阶段:大模型与生成式AI
目标:掌握LLM应用开发
5.1 大模型基础(2周)
- 理解原理:Transformer架构、预训练+微调、RLHF
学习资源:
- • 《大模型时代》陈云霁
- • 李宏毅《生成式AI》课程
- • paper:《Attention Is All You Need》
5.2 RAG技术(2-3周)
深入方向:
- • 向量数据库:Chroma、Milvus、Pinecone
- • 嵌入模型:OpenAI Embedding、M3E(中文)
- • 检索策略:Hybrid Search、重排序
- • 框架:LangChain、LlamaIndex
实践项目:搭建个人知识库问答系统
5.3 Agent开发(2-3周)
- 核心概念:ReAct、CoT、Tools使用
- 框架:LangChain Agent、AutoGPT、Dify
- 实战:开发能查天气、写代码的Agent
5.4 模型微调(可选,进阶)
- PEFT方法:LoRA、QLoRA、Prompt Tuning
- 工具:Hugging Face Transformers、PEFT库
- 硬件:至少需要16GB显存(或Colab Pro)
第六阶段:工程化与就业
目标:能落地AI产品,找工作
方向 | 技能要求 |
AI应用开发 | FastAPI、Docker、云服务部署(AWS/阿里云) |
MLOps | 模型版本管理、监控、A/B测试 |
数据工程 | ETL pipeline、特征平台、数据标注 |
特定领域 | CV(计算机视觉)/NLP(自然语言)/推荐系统 |
学习资源汇总
视频课程
课程 | 讲师 | 平台 |
《机器学习》 | 吴恩达 | Coursera/网易云课堂 |
《深度学习》 | 吴恩达 | Coursera |
《动手学深度学习》 | 李沐 | B站(免费) |
《生成式AI导论》 | 李宏毅 | B站(免费) |
《大模型技术》 | 智源研究院 | B站(免费) |
推荐书籍
- 1. 《Python数据科学手册》
- 2. 《深度学习》(花书,Ian Goodfellow)
- 3. 《机器学习实战:基于Scikit-Learn和TensorFlow》
- 4. 《大模型应用开发极简入门》(LangChain)
实践平台
- • Kaggle:数据集、竞赛、Notebook
- • Google Colab:免费GPU(T4)
- • Hugging Face:模型库、教程、Spaces
- • 阿里天池:中文数据集和竞赛
时间规划建议
全职学习(每天6-8小时):6-8个月达到初级水平
兼职学习(每天2-3小时):12-18个月
建议:
- 1. 不要贪多,一个阶段完成再进入下一阶段
- 2. 70%时间动手实践,30%时间看理论
- 3. 做项目 > 做笔记 > 看视频
- 4. 加入社区:GitHub、知乎、PaperWeekly
你可以立即开始的第一步
- 1. 完成一个小项目:用Python + Pandas分析你感兴趣的任意数据集
- 2. 跑通第一个ML代码:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
# 加载数据 → 训练 → 预测
# 全程只需10行代码!
- 3. 体验大模型API:注册智谱/OpenAI,用Python调API做一个问答小应用
—— 文档由 Cursor AI 助手生成 ——