2026 年 Python+AI 学习路线：从零基础到实战

Python 已成为人工智能领域最主流的编程语言，根据 Stack Overflow 2024 年开发者调查，Python 在 AI/ML 领域的使用率超过 85%。

Python 在 AI 领域的优势

优势	说明
🐍 语法简洁	上手快，专注算法本身而非语法细节
📦 生态丰富	NumPy、Pandas、PyTorch 等成熟库
👥 社区活跃	海量教程、开源项目和问题解答
🔧 工具完善	Jupyter、Colab 等优秀开发环境
🚀 部署便捷	Flask/FastAPI 快速构建 AI 服务

AI 技术领域分布

了解 AI 各领域的占比，帮助你更好地规划学习重点：

领域	占比
机器学习	35%
深度学习	30%
自然语言处理	15%
计算机视觉	12%
强化学习	5%
其他	3%

完整学习路径

下图展示了从零基础到 AI 专家的完整学习路线逻辑：

开始学习：评估是否有编程基础。无基础则进入阶段 0。
阶段 0 (Python 基础)：掌握核心语法与编程思维。
阶段 1 (数据科学)：学习数据处理、分析与可视化。
阶段 2 (机器学习)：理解 ML 原理，掌握 Scikit-learn。
选择方向：
- NLP：Transformers, LLM 应用。
- CV：CNN 架构，目标检测。
- 通用：PyTorch 基础，神经网络优化。
阶段 4 (实战项目)：端到端项目，模型部署，性能优化。
目标：成为 AI 工程师。

分阶段学习指南

🟢 阶段 0：Python 基础（2-4 周）

学习目标：掌握 Python 核心语法和编程思维

核心知识点

数据类型：int, float, str, list, dict, tuple, set
控制流程：if/else, for/while 循环
函数：函数定义，lambda 表达式，装饰器基础
面向对象：类与对象，继承与多态
：异常处理，上下文管理器

import torch import torch.nn as nn import torch.optim as optim from torch.utils.data import DataLoader, TensorDataset import matplotlib.pyplot as plt # 检查 CUDA 可用性 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') print(f"使用设备：{device}") # 定义神经网络 class NeuralNetwork(nn.Module): def __init__(self, input_size, hidden_size, num_classes): super(NeuralNetwork, self).__init__() self.layer1 = nn.Linear(input_size, hidden_size) self.relu = nn.ReLU() self.layer2 = nn.Linear(hidden_size, hidden_size // 2) self.layer3 = nn.Linear(hidden_size // 2, num_classes) self.dropout = nn.Dropout(0.2) def forward(self, x): out = self.layer1(x) out = self.relu(out) out = self.dropout(out) out = self.layer2(out) out = self.relu(out) out = self.dropout(out) out = self.layer3(out) return out # 超参数 input_size = 784 # MNIST 图像 28x28 hidden_size = 256 num_classes = 10 num_epochs = 10 batch_size = 100 learning_rate = 0.001 # 初始化模型 model = NeuralNetwork(input_size, hidden_size, num_classes).to(device) # 损失函数和优化器 criterion = nn.CrossEntropyLoss() optimizer = optim.Adam(model.parameters(), lr=learning_rate) # 模拟数据 X_train = torch.randn(1000, input_size).to(device) y_train = torch.randint(0, num_classes, (1000,)).to(device) train_dataset = TensorDataset(X_train, y_train) train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True) # 训练循环 train_losses = [] for epoch in range(num_epochs): model.train() epoch_loss = 0 for i, (images, labels) in enumerate(train_loader): # 前向传播 outputs = model(images) loss = criterion(outputs, labels) # 反向传播和优化 optimizer.zero_grad() loss.backward() optimizer.step() epoch_loss += loss.item() avg_loss = epoch_loss / len(train_loader) train_losses.append(avg_loss) print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {avg_loss:.4f}') # 绘制训练曲线 plt.figure(figsize=(10, 5)) plt.plot(train_losses, marker='o') plt.xlabel('Epoch') plt.ylabel('Loss') plt.title('训练损失曲线') plt.grid(True, alpha=0.3) plt.show()

项目类型	难度	涉及技术	预计时间
房价预测	⭐⭐	Pandas, Scikit-learn	1 周
图像分类	⭐⭐⭐	PyTorch, CNN	2 周
情感分析	⭐⭐⭐	Transformers, NLP	2 周
智能客服	⭐⭐⭐⭐	LangChain, LLM	3 周
RAG 系统	⭐⭐⭐⭐⭐	向量数据库，Agent	4 周

# project_structure.txt """ 智能文档问答系统 │ ├── data/ # 数据目录 │ ├── documents/ # 原始文档 │ └── vectorstore/ # 向量存储 │ ├── src/ # 源代码 │ ├── config.py # 配置文件 │ ├── loader.py # 文档加载 │ ├── embeddings.py # 向量化 │ ├── retriever.py # 检索器 │ ├── generator.py # 生成器 │ └── api.py # API 接口 │ ├── app.py # 主应用 ├── requirements.txt # 依赖 └── README.md # 说明文档 """ # config.py import os from dataclasses import dataclass from typing import Optional @dataclass class Config: # API 密钥 OPENAI_API_KEY: str = os.getenv("OPENAI_API_KEY", "") # 模型配置 EMBEDDING_MODEL: str = "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2" LLM_MODEL: str = "gpt-3.5-turbo" LLM_TEMPERATURE: float = 0.7 LLM_MAX_TOKENS: int = 1000 # 向量存储配置 CHUNK_SIZE: int = 500 CHUNK_OVERLAP: int = 50 VECTOR_DB_PATH: str = "data/vectorstore" # 检索配置 TOP_K: int = 3 SIMILARITY_THRESHOLD: float = 0.7 # API 配置 API_HOST: str = "0.0.0.0" API_PORT: int = 8000 # loader.py from typing import List from langchain.document_loaders import ( TextLoader, PyPDFLoader, DirectoryLoader ) from langchain.text_splitter import RecursiveCharacterTextSplitter from langchain.schema import Document class DocumentLoader: def __init__(self, chunk_size: int = 500, chunk_overlap: int = 50): self.text_splitter = RecursiveCharacterTextSplitter( chunk_size=chunk_size, chunk_overlap=chunk_overlap, length_function=len, separators=["\n\n", "\n", "。", "！", "？", ".", "!", "?", " ", ""]) def load_text(self, file_path: str) -> List[Document]: """加载文本文件""" loader = TextLoader(file_path, encoding='utf-8') documents = loader.load() return self.text_splitter.split_documents(documents) def load_pdf(self, file_path: str) -> List[Document]: """加载 PDF 文件""" loader = PyPDFLoader(file_path) documents = loader.load() return self.text_splitter.split_documents(documents) def load_directory(self, directory: str, glob: str = "**/*.txt") -> List[Document]: """加载目录下的所有文档""" loader = DirectoryLoader(directory, glob=glob) documents = loader.load() return self.text_splitter.split_documents(documents) # api.py from fastapi import FastAPI, HTTPException from pydantic import BaseModel from typing import List, Optional import uvicorn app = FastAPI(title="智能文档问答系统", version="1.0.0") class QueryRequest(BaseModel): question: str top_k: Optional[int] = 3 class QueryResponse(BaseModel): answer: str sources: List[str] confidence: float @app.get("/") async def root(): return {"message": "智能文档问答系统 API", "version": "1.0.0", "endpoints": {"/query": "POST - 问答接口", "/health": "GET - 健康检查"}} @app.get("/health") async def health_check(): return {"status": "healthy"} @app.post("/query", response_model=QueryResponse) async def query(request: QueryRequest): try: # 这里调用实际的问答逻辑 # result = qa_chain({"query": request.question}) return QueryResponse( answer="这是示例回答", sources=["来源 1", "来源 2"], confidence=0.95) except Exception as e: raise HTTPException(status_code=500, detail=str(e)) if __name__ == "__main__": uvicorn.run("api:app", host="0.0.0.0", port=8000, reload=True)

""" 项目：预测客户是否会购买理财产品数据集：模拟银行客户数据 """ import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from sklearn.model_selection import train_test_split, cross_val_score, GridSearchCV from sklearn.preprocessing import StandardScaler, LabelEncoder from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier from sklearn.linear_model import LogisticRegression from sklearn.metrics import classification_report, confusion_matrix, roc_auc_score, roc_curve from sklearn.pipeline import Pipeline import warnings warnings.filterwarnings('ignore') # 设置中文字体 plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False # ========== 1. 数据生成 ========== np.random.seed(42) n_samples = 5000 data = { '年龄': np.random.randint(18, 70, n_samples), '收入': np.random.randint(3000, 50000, n_samples), '存款': np.random.randint(0, 1000000, n_samples), '债务': np.random.randint(0, 500000, n_samples), '信用评分': np.random.randint(300, 850, n_samples), '已购买产品数': np.random.randint(0, 10, n_samples), '上次购买天数': np.random.randint(30, 3650, n_samples), '职业': np.random.choice(['学生', '上班族', '个体户', '退休', '自由职业'], n_samples), '婚姻状况': np.random.choice(['单身', '已婚', '离异'], n_samples), '学历': np.random.choice(['高中', '本科', '硕士', '博士'], n_samples), } df = pd.DataFrame(data) # 生成目标变量（基于特征组合） def calc_purchase_prob(row): score = 0 if 25 <= row['年龄'] <= 55: score += 20 if row['收入'] > 15000: score += 20 if row['存款'] > 100000: score += 20 if row['信用评分'] > 650: score += 15 if row['职业'] in ['上班族', '个体户']: score += 15 return min(score + np.random.randint(-10, 10), 100) / 100 df['购买概率'] = df.apply(calc_purchase_prob, axis=1) df['是否购买'] = (df['购买概率'] > 0.5).astype(int) # ========== 2. 数据探索 ========== print("=" * 50) print("数据集基本信息") print("=" * 50) print(df.info()) print("\n目标变量分布:") print(df['是否购买'].value_counts()) print(f"购买率：{df['是否购买'].mean():.2%}") # 可视化 fig, axes = plt.subplots(2, 3, figsize=(15, 10)) # 年龄分布 axes[0, 0].hist(df[df['是否购买']==0]['年龄'], bins=30, alpha=0.5, label='未购买') axes[0, 0].hist(df[df['是否购买']==1]['年龄'], bins=30, alpha=0.5, label='购买') axes[0, 0].set_xlabel('年龄') axes[0, 0].set_ylabel('人数') axes[0, 0].legend() axes[0, 0].set_title('年龄与购买关系') # 收入分布 axes[0, 1].hist(df[df['是否购买']==0]['收入'], bins=30, alpha=0.5, label='未购买') axes[0, 1].hist(df[df['是否购买']==1]['收入'], bins=30, alpha=0.5, label='购买') axes[0, 1].set_xlabel('收入') axes[0, 1].legend() axes[0, 1].set_title('收入与购买关系') # 信用评分分布 axes[0, 2].hist(df[df['是否购买']==0]['信用评分'], bins=30, alpha=0.5, label='未购买') axes[0, 2].hist(df[df['是否购买']==1]['信用评分'], bins=30, alpha=0.5, label='购买') axes[0, 2].set_xlabel('信用评分') axes[0, 2].legend() axes[0, 2].set_title('信用评分与购买关系') # 职业分布 career_purchase = df.groupby('职业')['是否购买'].mean() axes[1, 0].bar(career_purchase.index, career_purchase.values) axes[1, 0].set_ylabel('购买率') axes[1, 0].set_title('不同职业的购买率') # 学历分布 edu_purchase = df.groupby('学历')['是否购买'].mean() axes[1, 1].bar(edu_purchase.index, edu_purchase.values) axes[1, 1].set_ylabel('购买率') axes[1, 1].set_title('不同学历的购买率') # 相关性热图 numeric_cols = ['年龄', '收入', '存款', '债务', '信用评分', '已购买产品数', '上次购买天数', '是否购买'] correlation = df[numeric_cols].corr() sns.heatmap(correlation, annot=True, fmt='.2f', cmap='coolwarm', center=0, ax=axes[1, 2]) axes[1, 2].set_title('特征相关性热图') plt.tight_layout() plt.savefig('data_exploration.png', dpi=300) plt.show() # ========== 3. 特征工程 ========== # 编码分类变量 le = LabelEncoder() df['职业编码'] = le.fit_transform(df['职业']) df['婚姻编码'] = le.fit_transform(df['婚姻状况']) df['学历编码'] = le.fit_transform(df['学历']) # 创建新特征 df['债务收入比'] = df['债务'] / (df['收入'] * 12 + 1) df['存款收入比'] = df['存款'] / (df['收入'] * 12 + 1) df['净资产'] = df['存款'] - df['债务'] # 选择特征 feature_cols = ['年龄', '收入', '存款', '债务', '信用评分', '已购买产品数', '上次购买天数', '职业编码', '婚姻编码', '学历编码', '债务收入比', '存款收入比', '净资产'] X = df[feature_cols] y = df['是否购买'] # 划分数据集 X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.2, random_state=42, stratify=y) # ========== 4. 模型训练与评估 ========== # 定义模型 models = { '逻辑回归': Pipeline([('scaler', StandardScaler()), ('model', LogisticRegression(max_iter=1000, random_state=42))]), '随机森林': RandomForestClassifier(n_estimators=100, random_state=42), '梯度提升': GradientBoostingClassifier(random_state=42) } # 训练和评估 results = {} for name, model in models.items(): print(f"\n训练 {name}...") model.fit(X_train, y_train) # 预测 y_pred = model.predict(X_test) y_pred_proba = model.predict_proba(X_test)[:, 1] # 评估 results[name] = { 'model': model, 'predictions': y_pred, 'probabilities': y_pred_proba, 'accuracy': model.score(X_test, y_test), 'roc_auc': roc_auc_score(y_test, y_pred_proba) } print(f"准确率：{results[name]['accuracy']:.4f}") print(f"AUC: {results[name]['roc_auc']:.4f}") # ========== 5. 最佳模型分析 ========== best_model_name = max(results, key=lambda x: results[x]['roc_auc']) best_model = results[best_model_name]['model'] print(f"\n最佳模型：{best_model_name}") print("=" * 50) print("\n分类报告:") print(classification_report(y_test, results[best_model_name]['predictions'])) # 混淆矩阵 cm = confusion_matrix(y_test, results[best_model_name]['predictions']) plt.figure(figsize=(8, 6)) sns.heatmap(cm, annot=True, fmt='d', cmap='Blues') plt.xlabel('预测标签') plt.ylabel('真实标签') plt.title(f'{best_model_name} - 混淆矩阵') plt.show() # ROC 曲线 plt.figure(figsize=(10, 6)) for name, result in results.items(): fpr, tpr, _ = roc_curve(y_test, result['probabilities']) plt.plot(fpr, tpr, label=f"{name} (AUC = {result['roc_auc']:.3f})") plt.plot([0, 1], [0, 1], 'k--', label='随机分类器') plt.xlabel('假正率') plt.ylabel('真正率') plt.title('ROC 曲线对比') plt.legend() plt.grid(alpha=0.3) plt.show() # 特征重要性（树模型） if hasattr(best_model, 'feature_importances_'): feature_importance = pd.DataFrame({ 'feature': feature_cols, 'importance': best_model.feature_importances_ }).sort_values('importance', ascending=False) plt.figure(figsize=(10, 6)) plt.barh(feature_importance['feature'], feature_importance['importance']) plt.xlabel('重要性') plt.title('特征重要性') plt.tight_layout() plt.show() print("\n特征重要性排序:") print(feature_importance) print("\n" + "=" * 50) print("项目完成！") print("=" * 50)

平台	课程	适合阶段	难度
Coursera	Machine Learning (Andrew Ng)	初学者	⭐⭐⭐
吴恩达深度学习课程	Deep Learning Specialization	阶段 2-3	⭐⭐⭐⭐
李宏毅机器学习	Machine Learning	中级	⭐⭐⭐⭐
Fast.ai	Practical Deep Learning for Coders	实战导向	⭐⭐⭐⭐
极客时间	Python 进阶	阶段 0-1	⭐⭐

投入时间	学习周期	可达到水平
1 小时/天	12-18 个月	初级 AI 工程师
2-3 小时/天	8-12 个月	中级 AI 工程师
全职学习	4-6 个月	实战能力

2026 年 Python+AI 学习路线：从零基础到实战

Python 在 AI 领域的优势

AI 技术领域分布

完整学习路径

分阶段学习指南

🟢 阶段 0：Python 基础（2-4 周）

核心知识点

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

必学代码示例

🔵 阶段 1：数据科学基础（4-6 周）

核心技能树

NumPy 实战代码

Pandas 数据处理实战

数据可视化示例

🟡 阶段 2：机器学习（6-8 周）

ML 算法分类图

经典算法实现

🟠 阶段 3：深度学习（8-12 周）

深度学习框架选择

PyTorch 实战代码

🔴 阶段 4：NLP 与 LLM 应用（6-8 周）

NLP 技术发展时间线

Transformers 实战

🟣 阶段 5：实战项目（持续进行）

项目推荐

端到端项目示例：智能文档问答系统

实战代码示例

示例 1：完整的机器学习项目

学习资源推荐

📚 在线课程

📖 推荐书籍

🛠️ 实用工具与库

🔗 重要资源链接

常见问题解答

Q1: 没有编程基础，能学 Python+AI 吗？

Q2: 数学基础不好，能学 AI 吗？

Q3: 学习多久能找到工作？

Q4: GPU 不够用怎么办？

Q5: 如何保持技术更新？

学习时间线总览

总结

核心要点

学习建议

附录

A. Python 环境搭建

B. 常用命令速查

C. 学习检查清单

阶段 0 检查清单

阶段 1 检查清单

阶段 2 检查清单

阶段 3 检查清单

阶段 4 检查清单

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具