PyTorch 深度学习框架核心函数与实战指南 | 极客日志

PythonAI算法

PyTorch 深度学习框架核心函数与实战指南

综述由AI生成PyTorch 作为当前主流的深度学习框架之一，凭借其动态图机制和灵活的 API 设计，在学术界与工业界均占据重要地位。系统梳理了 PyTorch 的核心功能模块，涵盖张量操作、自动求导、神经网络构建及训练流程等关键知识点。通过对比 TensorFlow 与 Keras，分析 PyTorch 的优势，并提供从零搭建卷积神经网络的实战示例。内容涉及激活函数详解、优化器选择策略及多框架协同应用，旨在帮助开发者快速掌握深度学习开源框架，提升模型训练与推理能力。

莫名其妙发布于 2025/2/6更新于 2026/6/320 浏览

PyTorch 深度学习框架核心函数与实战指南

引言

PyTorch 是目前常用的深度学习框架之一，它凭借着对初学者的友好性、灵活性，发展迅猛。相比于 TensorFlow 的静态图限制和 Keras 的高度封装，PyTorch 无论是在学术圈还是工业界，都相当占优势。掌握了 PyTorch，就相当于走上了深度学习、机器学习的快车道。

本文旨在系统梳理 PyTorch 的核心功能模块，涵盖张量操作、自动求导、神经网络构建及训练流程等关键知识点，帮助开发者快速掌握该框架。

一、环境配置与基础安装

在使用 PyTorch 之前，需要确保 Python 环境已正确配置。推荐使用 Anaconda 管理虚拟环境。

1. 创建虚拟环境

conda create -n pytorch_env python=3.8
conda activate pytorch_env

2. 安装 PyTorch

根据操作系统和 CUDA 版本选择对应的安装命令。例如，使用 NVIDIA GPU 加速：

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

若无 GPU，可安装 CPU 版本：

pip install torch torchvision torchaudio

二、张量（Tensor）操作

张量是 PyTorch 中的核心数据结构，类似于 NumPy 的 ndarray，但支持在 GPU 上运行。

1. 创建张量

import torch

# 从列表创建
tensor_list = torch.tensor([[1, 2], [3, 4]])

# 随机初始化
random_tensor = torch.rand(2, 3)

# 全零/全一
zeros_tensor = torch.zeros(2, 3)
one_tensor = torch.ones(2, 3)

# 指定数据类型和位置
tensor_cpu = torch.tensor([1.0, 2.0])
tensor_gpu = tensor_cpu.cuda() if torch.cuda.is_available() else tensor_cpu

2. 常用运算

a = torch.tensor([1.0, 2.0, 3.0])
b = torch.tensor([4.0, 5.0, 6.0])


c_add = a + b
c_mul = a * b
c_div = a / b


dot_product = torch.matmul(a, b) 
matrix_a = torch.rand(, )
matrix_b = torch.rand(, )
matmul_result = torch.mm(matrix_a, matrix_b)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

t = torch.arange(10).reshape(2, 5)
print(t[0, :])      # 第一行
print(t[:, 1])      # 第二列
print(t[1:3, :])    # 切片

x = torch.tensor([1.0, 2.0], requires_grad=True)
y = x ** 2
y.sum().backward()
print(x.grad) # 输出梯度

with torch.no_grad():
    z = x * 2

import torch.nn as nn
import torch.nn.functional as F

class SimpleNet(nn.Module):
    def __init__(self):
        super(SimpleNet, self).__init__()
        self.fc1 = nn.Linear(784, 128)
        self.relu = nn.ReLU()
        self.dropout = nn.Dropout(p=0.5)
        self.fc2 = nn.Linear(128, 10)

    def forward(self, x):
        x = x.view(-1, 784)
        x = self.fc1(x)
        x = self.relu(x)
        x = self.dropout(x)
        x = self.fc2(x)
        return x

criterion = nn.CrossEntropyLoss() # 分类任务
# criterion = nn.MSELoss()       # 回归任务

from torch.utils.data import Dataset, DataLoader

class MyDataset(Dataset):
    def __init__(self, data, labels):
        self.data = data
        self.labels = labels

    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        return self.data[idx], self.labels[idx]

dataset = MyDataset(data, labels)
dataloader = DataLoader(dataset, batch_size=32, shuffle=True)

model = SimpleNet()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

for epoch in range(10):
    for inputs, labels in dataloader:
        # 前向传播
        outputs = model(inputs)
        loss = criterion(outputs, labels)

        # 反向传播
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

    print(f"Epoch {epoch}, Loss: {loss.item()}")

optimizer_sgd = torch.optim.SGD(model.parameters(), lr=0.01, momentum=0.9)
optimizer_adam = torch.optim.Adam(model.parameters(), lr=0.001)

# 保存整个模型
torch.save(model.state_dict(), 'checkpoint.pth')

# 加载模型
model.load_state_dict(torch.load('checkpoint.pth'))

特性	PyTorch	TensorFlow	Keras
图机制	动态图	静态图 (TF1) / 动态 (TF2)	基于 TF 的高层封装
调试	易于调试 (Pythonic)	较复杂	简单
社区	学术界主导	工业界主导	易用性高
部署	TorchScript	TFLite	ONNX

PyTorch 深度学习框架核心函数与实战指南

PyTorch 深度学习框架核心函数与实战指南

引言

一、环境配置与基础安装

1. 创建虚拟环境

2. 安装 PyTorch

二、张量（Tensor）操作

1. 创建张量

2. 常用运算

更多推荐文章

相关免费在线工具

3. 索引与切片

三、自动求导系统（Autograd）

1. 开启梯度追踪

2. 停止梯度计算

四、构建神经网络模型

1. 定义网络层

2. 激活函数详解

3. 损失函数

五、数据加载与预处理

1. Dataset 与 DataLoader

六、训练循环（Training Loop）

七、优化器详解

八、模型保存与加载

九、主流框架对比

十、实战建议与总结

更多推荐文章

相关免费在线工具

PyTorch 深度学习框架核心函数与实战指南

PyTorch 深度学习框架核心函数与实战指南

引言

一、环境配置与基础安装

1. 创建虚拟环境

2. 安装 PyTorch

二、张量（Tensor）操作

1. 创建张量

2. 常用运算

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 索引与切片

三、自动求导系统（Autograd）

1. 开启梯度追踪

2. 停止梯度计算

四、构建神经网络模型

1. 定义网络层

2. 激活函数详解

3. 损失函数

五、数据加载与预处理

1. Dataset 与 DataLoader

六、训练循环（Training Loop）

七、优化器详解

八、模型保存与加载

九、主流框架对比

十、实战建议与总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具