PyTorch 实战：加载模型权重与 ONNX 推理部署

PyTorch 模型训练完成后，如何加载权重并进行跨平台推理？本文演示了实例化网络结构、加载 state_dict 以及调用 eval() 进入评估模式的关键步骤。针对多语言环境部署需求，通过 torch.onnx.export 导出模型为 ONNX 格式，并利用 onnxruntime 在 Python 环境中完成推理预测。结合 FashionMNIST 数据集示例，展示了从模型加载到输出分类结果的完整流程，解决了不同框架间模型共享与加速的问题。

猫巷少女发布于 2025/1/19更新于 2026/5/13 浏览

加载和运行模型预测

加载模型

这一节我们重点看如何加载持久化的参数状态，并进行模型推断。首先需要定义模型类，它包含了神经网络的结构信息。

import torch
from torch import nn

class NeuralNetwork(nn.Module):
    def __init__(self):
        super(NeuralNetwork, self).__init__()
        self.flatten = nn.Flatten()
        self.linear_relu_stack = nn.Sequential(
            nn.Linear(28*28, 512),
            nn.ReLU(),
            nn.Linear(512, 512),
            nn.ReLU(),
            nn.Linear(512, 10),
            nn.ReLU()
        )

    def forward(self, x):
        x = self.flatten(x)
        logits = self.linear_relu_stack(x)
        return logits

实例化模型类后，就可以加载保存好的权重文件了。这里有个关键点：在推理前务必调用 model.eval()。这会将 Dropout 和批量归一化层切换到评估模式，否则结果可能会因为随机性而不一致。

model = NeuralNetwork()
model.load_state_dict(torch.load('data/model.pth'))
model.eval()

模型推理与 ONNX 导出

把神经网络放到各种平台和硬件上运行往往很麻烦，不同框架间的性能调优也很耗时。ONNX (Open Neural Network Exchange) 提供了一种通用格式，支持跨语言和跨设备推理。比如你可以用它在 Java、C# 或 ML.NET 上跑模型。

PyTorch 原生支持导出 ONNX。由于 PyTorch 是动态图，导出时需要传入一个固定大小的张量作为输入来追踪计算图。通常创建一个合适尺寸的零张量即可。

import torch.onnx as onnx

input_image = torch.zeros((1, 28, 28))
onnx_model = 
onnx.export(model, input_image, onnx_model)

加载和运行模型预测

加载模型

这一节我们重点看如何加载持久化的参数状态，并进行模型推断。首先需要定义模型类，它包含了神经网络的结构信息。

import torch
from torch import nn

class NeuralNetwork(nn.Module):
    def __init__(self):
        super(NeuralNetwork, self).__init__()
        self.flatten = nn.Flatten()
        self.linear_relu_stack = nn.Sequential(
            nn.Linear(28*28, 512),
            nn.ReLU(),
            nn.Linear(512, 512),
            nn.ReLU(),
            nn.Linear(512, 10),
            nn.ReLU()
        )

    def forward(self, x):
        x = self.flatten(x)
        logits = self.linear_relu_stack(x)
        return logits

model = NeuralNetwork()
model.load_state_dict(torch.load('data/model.pth'))
model.eval()

模型推理与 ONNX 导出

PyTorch 原生支持导出 ONNX。由于 PyTorch 是动态图，导出时需要传入一个固定大小的张量作为输入来追踪计算图。通常创建一个合适尺寸的零张量即可。

import torch.onnx as onnx

input_image = torch.zeros((1, 28, 28))
onnx_model = 
onnx.export(model, input_image, onnx_model)

PyTorch 实战：加载模型权重与 ONNX 推理部署

加载和运行模型预测

加载模型

模型推理与 ONNX 导出

PyTorch 实战：加载模型权重与 ONNX 推理部署

加载和运行模型预测

加载模型

模型推理与 ONNX 导出

更多推荐文章

相关免费在线工具

使用 ONNX Runtime 进行预测

完整代码参考

总结

更多推荐文章

相关免费在线工具

PyTorch 实战：加载模型权重与 ONNX 推理部署

加载和运行模型预测

加载模型

模型推理与 ONNX 导出

PyTorch 实战：加载模型权重与 ONNX 推理部署

加载和运行模型预测

加载模型

模型推理与 ONNX 导出

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

使用 ONNX Runtime 进行预测

完整代码参考

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具