PyTorch 生成式人工智能:神经网络与模型训练详解
0. 前言
人工神经网络(Artificial Neural Network, ANN)是一种监督学习算法,其设计灵感源自人类大脑的运作机制。就像人脑中的神经元通过连接和激活传递信号一样,神经网络接收输入数据,经过网络内部函数的处理,触发后续神经元的激活,最终产生输出结果。函数结构越复杂,网络对数据的拟合能力就越强,预测的准确性通常也越高。
ANN 拥有多种架构形式。根据通用逼近定理,理论上总能找到一个足够大且权重配置正确的神经网络架构,以准确预测任意给定输入的输出。这意味着面对特定数据集或任务时,我们可以构建相应的架构并持续调整其权重,直到 ANN 输出符合预期。这个不断调整网络权重的过程,就是训练神经网络。
计算机视觉领域的一项核心任务是识别图像中的对象类别,即图像分类。ImageNet 是该领域的权威竞赛,历年分类准确率的变化趋势如下:

从上图可以看出,随着神经网络的应用,模型错误率显著下降。随着时间的推移,网络结构逐渐加深、变复杂,分类错误率持续降低,甚至表现出超越人类的水平。
在本节中,我们将使用一个简单的数据集构建一个基础的神经网络架构,旨在理解 ANN 的各个组成部分——包括前向传播、反向传播、学习率等——对于模型权重调整的具体作用,从而掌握神经网络如何根据给定数据优化自身的过程。


