Python 从零实现简单神经网络算法：原理与代码详解

Python 从零实现简单神经网络算法：原理与代码详解 | 极客日志

输入层 (2 个神经元) ↓ 隐藏层 (3 个神经元) ↓ 输出层 (1 个神经元)

import numpy as np

# 固定随机种子，保证每次运行结果一致
np.random.seed(42)

# ========== 1. 数据集定义 ==========
# XOR 问题的输入与输出
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([[0], [1], [1], [0]])
# 目标输出（异或结果）

# ========== 2. 定义激活函数 ==========
def sigmoid(x):
    """Sigmoid 激活函数：将值压缩到 (0,1)"""
    return 1 / (1 + np.exp(-x))

def sigmoid_derivative(x):
    """Sigmoid 导数，用于反向传播"""
    return x * (1 - x)

# ========== 3. 网络结构参数 ==========
input_size = 2 # 输入层节点数
hidden_size = 3 # 隐藏层节点数
output_size = 1 # 输出层节点数
lr = 0.1 # 学习率
epochs = 10000 # 训练迭代次数

# ========== 4. 权重和偏置初始化 ==========
W1 = np.random.uniform(-1, 1, (input_size, hidden_size))
b1 = np.zeros((1, hidden_size))
W2 = np.random.uniform(-1, 1, (hidden_size, output_size))
b2 = np.zeros((1, output_size))

# ========== 5. 开始训练 ==========
for epoch in range(epochs):
    # ---- 前向传播 ----
    hidden_input = np.dot(X, W1) + b1
    hidden_output = sigmoid(hidden_input)
    final_input = np.dot(hidden_output, W2) + b2
    final_output = sigmoid(final_input)

    # ---- 计算误差 ----
    error = y - final_output

    # ---- 反向传播 ----
    d_output = error * sigmoid_derivative(final_output)
    d_hidden = np.dot(d_output, W2.T) * sigmoid_derivative(hidden_output)

    # ---- 更新权重与偏置 ----
    W2 += np.dot(hidden_output.T, d_output) * lr
    b2 += np.sum(d_output, axis=0, keepdims=True) * lr
    W1 += np.dot(X.T, d_hidden) * lr
    b1 += np.sum(d_hidden, axis=0, keepdims=True) * lr

    # 每 1000 次打印一次误差
    if epoch % 1000 == 0:
        loss = np.mean(np.abs(error))
        print(f"Epoch {epoch}, Loss: {loss:.4f}")

# ========== 6. 输出结果 ==========
print("\n训练完成后的预测输出：")
print(final_output)

Epoch 0, Loss: 0.51
Epoch 1000, Loss: 0.24
Epoch 2000, Loss: 0.12
Epoch 3000, Loss: 0.07
...
Epoch 9000, Loss: 0.03
训练完成后的预测输出：
[[0.03]
 [0.97]
 [0.96]
 [0.04]]

输入	期望输出	实际输出（约）
[0, 0]	0	0.03
[0, 1]	1	0.97
[1, 0]	1	0.96
[1, 1]	0	0.04

import matplotlib.pyplot as plt

losses = []
for epoch in range(epochs):
    hidden_input = np.dot(X, W1) + b1
    hidden_output = sigmoid(hidden_input)
    final_input = np.dot(hidden_output, W2) + b2
    final_output = sigmoid(final_input)
    error = y - final_output
    losses.append(np.mean(np.abs(error)))
    
    d_output = error * sigmoid_derivative(final_output)
    d_hidden = np.dot(d_output, W2.T) * sigmoid_derivative(hidden_output)
    W2 += np.dot(hidden_output.T, d_output) * lr
    b2 += np.sum(d_output, axis=0, keepdims=True) * lr
    W1 += np.dot(X.T, d_hidden) * lr
    b1 += np.sum(d_hidden, axis=0, keepdims=True) * lr

plt.plot(losses)
plt.title("Loss 下降曲线")
plt.xlabel("Epochs")
plt.ylabel("Loss")
plt.show()

Python 从零实现简单神经网络算法：原理与代码详解

一、前言：为什么要自己实现神经网络？

二、神经网络的核心思想

1. 神经元模型的启发

2. 网络结构：三层神经网络

3. 前向传播 (Forward Propagation)

4. 误差计算（Loss Function）

5. 反向传播 (Backpropagation)

三、Python 实现代码（详细注释）

四、结果分析

五、可视化：误差下降曲线

六、深入理解反向传播的数学逻辑

七、总结与扩展方向

更多推荐文章

相关免费在线工具

Python 从零实现简单神经网络算法：原理与代码详解

一、前言：为什么要自己实现神经网络？

二、神经网络的核心思想

1. 神经元模型的启发

2. 网络结构：三层神经网络

3. 前向传播 (Forward Propagation)

4. 误差计算（Loss Function）

5. 反向传播 (Backpropagation)

三、Python 实现代码（详细注释）

四、结果分析

五、可视化：误差下降曲线

六、深入理解反向传播的数学逻辑

七、总结与扩展方向

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具