FPGA 千兆以太网设计：PHY、MAC 与 Wishbone 总线实现

1. FPGA 千兆以太网设计概述

随着高速通信需求的不断增长，基于 FPGA 实现千兆以太网接口已成为嵌入式系统、工业控制和视频传输等领域的重要技术手段。本章从系统架构出发，阐述 FPGA 在千兆以太网设计中的核心优势——强大的并行处理能力、灵活的可重构性以及极低的数据处理延迟。重点介绍关键功能模块的划分与协作机制，包括 PHY 层接口、MAC 控制器、Wishbone 总线桥接及数据包处理引擎，并结合 IEEE 802.3 标准解析千兆以太网帧结构与物理层规范。同时，明确顶层模块 eth_top 的数据流向与控制逻辑，建立清晰的工程框架，为后续各模块的独立建模与系统集成提供理论支撑。

2. 以太网物理层（PHY）模块实现

在现代高速数字通信系统中，FPGA 作为可编程逻辑平台被广泛用于构建定制化的千兆以太网接口。其中，物理层（Physical Layer, PHY）是整个网络链路的基础组成部分，负责将 MAC 层的数据帧转换为能够在双绞线或光纤上传输的模拟信号，并完成接收端的信号恢复与解码。这里深入剖析基于 Verilog HDL 实现的 eth_phy.v 模块设计原理与工程实践，重点围绕 GMII/RGMII 接口标准、数据通路结构、时钟同步机制以及自协商流程展开讨论。

2.1 物理层基本原理与接口协议

以太网物理层位于 OSI 七层模型的最底层，承担着比特流的传输与接收任务。对于千兆以太网（1000BASE-T），其工作频率高达 125 MHz，在铜缆上传输速率可达 1 Gbps。该速率下，数据完整性与时序精度成为系统稳定运行的核心挑战。因此，理解 PHY 的工作模式、接口电气特性及其与 FPGA 之间的交互方式，是构建可靠通信链路的前提条件。

2.1.1 千兆以太网 PHY 工作模式与时序要求

千兆以太网 PHY 芯片通常支持多种操作模式，包括全双工/半双工、自动协商（Auto-Negotiation）、节能模式等。其中，自动协商是最关键的功能之一，它允许连接两端设备动态协商最佳传输参数。这一过程遵循 IEEE 802.3 Clause 28 规范，通过快速链路脉冲（FLP）burst 进行信息交换。

在实际应用中，FPGA 需配置 PHY 芯片进入所需的固定模式或启用自协商功能。例如，使用外部 EEPROM 写入配置寄存器值，或通过 MDIO/MDC 接口动态读写 PHY 内部寄存器。以下是一个典型的 PHY 初始化状态机片段：

// 示例：PHY 初始化状态机片段
always @(posedge clk_25m or posedge rst_n) begin
    if (!rst_n) state <= IDLE;
    else case (state)
        IDLE: if (init_start) state <= WRITE_CTRL_REG;
        WRITE_CTRL_REG: if (mdio_done) state <= READ_STATUS_REG;
        READ_STATUS_REG: if (link_up && speed_1000m && full_duplex) state <= LINK_READY;
        else state <= POLLING_STATUS;
        default: state <= IDLE;
    endcase
end

这段代码定义了一个同步复位下的状态机。上电后处于空闲态，启动对控制寄存器的写入操作。一旦 MDIO 写操作完成，便跳转至读取状态寄存器。若检测到链接建立、速率为 1000M 且为全双工模式，则认为链路已就绪；否则进入轮询状态持续监测。

寄存器地址	名称	功能描述
0x00	控制寄存器	设置复位、环回、速度选择、自协商使能
0x01	状态寄存器	反映链路状态、自协商完成标志
0x04	自协商广告寄存器	告知对端自身支持的能力集
0x09	扩展状态寄存器	指示是否为 1000M 连接

此外，千兆以太网对时序有严格要求。TX 路径要求 FPGA 在 TX_CLK 上升沿准备数据并保持至少 1 ns 建立时间；RX 路径则依赖于 RX_CLK 对输入数据进行采样。为此，设计中常引入延迟锁定环（DLL）或可编程延时单元（IDELAY）来校准输入信号相位。

// 使用 Xilinx IDELAY 进行输入数据对齐
IBUFDS #( .DIFF_TERM("FALSE"), .IOSTANDARD("LVDS_25") ) u_ibuf_d (
    .I(gt_rxp), .IB(gt_rxn), .O(rx_p_unbuf)
);
BUFG u_bufg_rxclk (.I(rx_clk_in), .O(rx_clk));
IDELAYCTRL u_idelayctrl_refclk (.REFCLK(clk_200m), .RST(rst_n), .RDY(idel_ready));
generate for (i = 0; i < 8; i = i + 1) begin : gen_idelay
    IDELAYE2_FINEDELAY #(
        .CINVCTRL_SEL("FALSE"), .DELAY_SRC("IDATAIN"), .HIGH_PERFORMANCE_MODE("TRUE"),
        .REFCLK_FREQUENCY(200.0), .DELAY_VALUE(750)
    ) idelay_inst (
        .DATAOUT(data_rxdly[i]), .DATAIN(rxd_i[i]), .C(clk_200m),
        .CE(1'b0), .INC(1'b0), .LD(1'b0), .LDPIPEEN(1'b0),
        .DELAYCTRLIN(idel_ctrl), .CNTVALUEIN(6'd0), .CNTVALUEOUT()
    );
end endgenerate

参数	GMII	RGMII v2.0
数据速率	125 Mbps per bit	125 MHz DDR → 250 Mbps
总带宽	1 Gbps	1 Gbps
引脚数（单向）	9（data+ctrl）	5（4 data + 1 ctrl）
时钟相位要求	对齐	TX: 90°滞后，RX: 0°对齐
PCB 布线难度	中等	高（需严格控制长度匹配）

项目	推荐做法
差分对阻抗	100Ω ±10%，使用 SI9000 计算叠层参数
长度匹配	RGMII 组内 skew < 50 ps（≈1.5 cm）
邻近层参考平面	确保完整地平面，避免分割
FPGA Bank 电压	匹配电平标准（如 1.8V 或 2.5V）
端接电阻	片外并联终端（如有必要）

字段名称	长度（字节）	描述
前导码（Preamble）	7	交替的'1'和'0'序列，用于接收方时钟同步
帧起始定界符（SFD）	1	固定值 `1010_1011`，标志帧正式开始
目的 MAC 地址	6	接收节点的硬件地址
源 MAC 地址	6	发送节点的硬件地址
类型/长度（Type/Length）	2	若 ≤ 1500 表示长度；≥ 1536 表示上层协议类型
数据域（Payload）	46–1500	上层协议数据，不足 46 字节需填充
填充域（Pad）	可变	确保最小帧长为 64 字节
帧校验序列（FCS/CRC32）	4	校验字段

地址偏移	名称	R/W	功能描述
0x00	CONTROL	R/W	启用 TX/RX、设置全双工、软复位
0x04	STATUS	R	链路状态、FIFO 状态、中断标志
0x08	MAC_ADDR_LOW	R/W	MAC 地址低 32 位
0x0C	MAC_ADDR_HIGH	R/W	MAC 地址高 16 位
0x10	TX_STATUS	R	发送完成、碰撞次数
0x14	RX_STATUS	R	接收完成、CRC 错误计数
0x18	INT_ENABLE	R/W	中断使能掩码
0x1C	INT_PENDING	R/W	中断挂起标志（写 1 清零）

参数	推荐值	说明
Tx FIFO 深度	512	足够容纳 1~2 个完整帧
Rx FIFO 深度	1024	应对突发流量缓冲
写时钟域	WB_CLK (100MHz)	来自系统总线
读时钟域	TX_CLK/RX_CLK (125MHz)	来自 PHY 恢复时钟
复位策略	异步复位同步释放	防止亚稳态

信号名	方向	描述
`wb_clk_i`	输入	主时钟，所有操作同步于此时钟上升沿
`wb_rst_i`	输入	复位信号，低电平有效
`wb_adr_i[N:0]`	输入	地址总线，指定访问的从设备内部地址
`wb_dat_i[31:0]`	输入	数据输入总线，来自主设备的数据
`wb_dat_o[31:0]`	输出	数据输出总线，送往主设备的数据
`wb_we_i`	输入	写使能，高电平表示写操作
`wb_cyc_i`	输入	周期有效，表示一次总线事务开始
`wb_stb_i`	输入	选通使能，表示当前地址/数据有效
`wb_ack_o`	输出	应答信号，表示从设备已完成操作
`wb_sel_i[3:0]`	输入	字节使能，指示哪些字节参与传输

字段	值（十六进制）	长度（字节）	说明
前导码	55 55 55 55 55 55 55 D5	8	包含 SFD
目的 MAC	FF FF FF FF FF FF	6	广播地址
源 MAC	00 A0 C9 1A 6B B2	6	本地 MAC
类型/长度	08 06	2	ARP 协议
操作码	00 01	2	请求
发送方 IP	C0 A8 01 64	4	192.168.1.100
目标 IP	C0 A8 01 01	4	192.168.1.1

项目	Xilinx Kintex-7	Intel Cyclone IV
工具链	Vivado 2022.x	Quartus Prime 21.1
IO 标准	LVCMOS25	2.5V
GTX/GTP	使用 GTP_CH lane	外接千兆 PHY 芯片
PLL 配置	MMCM @ 125MHz	ALTPLL 相同
约束文件	.xdc	.sdc
引脚分配	XDC 中 set_property	Pin Planner GUI
在线调试	ILA 核插入	SignalTap II

FPGA 千兆以太网设计：PHY、MAC 与 Wishbone 总线实现

1. FPGA 千兆以太网设计概述

2. 以太网物理层（PHY）模块实现

2.1 物理层基本原理与接口协议

2.1.1 千兆以太网 PHY 工作模式与时序要求

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.1.2 GMII/RGMII 接口标准解析与电气特性

2.2 eth_phy.v 模块的设计与实现

2.2.1 发送路径的数据对齐与串并转换逻辑

2.2.2 接收路径的时钟恢复与数据采样机制

2.2.3 自协商过程的状态机设计与链路建立流程

2.3 实践中的关键问题与解决方案

2.3.1 时钟域交叉处理：TX_CLK 与 RX_CLK 异步同步策略

2.3.2 信号完整性优化：PCB 布线与 FPGA 引脚分配建议

2.3.3 调试技巧：使用 ILA 核监测 PHY 输入输出波形

3. 以太网控制器设计与 MAC 协议处理

3.1 MAC 子层理论基础与帧结构解析

3.1.1 以太网帧格式详解

3.1.2 MAC 协议中的 CSMA/CD 机制与冲突检测规避

3.2 核心控制器模块设计

3.2.1 eth_top.v 的整体状态机架构与数据通路规划

3.2.2 寄存器映射设计：eth_registers.v 中控制/状态寄存器配置

3.2.3 发送与接收引擎的双缓冲机制实现

3.3 数据流管理与中断响应机制

3.3.1 FIFO 队列设计：发送与接收缓存的深度与阈值设置

3.3.2 中断请求生成逻辑：帧完成、错误异常等事件触发

3.3.3 实践案例：通过寄存器读写实现 MAC 地址配置与使能控制

4. Wishbone 总线接口集成与系统互联

4.1 Wishbone 总线协议理论基础

4.2 eth_wishbone.v 模块的桥接设计

4.2.1 地址译码逻辑与寄存器选择机制

4.2.2 数据宽度适配：32 位 CPU 接口与内部 8 位寄存器对接

4.2.3 总线仲裁与突发传输支持设计

4.3 系统级集成实践

4.3.1 连接 MicroBlaze 软核处理器的实际应用方案

4.3.2 使用 wb_master_behavioral.v 进行主控行为建模测试

4.3.3 wb_bus_mon.v 监控模块的插入与总线事务抓包分析

5. 千兆网测试平台搭建与仿真验证

5.1 功能仿真环境构建

5.1.1 Testbench 框架设计

5.1.2 激励生成：模拟真实网络流量的数据包注入方法

5.2 关键功能模块的验证实践

5.2.1 CRC 校验模块独立测试

5.2.2 流量控制机制验证

5.2.3 时钟同步测试

5.3 系统级联仿真与硬件协同验证

5.3.1 协处理器交互场景模拟

5.3.2 利用 ModelSim 进行波形调试

5.3.3 上板前的综合后仿真与时序收敛评估

5.4 应用延伸与移植指导

5.4.1 视频传输场景下的带宽利用率优化策略

5.4.2 源代码向 Xilinx Kintex-7 与 Intel Cyclone IV 平台的适配步骤

5.4.3 引脚约束、时钟资源配置与 Power-on 初始化流程注意事项

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具