基于Vivado的RISC-V五级流水线CPU FPGA实现详解

基于Vivado的RISC-V五级流水线CPU FPGA实现详解 | 极客日志

阶段	干什么	关键任务
IF（取指）	取指令	给 PC 找地址，从 IMEM 拿指令
ID（译码）	拆指令	解析 opcode，读寄存器，生成控制信号
EX（执行）	算东西	ALU 运算，地址计算，判断分支
MEM（访存）	访问内存	Load/Store 数据，其他指令透传
WB（写回）	写结果	把数据写回寄存器

xpm_memory_sdpram #( .ADDR_WIDTH_A(10), // 1KB = 256 words .DATA_WIDTH_A(32) ) imem_inst ( .clka(clk), .addra(pc[3:2]), // 字对齐 .douta(inst_out) );

module regfile ( input clk, input we, // 写使能 input [4:0] waddr, // 写地址 input [31:0] wdata, // 写数据 input [4:0] raddr1, input [4:0] raddr2, output [31:0] rdata1, output [31:0] rdata2 ); reg [31:0] regs [0:31]; // 同步写：只在上升沿更新 always @(posedge clk) begin if (we && waddr != 5'd0) // x0 永远为 0！ regs[waddr] <= wdata; end // 异步读：组合逻辑输出 assign rdata1 = (raddr1 == 5'd0) ? 32'd0 : regs[raddr1]; assign rdata2 = (raddr2 == 5'd0) ? 32'd0 : regs[raddr2]; endmodule

信号	作用
`reg_write`	是否允许写寄存器
`alu_op`	ALU 操作类型
`mem_read/write`	是否访问内存
`mem_to_reg`	写回数据来自内存还是 ALU
`branch`	是否为分支指令

// 先决定第二操作数来源 assign op_b = src_sel ? imm_val : rs2_data; // 再送入 ALU always @(*) begin case (alu_ctrl) OP_ADD: result = op_a + op_b; OP_SUB: result = op_a - op_b; OP_AND: result = op_a & op_b; OP_OR : result = op_a | op_b; OP_XOR: result = op_a ^ op_b; OP_SLT: result = ($signed(op_a) < $signed(op_b)) ? 32'd1 : 32'd0; OP_SLL: result = op_a << op_b[4:0]; OP_SRL: result = op_a >> op_b[4:0]; OP_SRA: result = $signed(op_a) >>> op_b[4:0]; default: result = 32'd0; endcase end

xpm_memory_tdpram #( .ADDR_WIDTH_A(12), // 4KB .DATA_WIDTH_A(32) ) dmem_inst ( .clka(clk), .ena(mem_en_a), .wea(byte_enable), // 字节使能！ .addra(addr_a[3:2]), .dina(data_a), .douta(dout_a) );

操作	byte_enable
SB	4'b0001 (假设 little-endian)
SH	4'b0011
SW	4'b1111

assign wb_data = mem_to_reg ? mem_data : alu_result;

add x5, x6, x7
sub x8, x5, x9 # 依赖 x5，但还没写回

if (id_ex_mem_read && (id_ex_rd != 0) && (id_ex_rd == if_id_rs1 || id_ex_rd == if_id_rs2)) begin stall = 1; end

// Forwarding Unit 示例 function [1:0] forward_A; input [4:0] rs1; input [4:0] ex_mem_rd, mem_wb_rd; input ex_mem_reg_write, mem_wb_reg_write; begin if (ex_mem_reg_write && ex_mem_rd != 0 && ex_mem_rd == rs1) forward_A = 2'b01; // 来自 EX/MEM else if (mem_wb_reg_write && mem_wb_rd != 0 && mem_wb_rd == rs1) forward_A = 2'b10; // 来自 MEM/WB else forward_A = 2'b00; // 正常路径 end endfunction

src_a = (forward_A == 2'b01) ? ex_mem_alu_out : (forward_A == 2'b10) ? mem_wb_data : id_ex_rs1_data;

project/
├── src/
│   ├── cpu_top.v
│   ├── if_stage.v
│   ├── id_stage.v
│   ├── ex_stage.v
│   ├── mem_stage.v
│   ├── wb_stage.v
│   ├── regfile.v
│   └── imem_dmem.xpm
├── testbench/
│   └── tb_cpu.v
├── firmware/
│   ├── hello.S
│   └── Makefile
└── constraints/
    └── board.xdc

.global _start
_start:
    addi x5, x0, 100
    addi x6, x0, 200
    add x7, x5, x6 # 结果应为 300
loop:
    j loop

riscv64-unknown-elf-gcc -march=rv32i -mabi=ilp32 -nostdlib -T linker.ld -o main.elf main.S
riscv64-unknown-elf-objcopy -O binary main.elf main.bin

tcl create_debug_core u_ila_0 ila
set_property PROBE_TYPE DATA_AND_TRIGGER [get_debug_cores u_ila_0]
connect_debug_port u_ila_0/clk [get_nets clk]

create_clock -period 10.000 [get_ports clk]
set_input_delay 2.0 [all_inputs] -clock clk
set_output_delay 2.0 [all_outputs] -clock clk
set_false_path -from [get_pins id_ex_reg*/D] -to [get_pins ex_mem_reg*/Q]

现象	可能原因	解决方法
CPU 卡在第一条指令不动	PC 没递增，或 IMEM 未加载	检查 reset 释放逻辑，查看 ILA 中 inst 是否有效
加法结果不对	x0 寄存器没强制为 0	修改 regfile，读取 x0 时直接返回 0
分支永远不跳	branch 控制信号没拉高	检查 EX 阶段比较逻辑和控制传递
时序报错 Failed	关键路径太长	在 ALU 后加一级 pipeline register
Load 数据错位	字节使能或地址对齐有问题	打印 address 和 be，确认是否符合小端规则

基于Vivado的RISC-V五级流水线CPU FPGA实现详解

项目概述

设计选型依据

为什么选 RISC-V + 五级流水？

五级流水线架构

核心模块拆解

第一关：取指单元（IF）

第二关：译码单元（ID）

寄存器文件实现要点

控制信号生成

第三关：执行单元（EX）

ALU 设计技巧

分支判断提前到 ID？没必要！

第四关：访存单元（MEM）

DMEM 实现方式

关键点：字节使能（Byte Enable）

第五关：写回单元（WB）

冒险处理

数据冒险：后面的指令等不到前面的结果

解法一：暂停（Stall）

解法二：数据旁路（Forwarding）——这才是重点！

控制冒险：分支跳错了怎么办？

Vivado 工程搭建全流程

1. 项目结构建议

2. 固件编译流程

3. 综合与实现注意事项

4. 约束文件示例（XDC）

常见问题排查清单

总结

更多推荐文章

相关免费在线工具

基于Vivado的RISC-V五级流水线CPU FPGA实现详解

项目概述

设计选型依据

为什么选 RISC-V + 五级流水？

五级流水线架构

核心模块拆解

第一关：取指单元（IF）

第二关：译码单元（ID）

寄存器文件实现要点

控制信号生成

第三关：执行单元（EX）

ALU 设计技巧

分支判断提前到 ID？没必要！

第四关：访存单元（MEM）

DMEM 实现方式

关键点：字节使能（Byte Enable）

第五关：写回单元（WB）

冒险处理

数据冒险：后面的指令等不到前面的结果

解法一：暂停（Stall）

解法二：数据旁路（Forwarding）——这才是重点！

控制冒险：分支跳错了怎么办？

Vivado 工程搭建全流程

1. 项目结构建议

2. 固件编译流程

3. 综合与实现注意事项

4. 约束文件示例（XDC）

常见问题排查清单

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具