FPGA 内部资源详解：LUT、FF、BRAM、DSP、PLL 及综合报告解读

FPGA 内部资源详解：LUT、FF、BRAM、DSP、PLL 及综合报告解读 | 极客日志

资源类型	数量（xc7a100t）	用途
LUT（6-input）	63 400	实现任意组合逻辑函数
FF（触发器）	126 800	存储 1 bit 状态，构成寄存器
BRAM（36Kb）	135 块	片内大容量存储器
DSP48E1	240 个	乘法、乘加、MAC 运算
MMCM/PLL	6 个	时钟倍频/分频/相位调整

// 以下所有函数综合后各只需 1 个 LUT
assign y = a & b; // 2 输入与门
assign y = a | b | c | d; // 4 输入或门
assign y = (a & b) | (c & d) | (e ^ f); // 6 变量函数
assign y = (a == 4'b1010) ? 1 : 0; // 4 位等值比较

// 8 输入与门：需要 2 个 LUT（先 4 输入与，再 2 输入与）
assign y = a & b & c & d & e & f & g & h;

信号类型	推断的资源
`assign y = a & b;`（组合逻辑）	LUT
`always @(posedge clk) reg <= data;`（时序逻辑）	FF
`always @(posedge clk) reg <= a & b;`（时序逻辑的输入是组合逻辑）	LUT + FF

// 综合为 1 个 FF
always @(posedge clk or negedge rst_n)
begin
    if (!rst_n) q <= 1'b0;
    else q <= d;
end

reg [7:0] data_reg; // 综合为 8 个 FF

always @(posedge clk)
begin
    if (en) q <= d; // 综合后：d→D，en→CE，而不是 MUX
end

写法	复位类型	FPGA 实现
`always @(posedge clk)` 内的 `if(!rst_n)`	同步复位	额外的 LUT 实现选择器
`always @(posedge clk or negedge rst_n)` 的 `if(!rst_n)`	异步复位	直接使用 FF 的 R 端口，不消耗 LUT

需求	建议
几十 bit 的状态寄存器	用 FF/寄存器
几百字节的查找表	用 BRAM 或分布式 RAM
几 KB 以上的缓冲区、ROM	必须用 BRAM

模式	说明
真双端口（TDP）	端口 A、端口 B 可独立读写，支持不同时钟
简单双端口（SDP）	一个端口写，一个端口读，最大数据宽度可达 72 bit
单端口（SP）	只用一个端口读写
ROM 模式	固化初始值，只读

// 推断单端口同步 RAM（综合为 BRAM）
module single_port_ram #(
    parameter DATA_WIDTH = 8,
    parameter ADDR_WIDTH = 8 // 深度 = 2^8 = 256
)(
    input wire clk,
    input wire we, // 写使能
    input wire [ADDR_WIDTH-1:0] addr,
    input wire [DATA_WIDTH-1:0] din,
    output reg [DATA_WIDTH-1:0] dout
);
    // 存储阵列
    reg [DATA_WIDTH-1:0] mem [0:(1<<ADDR_WIDTH)-1];
    always @(posedge clk)
    begin
        if (we) mem[addr] <= din;
        dout <= mem[addr]; // 同步读（关键！异步读不会推断 BRAM）
    end
endmodule

// 正弦波查找表 ROM（64 点，8bit）
reg [7:0] sin_rom [0:63];
initial begin
    sin_rom[0] = 8'd128;
    sin_rom[1] = 8'd140; // ...（通常通过 $readmemh 从文件加载）
    $readmemh("sin_table.hex", sin_rom);
end

P = A × B + C

// 以下代码会被综合工具自动推断为 DSP
wire signed [15:0] a, b;
wire signed [31:0] p;
assign p = a * b; // → 推断为 1 个 DSP48

// 乘累加：acc = acc + a * b
reg signed [47:0] acc;
wire signed [15:0] a, b;
always @(posedge clk or negedge rst_n)
begin
    if (!rst_n) acc <= 48'd0;
    else if (en) acc <= acc + (a * b); // 综合为 DSP 的 P = A×B + C 模式
end

(* use_dsp = "yes" *)
wire signed [31:0] p;
assign p = a * b;

PLL 功能	示例
倍频	100 MHz → 200 MHz
分频	100 MHz → 25 MHz
相位偏移	产生 90° 相移时钟
抖动过滤	清洁外部输入时钟的抖动

// PLL 例化示意（由 Clocking Wizard 自动生成）
clk_wiz_0 u_clk_wiz (
    .clk_in1 (sys_clk), // 输入：100MHz
    .clk_out1 (clk_200m), // 输出 1：200MHz
    .clk_out2 (clk_50m), // 输出 2：50MHz
    .clk_out3 (clk_25m), // 输出 3：25MHz
    .locked (pll_locked), // PLL 锁定标志
    .reset (~rst_n)
);

assign sys_rst_n = rst_n & pll_locked; // 只有 PLL 锁定后才释放复位

+----------------------------+-------+-------+------------+-----------+-------+
| Site Type                  | Used  | Fixed | Prohibited | Available | Util% |
+----------------------------+-------+-------+------------+-----------+-------+
| Slice LUTs                 | 312   | 0     | 0          | 63400     | 0.49  |
| LUT as Logic               | 298   | 0     | 0          | 63400     | 0.47  |
| LUT as Memory              | 14    | 0     | 0          | 19000     | 0.07  |
| Slice Registers            | 256   | 0     | 0          | 126800    | 0.20  |
| Register as Flip Flop      | 256   | 0     | 0          | 126800    | 0.20  |
| Block RAM Tile             | 2     | 0     | 0          | 135       | 1.48  |
| RAMB36/FIFO                | 2     | 0     | 0          | 135       | 1.48  |
| DSPs                       | 4     | 0     | 0          | 240       | 1.67  |
+----------------------------+-------+-------+------------+-----------+-------+

字段	含义
`Used`	当前设计使用的数量
`Available`	芯片上该资源的总数量
`Util%`	使用率（Used/Available×100%）
`LUT as Logic`	用于实现逻辑的 LUT
`LUT as Memory`	用于实现分布式 RAM（小存储）的 LUT

使用率	状态	说明
< 70%	正常	布局布线有充足余量
70%~85%	注意	布局可能变紧张，时序变差
> 85%	危险	时序难收敛，可能报实现失败
> 95%	不可用	基本无法布通

// ============================================================
// 文件名 : resource_demo.v
// 描述 : 演示 LUT/FF/BRAM/DSP 的 Verilog 推断方式
// ============================================================

// ---------- 示例 1：推断单端口同步 BRAM ----------
module sp_bram #(
    parameter DATA_W = 8,
    parameter ADDR_W = 8
)(
    input wire clk,
    input wire we,
    input wire [ADDR_W-1:0] addr,
    input wire [DATA_W-1:0] din,
    output reg [DATA_W-1:0] dout
);
    reg [DATA_W-1:0] mem [0:(1<<ADDR_W)-1];
    always @(posedge clk)
    begin
        if (we) mem[addr] <= din;
        dout <= mem[addr]; // 同步读 → 推断 BRAM
    end
endmodule

// ---------- 示例 2：推断 DSP 乘累加 ----------
module mac_unit (
    input wire clk,
    input wire rst_n,
    input wire en,
    input wire signed [15:0] a,
    input wire signed [15:0] b,
    output reg signed [47:0] acc
);
    always @(posedge clk or negedge rst_n)
    begin
        if (!rst_n) acc <= 48'd0;
        else if (en) acc <= acc + ({{16{a[15]}}, a} * {{30{b[15]}}, b}); // 乘法部分推断为 DSP48
    end
endmodule

// ---------- 示例 3：利用 FF CE 端的计数器 ----------
module cnt_with_en (
    input wire clk,
    input wire rst_n,
    input wire en, // 使能，映射到 FF 的 CE 端口
    output reg [7:0] cnt
);
    always @(posedge clk or negedge rst_n)
    begin
        if (!rst_n) cnt <= 8'd0;
        else if (en) cnt <= cnt + 1'b1; // en 会被综合工具优化为 FF 的 CE，节省 LUT
    end
endmodule

FPGA 内部资源详解：LUT、FF、BRAM、DSP、PLL 及综合报告解读

FPGA 内部资源详解：LUT、FF、BRAM、DSP、PLL 是什么？综合报告怎么看

1. 为什么要了解内部资源

1.1 Artix-7 资源概览

2. LUT 查找表

2.1 LUT 是什么

2.2 LUT 实现任意 6 输入函数

2.3 LUT 的双输出模式（O5/O6）

2.4 LUT vs FF：什么决定用哪个

3. 触发器 FF 与寄存器

3.1 FF 的物理结构

3.2 寄存器 = N 个 FF 的集合

3.3 FF 的时钟使能（CE）

3.4 FF 的复位类型对综合的影响

4. Block RAM

4.1 什么时候用 BRAM

4.2 BRAM 结构

4.3 Verilog 推断 BRAM

4.4 ROM 初始化

5. DSP48 乘加单元

5.1 为什么乘法要用 DSP

5.2 自动推断 DSP

5.3 MAC 累加器（乘累加）

5.4 强制推断 DSP 的属性

6. PLL 锁相环

6.1 PLL 的用途

6.2 Vivado 中使用 PLL IP 核

7. 综合报告解读

7.1 打开 Utilization Report

7.2 报告示例解读

7.3 资源使用率警戒线

附：本篇完整源码

resource_demo.v

更多推荐文章

相关免费在线工具

FPGA 内部资源详解：LUT、FF、BRAM、DSP、PLL 及综合报告解读

FPGA 内部资源详解：LUT、FF、BRAM、DSP、PLL 是什么？综合报告怎么看

1. 为什么要了解内部资源

1.1 Artix-7 资源概览

2. LUT 查找表

2.1 LUT 是什么

2.2 LUT 实现任意 6 输入函数

2.3 LUT 的双输出模式（O5/O6）

2.4 LUT vs FF：什么决定用哪个

3. 触发器 FF 与寄存器

3.1 FF 的物理结构

3.2 寄存器 = N 个 FF 的集合

3.3 FF 的时钟使能（CE）

3.4 FF 的复位类型对综合的影响

4. Block RAM

4.1 什么时候用 BRAM

4.2 BRAM 结构

4.3 Verilog 推断 BRAM

4.4 ROM 初始化

5. DSP48 乘加单元

5.1 为什么乘法要用 DSP

5.2 自动推断 DSP

5.3 MAC 累加器（乘累加）

5.4 强制推断 DSP 的属性

6. PLL 锁相环

6.1 PLL 的用途

6.2 Vivado 中使用 PLL IP 核

7. 综合报告解读

7.1 打开 Utilization Report

7.2 报告示例解读

7.3 资源使用率警戒线

附：本篇完整源码

resource_demo.v

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具