基于 FPGA 的 CLAHE 自适应限制对比度直方图均衡算法 Verilog 实现

基于 FPGA 的 CLAHE 自适应限制对比度直方图均衡算法 Verilog 实现 | 极客日志

模块名称	功能描述
`clahe_coord_counter`	坐标计数与 Tile 定位
`clahe_histogram_stat`	直方图实时统计
`clahe_clipper_cdf`	对比度限制与 CDF 计算
`clahe_mapping_parallel`	双线性插值映射输出
`clahe_ram_16tiles_parallel`	32 块 RAM 乒乓管理

// 乒乓切换：在 CDF 完成时切换
always @(posedge pclk or negedge rst_n) begin
    if (!rst_n) begin
        ping_pong_flag <= 1'b0;
    end else if (cdf_done_posedge) begin
        // 优化：在 CDF 完成时立即切换 ping_pong
        // 此时 CDF LUT 已经完全写入 RAM，可以安全切换
        ping_pong_flag <= !ping_pong_flag;
    end
end

// 横向 tile 索引计算（x_cnt 除以 320）
// 通过比较 x_cnt 的范围来确定 tile_x 的值
always @(*) begin
    if (x_cnt < 320) // 0-319 像素 -> tile 0
        tile_x = 2'd0;
    else if (x_cnt < 640) // 320-639 像素 -> tile 1
        tile_x = 2'd1;
    else if (x_cnt < 960) // 640-959 像素 -> tile 2
        tile_x = 2'd2;
    else // 960-1279 像素 -> tile 3
        tile_x = 2'd3;
end
// tile 总索引：使用位拼接 {tile_y, tile_x} 等价于 tile_y*4 + tile_x
tile_idx = {tile_y, tile_x}; // 4 位 tile 索引，范围 0-15

// 横向偏移量计算：tile_x * 320 = tile_x * (256 + 64)
// = (tile_x << 8) + (tile_x << 6)
wire [10:0] tile_x_offset;
assign tile_x_offset = ({tile_x, 8'd0}) + ({tile_x, 6'd0});
// 纵向偏移量计算：tile_y * 180 = tile_y * (128 + 32 + 16 + 4)
// = (tile_y << 7) + (tile_y << 5) + (tile_y << 4) + (tile_y << 2)
wire [9:0] tile_y_offset;
assign tile_y_offset = ({tile_y, 7'd0}) + ({tile_y, 5'd0}) + ({tile_y, 4'd0}) + ({tile_y, 2'd0});
// 相对坐标 = 全局坐标 - 偏移量
assign local_x = x_cnt[8:0] - tile_x_offset[8:0];
assign local_y = y_cnt[7:0] - tile_y_offset[7:0];

// Stage 1: 相邻相同检测
always @(posedge pclk or negedge rst_n) begin
    if (!rst_n) begin
        same_as_prev <= 1'b0;
    end else begin
        // 检测相邻相同：当前输入与上一周期输入比较
        if ((in_href && in_vsync && clear_done) && valid_s1 && (in_y == pixel_s1) && (tile_idx == tile_s1)) begin
            same_as_prev <= 1'b1;
        end else begin
            same_as_prev <= 1'b0;
        end
    end
end
// Stage 2: 设置增量：相邻相同 +2，否则 +1
if (same_as_prev) begin
    increment_s2 <= 2'd2;
end else begin
    increment_s2 <= 2'd1;
end

// 冲突检测：Stage1 读地址 == Stage3 写地址
wire conflict = (pixel_s1 == pixel_s3) && (tile_s1 == tile_s3) && valid_s3;
always @(posedge pclk or negedge rst_n) begin
    if (!rst_n) begin
        bypass_valid <= 1'b0;
        bypass_data <= 16'd0;
    end else begin
        if (conflict) begin
            bypass_valid <= 1'b1;
            bypass_data <= ram_wr_data_s3; // 保存写入的数据
        end else begin
            bypass_valid <= 1'b0;
        end
    end
end
// 数据选择：旁路优先
wire [15:0] selected_data = bypass_valid ? bypass_data : ram_rd_data_b;

状态	周期数	说明
READ_HIST_CLIP	257	读取直方图 + 裁剪
CLIP_REDIST	257	仅在有溢出时执行，重分配溢出值
CALC_CDF	257	累积分布函数计算
WRITE_LUT	259	3 级流水线归一化写入
NEXT_TILE	1	Tile 切换
DONE	1	产生 cdf_done 脉冲

帧状态	RAM_A 组用途	RAM_B 组用途
帧 N (ping_pong_flag=0)	统计（Port A 写，Port B 读）	映射（Port B 四块并行只读）
帧 N+1 (ping_pong_flag=1)	映射（Port B 四块并行只读）	统计（Port A 写，Port B 读）

优化技术	应用目标
割集流水线 (Cut-Set Pipelining)	切断 CDF 计算中的长组合逻辑路径
重定时 (Retiming)	解决深度流水线引入的控制与数据路径对齐问题
算法强度缩减 (Strength Reduction)	优化插值运算，减少乘法器使用
硬件折叠 (Folding)	巧妙设计地址映射实现 ram 复用

资源类型	Baseline (64t)	Optimized (64t)	变化幅度
LUTs (逻辑单元)	8,014	3,738	↓ 53.4%
Registers (寄存器)	637	3,281	↑ 415%
Block RAM (Tiles)	66	18	↓ 72.7%
F7/F8 Muxes	1,024	52	↓ 95.0%

指标	Baseline @ 74MHz	Optimized @ 100MHz
WNS (最差负裕量)	-22.347 ns (Failed)	+4.704 ns (Met)
理论最高频率 (Fmax)	~28 MHz	~188 MHz
关键路径延迟	35.5 ns	5.30 ns
逻辑级数	185 级	6 级

基于 FPGA 的 CLAHE 自适应限制对比度直方图均衡算法 Verilog 实现

基于 FPGA 的 CLAHE 自适应限制对比度直方图均衡算法硬件 Verilog 实现

一、CLAHE 算法基本原理

1.1 算法背景

1.2 核心处理步骤

1.2.1 图像分块 (Tiling)

1.2.2 直方图计算 (Histogram Calculation)

1.2.3 对比度限制 (Contrast Limiting / Clipping)

1.2.4 溢出重分配 (Redistribution)

1.2.5 生成映射函数 (Mapping Function)

1.2.6 双线性插值 (Bilinear Interpolation)

更多推荐文章

相关免费在线工具

二、硬件架构设计

2.1 顶层模块架构

2.2 坐标计数器模块 (clahe_coord_counter)

2.3 直方图统计模块 (clahe_histogram_stat)

2.3.1 读写冲突问题分析

2.3.2 冲突解决方案

2.4 对比度限制与 CDF 计算模块 (clahe_clipper_cdf)

2.5 RAM 管理模块 (clahe_ram_16tiles_parallel)

三、仿真验证

四、优化方向展望

五、总结

更多推荐文章

相关免费在线工具

基于 FPGA 的 CLAHE 自适应限制对比度直方图均衡算法 Verilog 实现

基于 FPGA 的 CLAHE 自适应限制对比度直方图均衡算法硬件 Verilog 实现

一、CLAHE 算法基本原理

1.1 算法背景

1.2 核心处理步骤

1.2.1 图像分块 (Tiling)

1.2.2 直方图计算 (Histogram Calculation)

1.2.3 对比度限制 (Contrast Limiting / Clipping)

1.2.4 溢出重分配 (Redistribution)

1.2.5 生成映射函数 (Mapping Function)

1.2.6 双线性插值 (Bilinear Interpolation)

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

二、硬件架构设计

2.1 顶层模块架构

2.2 坐标计数器模块 (clahe_coord_counter)

2.3 直方图统计模块 (clahe_histogram_stat)

2.3.1 读写冲突问题分析

2.3.2 冲突解决方案

2.4 对比度限制与 CDF 计算模块 (clahe_clipper_cdf)

2.5 RAM 管理模块 (clahe_ram_16tiles_parallel)

三、仿真验证

四、优化方向展望

五、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具