FPGA实现CIC抽取滤波器

FPGA实现CIC抽取滤波器

一、什么是CIC滤波器

(一)CIC滤波器原理和结构

CIC(级联积分梳状)滤波器,它是一种高效的多速率信号处理滤波器,是一种无乘法器的线性相位FIR滤波器。常用于数字下变频(DDC)和数字上变频(DUC)中。CIC滤波器的主要优点是不需要乘法器,结构简单,仅由加法器、减法器和寄存器组成。CIC滤波器是FIR滤波器的一种,可以只使用积分器和梳状器来实现,没有了FIR的乘法操作,实现非常的简单并且大大节约了资源。
CIC滤波器有三种工作模式:抽取滤波器(最常用)、插值滤波器和单纯滤波器。

  • 抽取滤波器: 数据流由高速输入变为低速输出,主要应用于数字下变频以及降低采样率的系统中。其结构如下图所示:
在这里插入图片描述
  • 单纯滤波器: 数据流速率不变,积分器和梳状器都工作在同一个采样率下,主要应用于移动平均滤波。

插值滤波器: 数据流由低速输入变为高速输出,主要应用于数字上变频以及提升采样率的系统中。其结构如下图所示:

在这里插入图片描述

前面提到CIC滤波器主要由积分器和梳状器组成,积分器状态方程如下:

在这里插入图片描述


梳状器状态方程如下:

在这里插入图片描述


其中N为抽取倍数(抽取因子),什么意思呢?举个例子输入信号采样率为100MHz,如果抽取因子为10,那么降采样之后的信号速率就是100MHz / 10 = 10MHz。也就是说F_out = F_in / 抽取因子。
由于单级CIC的第一旁瓣阻带衰减是固定的13.46dB,无法很好的抑制旁瓣,因此可以通过级联的方式来提升抑制效果,根据实际旁瓣抑制需求可以实现单级、二级、三级、四级、五级、六级等多级CIC。
可以把CIC滤波器想象成一个多层过滤系统:

  • 一级(N=1):像一层纱网,能过滤掉一些大颗粒杂质,但一些小颗粒和细微的杂质还能通过。
  • 二级(N=2):在纱网后面再加一层更密的滤布,过滤效果更好。
  • 五级(N=5):相当于经过了五层不同精度的过滤,最后得到的液体非常纯净。

级数N越高,滤波效果越好,但系统的“阻力”也会相应增加(对应到FPGA就是资源消耗和位宽增长)。在数字下变频等应用中,N=5 或 N=6 是非常常见的选择,它在性能和资源之间取得了很好的平衡。

假设数据以Fs(假设100MHz)的频率输入滤波器,那数据先通过3级的积分滤波器一直进行累加。假如我们希望得到Fs的10分频的采样数据,那就将积分滤波器的最后一级输出以Fs/N(10MHz)的频率进入梳状滤波器,梳状滤波器其实是微分运算,即当前值减去上一次的值。经过3次的梳状滤波器,最后1级的结果即为抽取的数值。

在这里插入图片描述

(二)最大位宽计算

上面提到CIC滤波器中计算存在加减法操作,因此我们需要考虑到计算过程中信号位宽的问题,这是CIC实现中最需要关注的问题。由于积分器的累加效应,内部数据位宽会随着级数N线性增长。

最大位宽计算公式如下:

B_max = B_in + N * ceil(log2(R * M))

ceil()–向上取整函数
  • B_in:输入位宽
  • R:抽取/插值因子
  • M:差分延迟(通常为1)

举个例子:假设 B_in=16位, R=64, M=1, ceil(log2(64)) = 6。

  • 当 N=3 时,最大位宽 = 16 + 3*6 = 34位
  • 当 N=5 时,最大位宽 = 16 + 5*6 = 46位
  • 当 N=6 时,最大位宽 = 16 + 6*6 = 52位

可以看到,级数每增加一级,位宽就会显著增加,消耗更多的寄存器、逻辑和布线资源。
级数N对滤波器性能的影响:
1、阻带抑制(抗混叠/抗镜像性能)
这是增加级数最主要的目的。N越高,阻带衰减越大,滤波器对带外信号的抑制能力就越强。在频谱上看,旁瓣的幅度会显著降低。这对于抽取器来说,意味着能更好地防止混叠;对于插值器来说,意味着能更好地抑制镜像。

2、通带衰减(副作用)
这是增加级数带来的主要代价。N越高,通带内的衰减也越严重。这意味着我们想要的信号,尤其是通带边缘的信号,也会被显著衰减。为了补偿这种通带衰减,通常需要在CIC滤波器后面级联一个补偿FIR滤波器。

二、CIC抽取滤波器FPGA实现

(一)Verilog代码

以下CIC滤波器代码参数:
级数:3
抽取因子:16

`timescale 1ns /1ps //////////////////////////////////////////////////////////////////////////////////// Company: // Engineer: // // Create Date: 2025/10/13 15:11:49// Design Name: // Module Name: cic_down_sample// Project Name: // Target Devices: // Tool Versions: // Description: // // Dependencies: // // Revision:// Revision 0.01 - File Created// Additional Comments:// ////////////////////////////////////////////////////////////////////////////////// module cic_down_sample#( parameter DATA_IN_WIDTH =8, parameter DATA_OUT_WIDTH =8, parameter CIC_FACTORS =16,// 抽取因子 parameter MAX_WIDTH =20// 最大位宽)( input clk , input rstn , input signed[DATA_IN_WIDTH-1:0] data_in , input data_in_valid , output signed[DATA_OUT_WIDTH-1:0] data_out ); wire signed[MAX_WIDTH-1:0] add_data_0 ; wire signed[MAX_WIDTH-1:0] add_data_1 ; wire signed[MAX_WIDTH-1:0] add_data_2 ; reg signed[MAX_WIDTH-1:0] data_0 ; reg signed[MAX_WIDTH-1:0] data_1 ; reg signed[MAX_WIDTH-1:0] data_2 ; reg [4:0] cnt_div ; reg sample_flag ;// 采样标志 reg signed[MAX_WIDTH-1:0] comb_in ; wire signed[MAX_WIDTH-1:0] add_comb_0 ; wire signed[MAX_WIDTH-1:0] add_comb_1 ; wire signed[MAX_WIDTH-1:0] add_comb_2 ; reg signed[MAX_WIDTH-1:0] comb_0 ; reg signed[MAX_WIDTH-1:0] comb_1 ; reg signed[MAX_WIDTH-1:0] comb_2 ;// 积分器 always @(posedge clk or negedge rstn) begin if(!rstn)begin data_0 <= 'd0 ; data_1 <= 'd0 ; data_2 <= 'd0 ; end else begin data_0 <= add_data_0 ; data_1 <= add_data_1 ; data_2 <= add_data_2 ; end end assign add_data_0 ={{12{data_in[7]}},data_in}+ data_0 ; assign add_data_1 = add_data_0 + data_1 ; assign add_data_2 = add_data_1 + data_2 ;// 降采样处理 always @(posedge clk or negedge rstn) begin if(!rstn)begin cnt_div <= 'd0 ; end elseif(cnt_div == CIC_FACTORS -1)begin cnt_div <= 'd0 ; end else begin cnt_div <= cnt_div +1; end end always @(posedge clk or negedge rstn) begin if(!rstn)begin sample_flag <=1'b0 ; end elseif(cnt_div == CIC_FACTORS -1)begin sample_flag <=1'b1 ; end else begin sample_flag <=1'b0 ; end end // 梳状器 always @(posedge clk or negedge rstn) begin if(!rstn)begin comb_in <= 'd0 ; end elseif(sample_flag)begin comb_in <= add_data_2 ; end end always @(posedge clk or negedge rstn) begin if(!rstn)begin comb_0 <= 'd0 ; comb_1 <= 'd0 ; comb_2 <= 'd0 ; end elseif(sample_flag)begin comb_0 <= comb_in ; comb_1 <= add_comb_0 ; comb_2 <= add_comb_1 ; end end assign add_comb_0 = comb_in - comb_0 ; assign add_comb_1 = add_comb_0 - comb_1 ; assign add_comb_2 = add_comb_1 - comb_2 ; assign data_out = add_comb_2[19:12];// endmodule 

顶层文件:

`timescale 1ns /1ps //////////////////////////////////////////////////////////////////////////////////// Company: // Engineer: // // Create Date: 2025/10/13 15:45:40// Design Name: // Module Name: cic_top// Project Name: // Target Devices: // Tool Versions: // Description: // // Dependencies: // // Revision:// Revision 0.01 - File Created// Additional Comments:// ////////////////////////////////////////////////////////////////////////////////// module cic_top( input sysclk , input sysrstn ); wire m_axis_data_tvalid ; wire signed[7:0] m_axis_data_tdata ; wire signed[7:0] data_out ; dds_compiler_0 dds(.aclk( sysclk ),// input wire aclk.m_axis_data_tvalid( m_axis_data_tvalid),// output wire m_axis_data_tvalid.m_axis_data_tdata( m_axis_data_tdata ),// output wire [7 : 0] m_axis_data_tdata.m_axis_phase_tvalid(),// output wire m_axis_phase_tvalid.m_axis_phase_tdata()// output wire [31 : 0] m_axis_phase_tdata); cic_down_sample#(.DATA_IN_WIDTH(8),.DATA_OUT_WIDTH(8),.CIC_FACTORS(16),// 抽取因子.MAX_WIDTH(20)// 最大位宽)u_cic_down_sample(/*input */.clk( sysclk ),/*input */.rstn( sysrstn ),/*input signed [DATA_IN_WIDTH-1:0] */.data_in( m_axis_data_tdata/*{~m_axis_data_tdata[7],m_axis_data_tdata[6:0]}*/),/*input */.data_in_valid( m_axis_data_tvalid ),/*output signed [DATA_OUT_WIDTH-1:0] */.data_out( data_out )); endmodule 

(二)仿真分析

级数:3 抽取因子:16

在这里插入图片描述


级数:3 抽取因子:8

在这里插入图片描述


可以看到抽取因子越小或级数越小时,CIC抽取滤波器输出波形约平滑,因此需要有必要时级联一个补偿FIR滤波器。

Read more

FPGA实现高效FFT/IFFT变换:IP核优化与Verilog测试验证

1. FFT与FPGA的完美结合 在数字信号处理领域,快速傅里叶变换(FFT)就像是一把瑞士军刀,能够将时域信号快速转换到频域进行分析。而FPGA凭借其并行计算能力和可编程特性,成为实现FFT算法的理想平台。我曾在多个无线通信项目中采用FPGA实现FFT/IFFT处理,实测下来发现相比DSP处理器,FPGA方案在实时性方面能提升3-5倍性能。 FFT IP核是FPGA厂商提供的预封装模块,相当于一个"黑盒子",开发者只需要配置参数就能直接使用。Xilinx的FFT IP核支持从64点到65536点的变换规模,吞吐量最高可达400MS/s。记得我第一次使用时,仅用半小时就完成了256点FFT的配置,比从零编写Verilog代码节省了至少两周时间。 2. FFT IP核的配置技巧 2.1 关键参数设置 在Vivado中配置FFT IP核时,这几个参数需要特别注意: * 变换长度:根据信号带宽选择,常见256/512/1024点 * 数据精度:16位定点数适合大多数应用,高精度场景可用24位 * 架构选择:流水线架构(Pipelined)适合高速应用,突发架构(Burst

告别繁琐配置!Z-Image-Turbo一键启动AI绘画开箱即用

告别繁琐配置!Z-Image-Turbo一键启动AI绘画开箱即用 你是否经历过这样的时刻: 花两小时配环境,装依赖,调CUDA版本,改配置文件…… 终于跑通了模型,结果生成一张图要等一分半,还报错OOM? 或者打开网页版,排队37人,生成一张图卡在“Processing”十分钟不动? 别折腾了。 今天介绍的这个镜像——阿里通义Z-Image-Turbo WebUI图像快速生成模型(二次开发构建by科哥),真正做到了: 一行命令启动 本地离线运行 15秒内出高清图 中文提示词直输不翻译 界面清爽、参数友好、小白零门槛 这不是概念演示,不是Demo页面,而是一个已打包、可验证、开箱即用的完整WebUI镜像。它把Z-Image-Turbo从论文和代码仓库里“拎出来”,塞进一个预装好所有依赖的容器里——你只需要点一下,就能开始画。 下面,我们就用最实在的方式,带你从零到图:不讲原理、不堆术语、不绕弯子,只说“你现在就能做的三件事”。 1. 三步启动:比打开浏览器还快 Z-Image-Turbo

Clawdbot+Qwen3-32B多场景落地:HR问答机器人、IT运维助手案例

Clawdbot+Qwen3-32B多场景落地:HR问答机器人、IT运维助手案例 1. 为什么需要一个“能真正干活”的AI助手? 你有没有遇到过这些情况: * HR同事每天重复回答“五险一金怎么交”“年假怎么算”“入职材料有哪些”,同一问题被问几十遍; * IT支持群消息刷屏:“打印机连不上”“VPN登不进去”“邮箱收不到邮件”,但没人能立刻响应; * 每次上线新系统,员工第一反应不是看手册,而是@IT或@HR发一串“这个怎么用?”——而回复往往要等半小时。 这些问题背后,不是人不够努力,而是信息分散、流程固化、响应链路过长。传统知识库查不到上下文,客服机器人答非所问,人工响应又跟不上节奏。 Clawdbot + Qwen3-32B 的组合,不是又一个“能聊天”的Demo,而是一套可嵌入真实工作流、能理解业务语境、会调用内部规则、还能持续反馈优化的轻量级智能助手方案。它不依赖公有云API,不上传敏感数据,所有推理在内网完成;它不追求“万能”,但专注把HR政策解读、

WebODM完全指南:零基础掌握开源无人机地图制作

WebODM完全指南:零基础掌握开源无人机地图制作 【免费下载链接】WebODMUser-friendly, commercial-grade software for processing aerial imagery. 🛩 项目地址: https://gitcode.com/gh_mirrors/we/WebODM 想要将无人机拍摄的航拍影像快速转化为专业级的地理空间数据吗?WebODM这款开源免费的无人机图像处理软件正是你需要的工具。作为一款功能强大的商业级解决方案,它能够从航拍照片中自动生成高精度正射影像、三维点云、数字高程模型和带纹理的3D模型,让复杂的空间数据处理变得简单直观。 🚀 快速启动:5分钟完成环境搭建 WebODM提供了多种安装方式,其中Docker一键部署是最简单快捷的选择。只需按照以下步骤操作,即可在本地搭建完整的无人机数据处理平台。 系统要求检查 在开始安装前,请确保你的系统满足以下基本要求: * 操作系统:Windows、macOS或Linux * 内存:至少8GB(推荐16GB以上) * 存储空间:50GB可用空间 * 网络连