FPGA自学笔记--VIVADO RAM IP核控制和使用

FPGA自学笔记--VIVADO RAM IP核控制和使用

      本文主要学习在VIVADO软件中如何生成所需要的RAM IP核,以及相关的配置定义,并搭建tb对生成的IP读写控制时序进行仿真和测试。

一、sram ip生成与配置

1.1 ram ip创建方法

  1. 新建工程:打开 Vivado,创建一个新的工程项目。
  2. 打开 IP Catalog:在 Vivado 主界面中,单击 IP Catalog
  3. 搜索 RAM:在右侧窗口的 Search 框中输入 ram,会出现相关 IP 条目。
  4. RAM IP 类型:在 Memories & Storage Elements 分类下,可以看到两种主要的 RAM 创建入口:
    • Distributed Memory Generator
    • Block Memory Generator
  5. 主要差别
    • Distributed Memory Generator:生成的 RAM/ROM 核心占用 FPGA 的 LUT(查找表) 资源。查找表本质上是一种小型 RAM,因此这种方式适合对存储容量要求不大但需要快速访问的场景。
    • Block Memory Generator:生成的 RAM/ROM 核心占用 FPGA 的 Block Memory(嵌入式硬件 RAM) 资源。适合需要较大容量存储、节省 LUT 资源的应用。

选择 Block Memory Generator 双击鼠标进入到 RAM IP 配置界面。

1.2 Xilinx RAM IP 配置选择说明

    • 常规接口(Native):原生端口,直接控制信号。
    • AXI 接口:用于与 AXI 总线系统集成。

全局summary ,点击OK

初始化设置 RAM IP 的初始化配置用于在 FPGA 上电或复位时为存储单元设置初始值,可以选择默认填充(如全 0 或全 1),也可以通过加载初始化文件(如 .mem.coe 文件)写入自定义数据。初始化可以在生成时包含初始内容,也可以通过逻辑模块在系统上电后写入,Vivado 常通过 COE 文件指定每个地址的初始数据。同时,可以配置是否在初始化时对输出端口进行寄存,以保证上电或复位期间读出的数据符合预期。这种初始化常用于存放查找表数据、系统默认值或测试仿真阶段的初始化数据。

端口 B 输出寄存器配置 端口 B 的输出寄存器配置主要用于控制读出数据是否经过寄存器缓存,以改善时序性能或满足设计需求。在简单双端口 RAM 中,虽然端口 B 只能进行读操作,但仍可以配置其输出寄存器,通常可以选择 无寄存器(直接输出)或 有寄存器(输出数据经过寄存器打一拍),这样可以根据系统时序要求优化读数据的稳定性和延迟。在真双端口 RAM 中,同样可以独立配置端口 B 的输出寄存器,实现更灵活的时序控制。

端口 B 输出置位/复位设置 这里不创建置位/复位端口,需注意这里置位/复位并不复位 RAM 中的数据而是只复位寄存器上的值。

端口 B 数据位宽和内存深度的设置 在简单双端口 RAM 中,端口 B 仅用于读操作,无法进行写操作,因此其操作模式不可修改。而在真双端口 RAM 中,端口 B 则可以进行操作模式设置。这里将端口 B 的使能设置为 Always Enable,确保该端口始终处于使能状态。

端口使能信号类型设置 端口使能信号类型设置,一个是一直使能,一个是通过一个 ENA 信号管脚控制,这里选择 Always Enable。

操作模式设置 在 RAM IP 的配置中,操作模式(Write Mode)提供三个选项,主要用于处理当同一地址在同一时钟周期同时发生读写操作时的行为。具体而言,这些选项决定了读出的数据是 写入的最新数据该地址原有的数据,还是 读数据保持不变。选择合适的操作模式可以确保在读写冲突情况下的逻辑行为符合设计需求。Write First 模式下的波形,同时对同一地址读写,读出数据刚写入该地址的数据。Read First 模式下的波形,同时对同一地址读写,读出数据刚上次写入该地址的数据。No Change 模式下波形,读出的数据只有在进行读操作但未进行写操作时更新数据,在同时读写数据时,读出数据保持不变。

RAM 数据位宽和深度设置(重要!!!)由于我们选择的是简单双端口ram,port A作为输入端口,我们这里配置数据位宽为16,数据深度1024,也就是最大存储1024个16bit数。

实现算法选择在 RAM IP 的配置中,算法类型提供了三种选择:最小面积(Minimum Area)、低功耗(Low Power)以及固定原语(Fixed Primitives)。这些选项会影响生成的 RAM 的实现方式和性能特性,例如占用资源和功耗等。具体的实现细节可以参考 IP 手册,从第 42 页开始有详细说明。在当前配置中,我们保持默认的 最小面积 选项即可,不做额外修改。

BYTE写使能在配置 RAM 时,如果勾选写数据字节使能(Write Enable),写使能信号会按字节生成对应的位,使每个字节对应一个写使能位。字节大小可以设置为 8 或 9 位,因此输入输出数据的位宽必须是 8 或 9 的整数倍。由于这里需要一个位宽为 8bit 的 RAM,因此选择勾选 Write Enable 并将字节大小设置为 8bit。   

ECC 选项ECC 全称是 Error Correction Capability,是在简单双端口 RAM 类型下的一种纠错功能,具体该功能的详细说明,可以查看 IP 手册,可以看到,只有在简单双端口RAM类型才是可以选择的,这里选择 NO ECC。ECC是FPGA和数字IC设计中一种经典数据校验和纠错的算法功能模块,以后单开一篇博客详细介绍其原理。

存储器类型(Memory Type)对于 RAM,有三种类型可选:

类型端口数量时钟数量读写特性
单端口 RAM11读写共享同一时钟,读写不能同时进行。
简单双端口 RAM2(PORTA/PORTB)2PORTA 用于写,PORTB 用于读,可同时进行操作。
真双端口 RAM22两个端口各自独立,可同时读写,支持双向操作。

端口类型(Interface Type)
Xilinx 的很多 IP 核提供两种接口类型:在本例中,选择 Native 接口

二、verilog例化模板

        1、点击Generate,生成对应IP相关的文件。

        2、点击IP SOURCE一栏,查看例化文件,可以复制例化模块到自己的工程中使用。

blk_mem_gen_0 your_instance_name ( .clka(clka), // input wire clka .ena(ena), // input wire ena .wea(wea), // input wire [0 : 0] wea .addra(addra), // input wire [9 : 0] addra .dina(dina), // input wire [15 : 0] dina .clkb(clkb), // input wire clkb .enb(enb), // input wire enb .addrb(addrb), // input wire [9 : 0] addrb .doutb(doutb) // output wire [15 : 0] doutb );

 三、仿真TESTBENCH搭建。

        由于本文中只会对ram ip 的行为进行测试,所以直接将模块例化到tb中仿真即可,添加tb文件如下。

`timescale 1ns/1ns `define clk_period 20 module dpram_tb; reg clock; reg [15:0]data; reg [9:0]rdaddress; reg [9:0]wraddress; reg wren; wire [9:0]q; integer i; dpram dpram0( .clock(clock), .data(data), .rdaddress(rdaddress), .wraddress(wraddress), .wren(wren), .q(q) ); initial clock = 1; always#(`clk_period/2)clock = ~clock; initial begin data = 0; rdaddress = 30; wraddress = 0; wren = 0; #(`clk_period*20 +1 ); for (i=0;i<=1023;i=i+1)begin wren = 1; data = 1024 - i; wraddress = i; #`clk_period; end wren = 0; #(`clk_period*20); for (i=0;i<=15;i=i+1)begin rdaddress = i; #`clk_period; end #(`clk_period*20); $stop; end endmodule 

 

  

Read more

Qwen3-VL-WEBUI实战:新闻图片自动标注系统

Qwen3-VL-WEBUI实战:新闻图片自动标注系统 1. 引言 1.1 业务场景描述 在现代新闻媒体生产流程中,图片是信息传递的重要载体。每篇新闻报道往往伴随多张现场照片、图表或截图,而对这些图像进行准确、高效的内容标注(如生成标题、识别主体、提取关键词)是一项耗时且依赖人工的任务。 传统方式下,编辑人员需手动查看每张图片并撰写描述性文字,不仅效率低下,还容易因主观判断导致标注不一致。随着AI技术的发展,尤其是多模态大模型的成熟,构建一个自动化新闻图片标注系统已成为可能。 1.2 痛点分析 当前主流的图像标注方案存在以下问题: * 通用OCR工具仅能提取文本,无法理解图像语义; * 传统CV模型(如ResNet+分类头)泛化能力弱,难以应对复杂场景; * 闭源API服务成本高、响应慢、数据隐私风险大; * 部署门槛高:多数开源模型需要复杂的环境配置和工程调优。 因此,亟需一种开箱即用、高性能、可本地部署的视觉语言模型解决方案。 1.3 方案预告 本文将基于阿里云最新开源的 Qwen3-VL-WEBUI,搭建一套完整的“

springboot+vue基于web的咖啡点单程序设计

springboot+vue基于web的咖啡点单程序设计

目录 * 同行可拿货,招校园代理 ,本人源头供货商 * 功能模块划分 * 核心业务流程 * 技术实现要点 * 数据模型设计 * 前端交互特性 * 安全防护措施 * 扩展性设计 * 项目技术支持 * 源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作 同行可拿货,招校园代理 ,本人源头供货商 功能模块划分 后端(SpringBoot) * 用户认证与授权(JWT/OAuth2) * 商品管理(咖啡品类、配料、价格) * 订单处理(创建/查询/状态更新) * 支付接口集成(微信/支付宝) * 数据统计与分析 前端(Vue) * 响应式用户界面(PC/移动端自适应) * 动态菜单展示与分类筛选 * 购物车实时交互 * 订单状态可视化追踪 * 用户评价系统 核心业务流程 用户侧流程 * 注册/登录 → 浏览菜单

Qwen3-32B开源可部署实践:Clawdbot Web网关+企业微信/钉钉集成指南

Qwen3-32B开源可部署实践:Clawdbot Web网关+企业微信/钉钉集成指南 1. 为什么需要这个组合:从大模型能力到办公场景落地 你有没有遇到过这样的情况:团队刚部署好Qwen3-32B,本地跑得飞快,但业务部门同事却说“用不上”?不是模型不好,而是缺了一座桥——一座把强大推理能力,稳稳接到日常办公入口的桥。 Clawdbot就是这座桥。它不替换你的Qwen3-32B,也不要求你改模型、重训练,而是用极轻量的方式,把Ollama托管的Qwen3-32B,变成企业微信里能直接@提问的AI助手,或是钉钉群中自动响应任务的智能协作者。 关键在于“直连Web网关”这四个字。它意味着:没有中间服务层、没有额外API网关、不走公网转发——Qwen3-32B的响应,从Ollama输出那一刻起,经由Clawdbot内置代理,毫秒级抵达聊天界面。这不是演示Demo,而是已在线上环境稳定运行超47天的真实部署方案。 本文不讲原理推导,不列参数表格,只聚焦三件事: 怎么让Qwen3-32B在Clawdbot里真正“活”起来; 怎么把Web网关8080端口安全、稳定地映射到18789对

语音交互实战:基于WebRTC与AI接口构建实时语音对话系统

语音交互实战:基于WebRTC与AI接口构建实时语音对话系统 随着大模型技术的爆发,人机交互的方式正在经历一场从“指令式”到“对话式”的深刻变革。传统的文本交互虽然成熟,但在移动场景、驾驶辅助或无障碍应用中,语音交互才是刚需。然而,很多开发者在尝试构建语音对话系统时,往往会陷入“能听会说但反应迟钝”的尴尬境地。 传统的语音交互流程通常是:录音 → 上传文件 → 后端识别(STT) → 大模型处理(LLM) → 语音合成(TTS) → 返回播放。这种“一问一答”的串行模式,导致用户说完话后需要等待数秒才能听到回复,这种延迟在实时对话场景下是致命的。 本文将探讨如何利用WebRTC技术与AI接口,构建一个低延迟、全双工的实时语音对话系统,打破交互延迟的壁垒。 核心技术架构:从串行到流式 要解决延迟问题,核心在于将“文件级”处理转变为“流式”处理。我们不再等待用户说完一句话才开始识别,而是边说边识别;不再等大模型生成完整回复才开始合成,而是边生成边合成。 1. WebRTC: