FPGA教程系列-Vivado Aurora 8B/10B IP核设置

FPGA教程系列-Vivado Aurora 8B/10B IP核设置

FPGA教程系列-Vivado Aurora 8B/10B IP核设置

Aurora 8B/10B 是 Xilinx 开发的一种轻量级、链路层的高速串行通信协议。它比单纯的 GT(Transceiver)收发器更高级(因为它帮你处理了对齐、绑定、甚至流控),但比以太网或 PCIe 更简单、延迟更低。

手册看的脑袋疼,还是实操一下看看如何使用吧,可能很多部分都是官方写好的,不需要自己去弄,而实际使用可能就是修改一些参数就行了。

image

1. Physical Layer (物理层设置)

这一部分直接决定了底层的硬件连接和电气特性,必须严格按照板卡设计和对端设备来配置

Lane Width (Bytes) [通道宽度]: 2 或 4。决定了用户逻辑接口(AXI-Stream)的数据位宽,也直接影响 user_clk 的频率。

  • 2 Bytes:AXI 接口位宽为 16-bit。user_clk = 线速率 / 20
  • 4 Bytes:AXI 接口位宽为 32-bit。user_clk = 线速率 / 40

如果线速率很高(比如 > 5Gbps),建议选 4 字节,这样可以让 FPGA 内部逻辑时钟(user_clk)跑慢一点,更容易满足时序。如果是 3.125G 这种中低速,选 2 字节即可。

Line Rate (Gbps) [线速率] :光纤或铜线上实际跑的比特率。

取决于 SFP 模块能力、PCB 走线质量以及对端设备的速度。3.125 Gbps,是 Aurora 的一个经典速率(也是 XAUI 的标准速率)。

GT Refclk (MHz) [GT 参考时钟] :FPGA 外部输入的差分参考时钟频率。

必须与你 PCB 板子上连接到 FPGA GT Bank 的那个晶振频率完全一致。如果填错了,PLL 锁不住,整个核都起不来。

INIT clk (MHz) [初始化时钟] :用于驱动复位逻辑和初始化状态机的辅助时钟。在上电初始化阶段,可以使用该时钟来驱动一些逻辑。默认值:50Mhz。

通常给 50MHz 到 100MHz 之间的稳定时钟即可。这个时钟对抖动要求不高,可以用普通的逻辑时钟。

DRP Clk (in MHz) [动态重配置时钟] :用于驱动 DRP(Dynamic Reconfiguration Port)接口的时钟,允许你在运行时修改 GT 的参数。通常和 INIT clk 共用一个时钟源。动态重配置,一般没用,默认值:50Mhz(通常一个内部模块需要进行配置,使用两种方法:端口控制和配置参数控制。一个常见的应用就是线速率切换。这时候就需要利用DRP端口来调整部分参数的值,然后复位GTX,使GTX工作在不同的线速率下。)。

Tip:关于时钟

上面这三个时钟,是IP核工作所需要的时钟,也是我们需要提供给IP核的。此外,还有一个时钟是IP核提供给我们的:user_clk。这个时钟,是IP核根据设置的线速率及Lane的位宽计算出来的用户时钟,用户需要传输的数据必须是该时钟域下的数据,否则会存在亚稳态风险。


这一部分决定了数据如何打包、如何握手。通信双方(TX 和 RX)的配置必须完全一致

Dataflow Mode [数据流模式]:

  • Duplex (双工) :最常用,同时收发。
  • TX-only / RX-only (单工) :只发或只收。
  • Simplex (单工) :类似单工,但有特殊的边带信号处理。

Interface [用户接口类型] —— ⭐️ 非常重要

Framing (帧模式)

  • 有“包”的概念。AXI 接口上有 tlast 信号,用来指示一个数据包的结束。
  • 发送类似以太网包、命令包等非连续、有边界的数据。Aurora 会自动处理两帧之间的空闲填充。

Streaming (流模式)

  • 特点:像一根水管,没有“包”的概念,也没有 tlast 信号。数据源源不断。
  • 适用:发送 ADC 采样数据、视频流等连续数据。传输效率最高,因为没有帧头帧尾的开销。

Flow Control [流控]

  • None:不使用流控(最常用,也最简单)。
  • UFC (User Flow Control) :用户发命令来插队。
  • NFC (Native Flow Control) :核心自动根据接收端缓冲区的满/空状态,给发送端发暂停信号(反压)。

初学者建议选 None。如果你需要防止接收端 FIFO 溢出,可以选 NFC。

Back Channel [回传通道]

  • Sidebands:通常用于单工模式,利用额外的 GPIO 线来告诉发送端“我准备好了”。在双工模式下通常不需要太关注这个。
  • Scrambler/Descrambler [加扰/解扰]在发送前把数据打散(伪随机化),接收后还原。避免数据中出现长时间的连 0 或连 1,减少电磁干扰 (EMI),有利于时钟恢复。
  • Little Endian Support [小端序支持]决定多字节数据的传输顺序。Aurora 默认是大端序(网络字节序)。除非你的处理器是强小端序且你不想在软件里倒腾字节,否则保持默认(不勾选)。小段模式对应[31:0]这种书写习惯,大端模式对应的是[0:31]这种书写习惯

3. Error Detection (错误检测)

CRC [循环冗余校验]: 在每一帧数据后面自动加一个校验码。

如果选了 Framing 模式,建议勾选。这样接收端收到数据时,如果发现 CRC 不对,会报错,保证数据完整性。如果是 Streaming 模式,通常不加 CRC。


4. Debug and Control (调试与控制)

Vivado Lab Tools

在 IP 核里自动插入 ILA(逻辑分析仪)。

调试阶段建议勾选。它会把 Aurora 的状态机、lane_up、channel_up 等关键信号抓出来,如果不通,你能看到卡在哪一步。量产时关掉以节省资源。


配置总结 & 避坑指南:

  1. 时钟计算
    按照图中的配置:3.125 Gbps / 2 Bytes (16 bits) / 10 (8B/10B编码效率) = 156.25 MHz
    user_clk 是 156.25 MHz。所有 AXI 接口逻辑(读写 FIFO、状态机)都必须在这个时钟频率下工作。
  2. 两端一致性
    FPGA A 和 FPGA B 通信,它们的 Line Rate、Lane Width、Scrambler、Interface (Framing/Streaming) 必须一模一样,否则 channel_up 永远起不来。
  3. Refclk 必须准
    如果板子上的晶振是 156.25MHz,这里就必须填 156.25,不能填 125。
  4. 复位顺序
    Aurora 也是基于 GT 的,对复位非常敏感。通常建议使用 IP 核自带的 reset_pb​ (信号) 或者按照官方 Example Design 的复位序列来操作。上电后,先 gt_reset​,再 reset

第二页

image

如果说上一页 “Core Options” 决定了“我们要传多快、传什么格式”,那么这一页则是决定 “这套协议要在 FPGA 的哪几根物理引脚上跑”

这是一个纯物理层的配置界面,必须结合 PCB 原理图FPGA 芯片手册 来设置。

1. Lanes (通道数量)

Aurora 链路包含几条物理通道。

如果需要更高的带宽,可以将多条 Lane 绑定在一起(Bonding)。例如选 4,那么带宽就是单条 Lane 的 4 倍,且 Aurora 会自动处理通道间的对齐。

必须与原理图一致:如果你板子上只画了 1 对线连到光模块,这里就只能选 1。

2. Lane Assignment (通道分配表)

这是最容易晕的地方。这个表格代表了 FPGA 内部 GT (Gigabit Transceiver) 资源的物理位置分布。

  • 结构解析
    • 左侧列 (GTXQ1, GTXQ2…) :代表 Quad。Xilinx 的高速收发器是每 4 个一组,称为一个 Quad。
      • GTXQ1 通常指物理位置最靠下的那个 Quad(或者编号最小的)。
    • 右侧网格:代表每个 Quad 里的 4 个具体收发器通道 (Channel 0 - Channel 3)。
    • 下拉菜单 (X 或 数字)
      • X:表示这个物理通道不被当前的 Aurora 核使用。
      • 1, 2, 3… :表示将 Aurora 的第几条逻辑通道映射到这个物理位置。
  • 如何设置(关键步骤)
    1. 打开原理图:查看你的 SFP 光口或 SMA 接口连接到了 FPGA 的哪个 Bank,哪对引脚(例如 MGTHTXP_115)。
    2. 查找映射:去查 Xilinx 的封装文件(Package File)或在 Vivado 的 “I/O Planning” 视图里看,确定那对引脚属于哪个 Quad 以及该 Quad 里的第几个 Channel(例如 X0Y0, X0Y1)。
    3. 在表中勾选:找到对应的位置,选上编号。
    • 注意:这里的图形化界面只是一个生成网表的向导。最稳妥的做法是这里大概选对 Quad,然后在 XDC 约束文件 中通过 set_property LOC GTXE2_CHANNEL_X0Y0 [get_cells ...] 来进行精确的物理约束。

3. GT Refclk1 / GT Refclk2 (参考时钟选择)

GT 收发器需要一个非常高质量的差分参考时钟(MGTREFCLK)才能工作。决定 Aurora 核使用板子上的哪一个差分晶振输入作为参考时钟。

如何设置

  1. 看原理图:你的 125MHz(或 156.25MHz)差分晶振连接到了 FPGA 的哪两个引脚?(例如 MGTREFCLK0P_115​ / MGTREFCLK0N_115)。
  2. 确认 Quad:确定这两个引脚属于哪个 Quad。
  3. 选择:在下拉菜单中选择对应的 Quad。

重要规则(时钟路由) :通常建议参考时钟和你的数据通道在同一个 Quad,或者在相邻的 Quad(North/South)。如果距离太远,时钟抖动会变大,Vivado 可能会报错。

避坑提示
如果你实在搞不清具体的物理坐标(X0Y?, X0Y?),可以在这里先随便选一个(比如都选在 Q1),生成 IP。但是在写 .xdc 约束文件 时,必须严格加上 package_pin​ 约束和 LOC 约束,Vivado 会以 XDC 文件为准,强行把逻辑“拽”到正确的物理引脚上。如果这里选的和 XDC 冲突太大(比如跨了太多 Bank 导致时钟够不着),Implementation 阶段会报错。

第三页

image

简单来说,这一页是在问: “在这个 IP 核内部,我要不要自带时钟发生器(PLL)和差分时钟缓冲器(IBUFDS)?”

什么是“Shared Logic”?

在 Xilinx FPGA 的高速收发器(GT)架构中,4 个通道(Channel)组成一个 Quad。这 4 个通道共享一些公共资源,最主要的就是 PLL(锁相环)参考时钟输入缓冲(Diff Refclk Buffer)

  • PLL:负责将参考时钟倍频,生成高速串行时钟。
  • Buffer:负责将板子上的差分时钟引入芯片内部。
1. Include Shared Logic in core (包含在核内) —— “我是房东”

这个 IP 核会把 PLL、参考时钟缓冲、复位逻辑全部包含在自己肚子里。它是全功能、自给自足的。生成的 IP 核对外接口比较简单,直接接板级引脚(refclk)即可。

什么时候选

  • 工程里 只有一个 Aurora 核。
  • 或者,在一个 Quad 里有多个 Aurora 核,这是第一个(主核)。它负责产生时钟,分给别人用。
2. Include Shared Logic in example design (包含在示例工程中/核外) —— “我是租客”

这个 IP 核内部 不包含 PLL 和时钟缓冲。它是一个“空壳”或“从核”。它必须依赖外部送进来的 PLL 时钟信号才能工作。生成的 IP 核会多出一堆输入端口(如 gt_pll_clk​、gt_refclk_out 等),你需要把别的核产生的时钟连进去。

为什么叫“在示例工程中”
如果你生成了 Example Design,Vivado 会把那些公共逻辑(PLL等)放在 IP 核外面的顶层文件中。这样方便你修改或者将其去驱动其他的 IP 核。

什么时候选

  • 多核复用:当你在同一个 Quad 里放了第 2、3、4 个 Aurora 核时。因为 PLL 只有一个,已经被第 1 个核(房东)占用了,剩下的核(租客)只能借用第 1 个核输出的时钟。
  • 高级共享:当你有一个以太网核和一个 Aurora 核共用同一个 Quad 的 PLL 时。

Core with Shared Logic
虚线框是 IP 核的边界。可以看到 Shared Logic​(PLL 等)是在虚线框里面的。独立,但也独占资源。

Example Design
虚线框是 IP 核的边界。可以看到 Core without Shared Logic​ 在里面,而 Shared Logic​ 被挪到了外面(Example Design 层级)。

特点

  1. For users who want to edit… :如果你想自己手写 PLL 的复位逻辑,选这个。
  2. Drive multiple cores…这是最常用的场景。外部的 Shared Logic 产生一次时钟,箭头指向 Core without Shared Logic(也就是当前这个 IP),同时还可以引出箭头去驱动其他的 IP 核。
场景 A:最简单的情况(新手推荐)
  • 情况:你的设计里只需要 1 个 Aurora 接口,或者虽然有多个接口但它们分布在完全不同的 Quad 里(比如一个在 Bank 115,一个在 Bank 117)。
  • 设置:选择 Include Shared Logic in core
  • 理由:最省事,不需要处理复杂的时钟互连,开箱即用。
场景 B:同一个 Quad 里有多个通道
  • 情况:你的板子上光口是 4 路的(QSFP),你想跑 4 个独立的 Aurora 单工/双工链路,它们都在同一个 Quad 里。
  • 设置
    1. 第 1 个 IP 核:选择 Include Shared Logic in core。(它是 Master,负责开启 PLL)。
    2. 第 2、3、4 个 IP 核:选择 Include Shared Logic in example design。(它们是 Slave)。
    3. 连线:在顶层 Verilog 中,把第 1 个核输出的 gt_pll_out 等时钟信号,连到后面 3 个核的对应输入端口上。
场景 C:你想完全掌控时钟
  • 情况:你有非常复杂的时钟需求,或者你想在顶层自己实例化 IBUFDS_GTE​ 和 GT_COMMON 原语。
  • 设置:选择 Include Shared Logic in example design。这样 IP 核就是纯净的数据通路,时钟全靠你喂。

Read more

ComfyUI:AI绘画与图像生成的高效工作流与效率提升指南

ComfyUI:AI绘画与图像生成的高效工作流与效率提升指南

目录 1. 简介:从WebUI到ComfyUI的范式转移 2. ComfyUI 基础架构与安装 3. 节点式逻辑解析:核心工作流 4. 利用 ComfyUI 提升 Stable Diffusion 效率的策略 5. 高级工作流实战:ControlNet 与 IP-Adapter 6. 自动化与后端集成:Python API 调用 7. Prompt 工程与动态提示词 8. 总结与展望 1. 简介:从WebUI到ComfyUI的范式转移 在 AI 绘画的领域,Stable Diffusion (SD) 无疑是目前的基石。然而,随着模型体积的增大(如 SDXL, Flux)以及工作流复杂度的提升,传统的基于网页的界面(如

AIGC电商实战:OpenCSG公益课厘清“品牌叙事”与“商品素材”的AI应用边界

AIGC电商实战:OpenCSG公益课厘清“品牌叙事”与“商品素材”的AI应用边界

电商内容最现实的痛点是“量”:同一件衣服有多颜色、多尺码、多场景图;同一款商品要适配不同渠道、不同风格与不同活动节点。内容生产一旦靠人工,就会在成本与速度上同时崩溃。公益课里用“营销内容生成”串起了一个完整逻辑:品牌级广告要慎用AI替代,但商品级内容可以用AI把长尾做起来。 一、先分清两种内容:品牌宣传 vs 商品宣传 课程把“传统媒体、专业模特、机构制作”的内容视为品牌宣传,而把网店、素人模特、商品展示视为商品宣传,并明确后续重点放在商品宣传:因为这里存在大量真实、可规模化的生产需求。 二、为什么大品牌用AI会被骂,小商家反而更适合 课程举了可口可乐的例子:2023年“Masterpiece”更像AI辅助创作,而后续更激进的全AI生成广告引发强烈争议,原因之一是公众对“替代人类创意劳动”的敏感。 从行业信息看,可口可乐近年的AI广告确实多次引发讨论与批评。这也解释了课程给出的策略:品牌大叙事要谨慎,但商品图、长尾素材、低预算内容,AI的投入产出比极高。 三、

用Z-Image-Turbo做AI绘画,效率提升五倍实录

用Z-Image-Turbo做AI绘画,效率提升五倍实录 在内容创作节奏日益加快的当下,图像生成的速度已成为决定项目能否按时交付的关键因素。电商海报、短视频配图、教育可视化素材——这些场景都要求“即时出图”。传统文生图模型如 Stable Diffusion 虽功能强大,但动辄数秒的生成延迟和复杂的部署流程,已难以满足高效生产的需求。 而阿里通义实验室推出的 Z-Image-Turbo,作为 Z-Image 系列的蒸馏优化版本,凭借 8 步高质量出图、亚秒级响应、原生中文支持、消费级显卡友好性 等特性,正在重新定义 AI 绘画的效率边界。本文将基于实际使用经验,全面解析其技术优势与落地实践,还原一次真实场景中效率提升近五倍的技术升级过程。 1. 技术背景与核心价值 1.1 为什么需要更快的文生图模型? 当前主流扩散模型(如 Stable Diffusion 1.5/2.1/XL)通常依赖 20–50

QtCreator配置AI辅助编程插件github copilot保姆级教程

QtCreator配置AI辅助编程插件github copilot保姆级教程

文章目录 * 概要 * 配置流程 概要 Free版‌免费使用,每月限额 2000 次代码补全 + 50 次聊天交互‌集成于 VS Code,支持跨文件编辑、终端协助及自定义指令‌ ‌ Pro版‌‌个人用户‌:10 美元/月 或 100 美元/年‌ ‌特殊群体‌:学生/教师/热门开源维护者可免费使用 Pro 版‌ ‌ Business版‌19 美元/月/用户,按月计费‌面向组织或企业中的团队订阅‌ ‌ Enterprise版‌39 美元/月/用户,按月计费‌企业可按需为不同组织分配 Business 或 Enterprise 订阅‌ 官方地址