基于7系列FPGA实现万兆网通信

基于7系列FPGA实现万兆网通信

目录

一、FPGA实现万兆以太网

1.1 、10G PCS/PMA核

1.1.1、以太网XGMII接口

1.1.2 、MDIO接口(可选用)

1.1.3、10G PCS/PMA核

1.2、10G Ethernet Subsystem核实现万兆网

二、万兆网功能测试

2.1 、ARP及Ping功能

2.2 、巨型帧

2.3、测速

2.4、代码


        之前分享过u/u+系列FPGA的万兆网通信:UltraScale/+  FPGA实现万兆网的两种方式:GT核、10G Ethernet Subsystem核,在别的平台有些网友问是否支持巨型帧、7系列、速率等问题,这里就专门写篇7系列的万兆网,相关功能的测试。

        今年最后一篇了。明后年主要准备分享些:

  • 低速器件的开发使用、低速协议
  • RFSoC中的ADC、DAC开发使用
  • PCIe核的开发使用,上位机的驱动开发
  • TCP/IP协议、客户端及服务器的开发
  • GIGE千兆/万兆相机的使用开发
  • zynq的相关开发
  • 一些信号处理

一、FPGA实现万兆以太网

          本文只介绍使用10G以太网核和10G PCS PMA核两种方式实现的万兆网通信;基于SerDes实现10G以太网通信采用64B/66B编码方式,串行线速率为10.3125Gbps。

1.1 、10G PCS/PMA核

        关于该核的使用,参考PG068;此核的用户接口为XGMII。

        对于光纤或者RJ45水晶头的接口(10GBASE-R类型),内部功能结构如下:

        万兆网通信采用64B/66B编码。64B/66B编码在发送前需要对数据加扰,在接收数据时也要先对数据解扰。64B/66B编码:在加扰后的64bit数据前加入2bit的同步位(Sync)组成66bit数据,同步位表示该64bit数据是数据帧还是控制帧。

1.1.1、以太网XGMII接口

        这里只讨论64bit数据位宽的XGMII接口;xgmii_txd对应字节为控制字符时,xgmii_txc对应的控制位为高电平;在xgmii_txd对应字节为数据字符时,xgmii_txc对应的控制位为低电平。

        相关时序:

        XGMII接口中相关数据、控制的定义如下:空闲状态为0x07、起始状态为0xFB、终止状态为0xFD。

        关于以太网帧如何对接XGMII接口,可以通过以下过程理解:

        以太网帧结构如下:

图片

        XGMII接口中:一帧报文的封装发送:添加控制符,空闲IDLE(0x07)+ START(0xFB)+ 前导码+ SFD + MAC + ...... + FCS + TERMINATE(0xFD)。比如以下ILA截图:

图片

        控制对应的控制符为1,后续在64B/66B编码中转换为2bit同步位(Sync)。

图片

        在增加起始、结束、空闲控制符后,按下图的转换规则:比如起始S转换为64bit中MSB字节为0x78;空闲状态为64bit中MSB字节为0x1E。

图片

图片

        最后,将上述64bit的接口数据经加扰,送到10G PCS/PMA核的XGMII接口。

        用户接收到XGMII接口数据,按上述逆过程解析网络帧。

1.1.2 、MDIO接口(可选用)

        本部分只有一些场景会用到,不过多描述,具体寄存器描述见PG068的Configuration Vector描述。

          MDIO接口是该核的寄存器配置接口,类似于千兆网PHY的寄存器配置。其相关时序配置如下:

1.1.3、10G PCS/PMA核

        该核需要license,核页面如下:该核只适用于7系列FPGA。

        上述核配置页面不启用:MDIO接口。

        关于该核的时钟、复位部分的使用可参考其example。

1.1.4、万兆网开发

        借助例化上述GT核后,可按照图1开发编码实现PCS相关功能:对于发送帧功能,用户端的帧数据,封装起始、结束、空闲码后,经加扰后,结合同步字段,经变速箱Gearbox,并串转换等,最终经电路传送出去;对于接收,是上述过程的逆操作。

        开发过程主要涉及:帧数据按照上节内容封装与解封、同步字段的增添与解析、加解扰。其中帧数据的封装与解析按照以太网协议进行即可。

        具体网络协议,用户根据具体需要封装、解析即可,比如UDP、TCP、FTP等;这里只讨论万兆网通信方式,不介绍具体协议,协议内容可参考:FPGA实现千兆网UDP协议(含ARP、ICMP)

1.2、10G Ethernet Subsystem核实现万兆网

        该核的用户数据接口为AXIS,这里不再介绍。

        此方式是实现万兆网通信最快捷的方法,需要license。开发按照以太网协议对网络帧进行解析与封装即可,只需关心如下结构:

图片

        其核配置界面如下:

        根据开发板这里选择10GBASE-R类型,64bit的AXIS数据接口。

        AXI-Lite配置接口时钟范围选择,这里没有启用流控。

        这页主要是DRP及状态接口。

        这页没启用时间戳。

        这页选择时钟及复位是集成核内外。多通道的万兆网通信使用核方式与U/U+系列不同。

        关于时钟及复位的使用,可参考其example。

二、万兆网功能测试

        本文只针对UDP协议栈测试,UDP相关协议可参考:FPGA实现千兆网UDP协议(含ARP、ICMP)。千兆、万兆、40G/50G、100G以太网的UDP协议栈的实现原理相同,只是用户数据位宽、CRC检验的实现难易不同。

2.1 、工程实现

        上述两种方式使用相应的核都可以实现万兆网通信,本文采用UDP协议栈测试工程部分功能。这里不介绍UDP协议栈(ARP缓存、ping、UDP),比如向对端发包前,先查询ARP列表,查询无果则ARP寻址后再发包;对于一些明确的场景,也可以省略ARP寻址。

        比如10G万兆网核的工程:

        两端的信息配置:

2.1 、ARP及Ping功能

        通过ping下位机测试arp及ping应答功能:

2.2 、巨型帧

        不同的网卡、路由器等支持的最大MTU不同,但都支持46~1500字节。为了实现长数据包的传输,产生了巨型帧。

        对于多级路由的网络包传输,为了避免中间路由节点的设备丢弃,采用巨帧分片处理:巨帧拆分成多包,利用IP层的头部分片及偏移字段(第2个DW中)区分数据的完整性和顺序。分片的首包保持帧结构的完整字段,MTU最大1500字节;其他分片包在网络帧结构中去除了UDP的头部字段。

图片

        对于点到点直连的应用场景,或者中间路由节点都支持MTU大值(比如9000字节),则利用巨帧时可采用标准的巨帧分片策略,也可采用不分片的策略。

        FPGA向上位机发送长度为8500字节的UDP巨型帧的测试如下:分片为5包1480字节和最后一包1100字节。

        协议栈仿真:测试模块产生8500字节的测试数据,协议栈进行巨帧分片,环回后接收端能正确解析数据。

        10G以太网核上板测试:测试模块产生8500字节的测试数据

        上位机wireshark观测上发的矩阵数据,分片以及偏移量正常:

        从第2个分片开始,不再有UDP头部字段。

         10G PCS/PMA核的测试:

2.3、测速

        两个工程向上位机发包,当接口空闲时一直上发,测速结果近9.5 Gbps:

2.4、代码

        有相关需要的可私信联系。

往期回顾

UltraScale/+  FPGA实现万兆网的两种方式:GT核、10G Ethernet Subsystem核

FPGA 40G/50G Ethernet Subsystem核的使用

FPGA实现100G UDP通信

FPGA实现千兆网UDP协议(含ARP、ICMP)

FPGA光通信系列4 — 基于64b/66b编码的自定义协议

FPGA光通信系列3 — 基于8b/10b编码的自定义协议应用

FPGA光通信系列2——Aurora 64B/66B的使用

FPGA实现Aurora光通信应用(8B/10B)

JESD204B的使用系列——3、DAC的应用(AD9164  9.6GSPS)

JESD204B的使用系列——2、协议及ADC的应用(AD9689)

JESD 204B的使用系列—1、时钟芯片的应用

Read more

在 NVIDIA DGX Spark部署 Stable Diffusion 3.5 并使用ComfyUI

在 NVIDIA DGX Spark部署 Stable Diffusion 3.5 并使用ComfyUI

📖 前言 随着 NVIDIA Blackwell 架构的问世,DGX Spark (Personal AI Supercomputer) 将桌面级 AI 算力推向了新的巅峰。这台怪兽级设备搭载了 GB200/GB10 级别的 GPU 和 NVIDIA Grace CPU (ARM64),并运行在最新的 CUDA 13 环境下。 然而,“最强硬件"往往伴随着"最难环境”。由于 Grace CPU 采用 ARM (aarch64) 架构,且 CUDA 13 过于前沿,传统的 PyTorch 安装方法极易失败。 本文将手把手教你如何在这台超级计算机上部署 Stable Diffusion

揭秘!AI应用架构师眼中的智能Web3应用开发框架精髓

揭秘!AI应用架构师眼中的智能Web3应用开发框架精髓 关键词:智能Web3应用, AI与区块链融合, 去中心化AI架构, 智能合约开发, Web3开发框架, AI模型链上集成, 去中心化应用(DApp)设计 摘要:当人工智能(AI)的"智慧大脑"遇上Web3的"去中心化灵魂",会碰撞出怎样的创新火花?本文将以AI应用架构师的第一视角,深入剖析智能Web3应用开发框架的核心精髓。我们将从"传统互联网到Web3的进化史"讲起,用生活类比揭开Web3与AI融合的神秘面纱,系统讲解智能Web3应用的"五脏六腑"架构设计、AI模型与区块链交互的"对话语言"、以及实战开发中的"避坑指南"。无论你是Web3开发者、AI工程师,还是对下一代互联网好奇的技术爱好者,这篇文章都将带你透过架构师的眼睛,看到智能Web3应用开发的全景蓝图—

【机器人】ROS2 功能包创建与 CMake 编译链路探秘

【机器人】ROS2 功能包创建与 CMake 编译链路探秘

🔥大奇个人主页 :https://blog.ZEEKLOG.net/m0_75192474?type=blog ⚡本文所属专栏:https://blog.ZEEKLOG.net/m0_75192474/category_13131150.html ros2 pkg create 是 ROS2(Robot Operating System 2)中用于快速初始化功能包的官方核心命令行工具。其核心作用是自动生成功能包所需的完整目录结构、配置文件及可选示例节点,避免手动创建文件和配置的繁琐操作,大幅提升开发效率。 该命令支持两种主流构建类型(C++/Python),可直接指定依赖包、维护者信息、开源协议等关键配置,生成的功能包完全符合 ROS2 官方规范,可直接用于编译、运行及后续开发扩展 ⏰ 创建工作空间 首先需要再主目录中新建一个文件夹,带src目录 mkdir-p test_ws/

NWPU VHR-10数据集 无人机遥感目标检测数据集 飞机 储罐 棒球场 网球场篮球场 港口车辆桥梁检测 遥感图像中的地理空间目标检测

NWPU VHR-10数据集 无人机遥感目标检测数据集 飞机 储罐 棒球场 网球场篮球场 港口车辆桥梁检测 遥感图像中的地理空间目标检测

NWPU VHR-10数据集 遥感数据集 NWPU VHR-10数据集是 10个类别地理空间目标检测的挑战性数据集,共650张图片。 YOLO和COCO格式 数据集按默认划分比例:390张训练集、130张验证集、130张测试集。 手动标注了757架飞机、302艘船只、655个储罐、390个棒球场、524个网球场、159个篮球场、163个田径场、224个港口、124座桥梁和598辆车辆。 📊 一、数据集总体信息 项目描述数据集名称NWPU VHR-10(Northwestern Polytechnical University Very High Resolution 10-class Dataset)任务类型遥感图像中的地理空间目标检测(Object Detection in Remote Sensing Images)图像总数650 张(均为高分辨率遥感图像,源自 Google Earth 等平台)图像分辨率约 600×600