FPGA通信——实现串口通信（Uart）

优质文章学习记录

09 Apr 2026 — 8 min read

一、串口通信介绍

1.1、核心概念

并行通信 (Parallel)：像高速公路，8车道同时跑8辆车。速度快，但占用引脚多，且在长距离传输时容易出现“时钟偏差（Skew）”导致数据错位。

串行通信 (Serial)：像单行道，车必须一辆接一辆地排队走。引脚少，成本低，且现代高速串行技术（如PCIE, SATA）通过差分信号解决了速度问题。

我们常说的“串口”通常特指 UART (Universal Asynchronous Receiver/Transmitter，通用异步收发传输器)。

1.2、逻辑层面

UART 是一种异步通信协议。

异步 (Asynchronous)：发送方和接收方之间没有公共的时钟线（不像 SPI 或 I2C 有 CLK 线）。
约定：双方必须提前约定好相同的波特率 (Baud Rate)，否则就像两个人语速不同，无法交流。

数据帧格式 (Frame Format)

FPGA 的状态机就是根据这个时序图来写的：

空闲位 (Idle)：默认高电平（1）。
起始位 (Start Bit)：拉低 1 个周期。告诉接收方：“注意，我要开始说话了！”（这是我们在 Verilog 里检测下降沿的原因）。
数据位 (Data Bits)：通常是 8 位（1 Byte），LSB (低位) 先发。
校验位 (Parity)：可选（奇/偶/无）。用于简单的检错，但在工业应用中常被 CRC 取代。
停止位 (Stop Bit)：拉高 1 或 2 个周期。表示一帧结束，并为空闲状态做准备。

1.3、物理层

FPGA 产生的信号只是逻辑上的 0 和 1（TTL电平），要传输出去，需要穿上不同的“外衣”（电气标准），也就是PCB版上的芯片。

标准	传输方式	电平特征	典型距离	拓扑	典型应用
TTL	单端	0~5V	<30cm	点对点	芯片间通信
RS232	单端	±5~±12V	<15m	点对点	老式PC，工控机
RS485	差分	A-B电压差	<1200m	多点/总线	PLC、电表
RS422	差分	4线全双工	<1200m	点对多	较少见，类485

注意：

RS-232 是负逻辑（-12V是逻辑1），但 MAX3232 芯片会自动帮你翻转，你在 FPGA 里只需按正逻辑写。
RS-485 是抗干扰之王，因为它看的是两根线的压差，外界的共模噪声会被抵消。

1.4、FPGA 实现

在设计代码是应特别关注以下影响设计稳定性的细节：

A. 采样策略 (Sampling)

做法：在波特率计数的中间点读取一次 rx_pin。
进阶做法 (过采样)：为提高抗噪能力，例如使用 16 倍波特率的时钟去采样，在中间连续采 3 次，取众数（多数表决）。

B. 跨时钟域 (CDC)

外部进来的 rx 信号是异步的，与 FPGA 的 sys_clk 无关。
必须使用“打两拍”处理，否则状态机会因为亚稳态而跑飞。

C. 波特率误差

公式：DIV_CNT = CLK_FREQ / BAUD_RATE。
如果系统时钟是 50MHz，波特率 115200：
- 50,000,000 / 115200 ≈ 434.02。
- 取整 434，误差非常小，可以忽略。
但如果时钟频率很奇葩，导致除不尽，累积误差可能会导致这一帧的最后一位采样偏移出界。一般来说，累积误差控制在 5% 以内都能正常通信。

二、Verilog代码

为了保证代码的鲁棒性，我们将设计分为三个部分：

UART_RX (接收模块)：关键在于跨时钟域处理（打两拍）和中心对齐采样或者过采样，防止亚稳态和噪声干扰。
UART_TX (发送模块)：相对简单，主要是状态机控制时序。
Top_Loopback (顶层回环)：用于板级验证，接收什么就发送什么。

2.1、接收模块（uart_rx）

核心设计：加入了输入两级寄存器同步（消除亚稳态）和比特中心采样逻辑。

module uart_rx #( parameter CLK_FREQ = 50_000_000, // 系统时钟频率 parameter BAUD_RATE = 115200 // 目标波特率 )( input wire clk, input wire rst_n, input wire rx_pin, // 异步串口输入 output reg [7:0] rx_data, // 接收到的数据 output reg rx_done // 接收完成脉冲 ); // 计算分频计数最大值 localparam CNT_MAX = CLK_FREQ / BAUD_RATE; localparam CNT_MID = CNT_MAX / 2; // 采样点（波特率中心） // 状态定义 localparam IDLE = 0; localparam START = 1; localparam DATA = 2; localparam STOP = 3; reg [1:0] state; reg [31:0] clk_cnt; reg [2:0] bit_cnt; // 消除亚稳态：对异步信号 rx_pin 打两拍 reg rx_d1, rx_d2; always @(posedge clk or negedge rst_n) begin if (!rst_n) begin rx_d1 <= 1'b1; rx_d2 <= 1'b1; end else begin rx_d1 <= rx_pin; rx_d2 <= rx_d1; end end // 下降沿检测（用于检测起始位） wire rx_negedge = rx_d2 & (~rx_d1); always @(posedge clk or negedge rst_n) begin if (!rst_n) begin state <= IDLE; clk_cnt <= 0; bit_cnt <= 0; rx_data <= 0; rx_done <= 0; end else begin rx_done <= 0; // 默认拉低 case (state) IDLE: begin if (rx_negedge) begin // 检测到起始位下降沿 state <= START; clk_cnt <= 0; end end START: begin if (clk_cnt == CNT_MID) begin // 在起始位中间再次确认电平 if (rx_d2 == 1'b0) begin clk_cnt <= 0; state <= DATA; end else begin state <= IDLE; // 误触发，或者是毛刺 end end else begin clk_cnt <= clk_cnt + 1; end end DATA: begin if (clk_cnt == CNT_MAX - 1) begin clk_cnt <= 0; rx_data[bit_cnt] <= rx_d2; // 移位接收 if (bit_cnt == 7) begin bit_cnt <= 0; state <= STOP; end else begin bit_cnt <= bit_cnt + 1; end end else begin clk_cnt <= clk_cnt + 1; end end STOP: begin if (clk_cnt == CNT_MAX - 1) begin state <= IDLE; clk_cnt <= 0; rx_done <= 1'b1; // 接收完成，产生一个脉冲 end else begin clk_cnt <= clk_cnt + 1; end end default: state <= IDLE; endcase end end endmodule

2.2、发送模块（uart_tx）

核心设计：加入了输入两级寄存器同步（消除亚稳态）和比特中心采样逻辑。

module uart_tx #( parameter CLK_FREQ = 50_000_000, parameter BAUD_RATE = 115200 )( input wire clk, input wire rst_n, input wire tx_start, // 发送使能信号 input wire [7:0] tx_data, // 待发送数据 output reg tx_pin, // 串口发送引脚 output reg tx_busy // 忙信号 ); localparam CNT_MAX = CLK_FREQ / BAUD_RATE; localparam IDLE = 0; localparam START = 1; localparam DATA = 2; localparam STOP = 3; reg [1:0] state; reg [31:0] clk_cnt; reg [2:0] bit_cnt; reg [7:0] data_reg; always @(posedge clk or negedge rst_n) begin if (!rst_n) begin state <= IDLE; tx_pin <= 1'b1; // 空闲时为高 tx_busy <= 1'b0; clk_cnt <= 0; bit_cnt <= 0; data_reg <= 0; end else begin case (state) IDLE: begin tx_pin <= 1'b1; if (tx_start) begin state <= START; data_reg <= tx_data; tx_busy <= 1'b1; clk_cnt <= 0; end else begin tx_busy <= 1'b0; end end START: begin // 发送起始位 0 tx_pin <= 1'b0; if (clk_cnt == CNT_MAX - 1) begin clk_cnt <= 0; state <= DATA; end else begin clk_cnt <= clk_cnt + 1; end end DATA: begin // 发送8位数据（LSB first） tx_pin <= data_reg[bit_cnt]; if (clk_cnt == CNT_MAX - 1) begin clk_cnt <= 0; if (bit_cnt == 7) begin bit_cnt <= 0; state <= STOP; end else begin bit_cnt <= bit_cnt + 1; end end else begin clk_cnt <= clk_cnt + 1; end end STOP: begin // 发送停止位 1 tx_pin <= 1'b1; if (clk_cnt == CNT_MAX - 1) begin clk_cnt <= 0; state <= IDLE; tx_busy <= 1'b0; // 释放忙信号 end else begin clk_cnt <= clk_cnt + 1; end end default: state <= IDLE; endcase end end endmodule

2.3、顶层模块（uart_top）

核心设计：将RX的 rx_done 直接作为 TX的 tx_start，实现“收到什么发回什么”的回环测试功能，这是验证串口最快的方法。

module uart_loopback_top( input wire clk, // 连接到 PL 时钟 ( 50MHz) input wire rst_n, // 复位信号 input wire uart_rx, output wire uart_tx ); // 参数定义 parameter CLK_FREQ = 50_000_000; parameter BAUD_RATE = 115200; wire [7:0] rx_data; wire rx_done; wire tx_busy; // 实例化 RX uart_rx #( .CLK_FREQ(CLK_FREQ), .BAUD_RATE(BAUD_RATE) ) u_rx ( .clk(clk), .rst_n(rst_n), .rx_pin(uart_rx), .rx_data(rx_data), .rx_done(rx_done) ); // 实例化 TX // 当接收完成(rx_done)且发送不忙时，启动发送 uart_tx #( .CLK_FREQ(CLK_FREQ), .BAUD_RATE(BAUD_RATE) ) u_tx ( .clk(clk), .rst_n(rst_n), .tx_start(rx_done), .tx_data(rx_data), .tx_pin(uart_tx), .tx_busy(tx_busy) ); endmodule

2.4、引脚约束（XDC）

create_clock -period 20.000 -name sys_clk [get_ports clk] set_property -dict {PACKAGE_PIN U18 IOSTANDARD LVCMOS33} [get_ports clk] set_property -dict {PACKAGE_PIN N16 IOSTANDARD LVCMOS33} [get_ports rst_n] set_property -dict {PACKAGE_PIN T19 IOSTANDARD LVCMOS33} [get_ports uart_rx] set_property -dict {PACKAGE_PIN J15 IOSTANDARD LVCMOS33} [get_ports uart_tx] set_property SLEW SLOW [get_ports uart_tx]

对时钟信号、复位信号、uart输入输出信号进行引脚及电平绑定，同时对时钟信号进行时序约束。Slew Rate是压摆率控制输出引脚电平变化的“陡峭程度”，通常默认就是SLOW，可用可不用。

三、上板验证

板卡：正点原子启明星ZYNQ7020
软件：Vivado2019.2
串口助手：XCOM

步骤与结果验证：

参数配置：启动串口调试终端，设置波特率为 115200，8 位数据位，1 位停止位，无校验模式，并打开串口。
数据收发：在发送缓冲区输入指令“ABCD”等回环测试数据并发送。
结果判定：接收缓冲区显示的数据与发送数据一致（参见上图）。此现象表明串口数据环回功能运行正常，链路通信可靠。

Qwen3-VL-WEBUI环境配置太复杂？试试这个一键解决方案

Qwen3-VL-WEBUI环境配置太复杂？试试这个一键解决方案引言作为一名前端开发者，当你突然被分配调试Qwen3-VL接口任务时，是否遇到过这样的困境：花了两天时间配置环境，各种依赖冲突、CUDA版本不匹配、显存不足报错接踵而至，而团队还在不断催促demo演示？这种经历我深有体会——直到发现了一键部署的解决方案。 Qwen3-VL是阿里云开源的多模态大模型，能同时处理图像和文本输入，非常适合构建智能客服、内容审核等应用。但传统部署方式需要： 1. 手动安装Python环境（3.8-3.10） 2. 配置CUDA和PyTorch（特定版本） 3. 解决vLLM等依赖冲突 4. 处理显存分配问题现在通过预置镜像，你可以像启动一个网页应用那样简单部署Qwen3-VL-WEBUI。本文将手把手教你如何用ZEEKLOG星图平台的现成镜像，10分钟内完成部署并测试接口。 1. 为什么选择预置镜像方案 1.1 传统部署的三大痛点我曾用传统方式部署Qwen3-VL-7B模型，遇到了这些典型问题： * 环境依赖地狱：PyTorch 2.1需要CUDA 11.8

前端表格性能优化从0到1：虚拟滚动实现百万级数据流畅渲染

前端表格性能优化从0到1：虚拟滚动实现百万级数据流畅渲染【免费下载链接】Luckysheet 项目地址: https://gitcode.com/gh_mirrors/luc/Luckysheet 你是否曾在处理大型Excel表格时遭遇浏览器崩溃？当数据量突破10万行，传统渲染方式往往束手无策。本文将带你从0到1掌握虚拟滚动技术，解决百万级数据渲染难题，让前端表格操作如丝般顺滑。我们将深入探讨虚拟滚动的实现原理，解析Luckysheet的核心优化策略，为你的前端项目性能优化提供实用指南。问题引入：为什么传统表格渲染不堪重负？核心概要：揭示传统渲染方式在大数据量下的性能瓶颈想象一下，当你打开一个包含100万行数据的表格时，浏览器需要创建多少个DOM节点？如果每一行有100列，那就是1亿个节点！这就像试图用自行车运送一卡车货物，必然会导致严重的性能问题。传统表格渲染方式会一次性将所有数据渲染到页面中，这不仅会占用大量内存，还会导致页面加载缓慢、滚动卡顿，甚至浏览器崩溃。 [!TIP] 研究表明，当DOM节点数量超过10万个时，浏览器的渲染性能会急剧下降，操作延迟可达数

轻量化OCR解决方案：DeepSeek-OCR-WEBUI在边缘设备上的应用

轻量化OCR解决方案：DeepSeek-OCR-WEBUI在边缘设备上的应用 1. 引言：从云端到边缘的OCR演进路径 1.1 OCR技术发展面临的现实挑战光学字符识别（OCR）作为文档数字化和信息提取的核心技术，已广泛应用于金融、物流、教育等多个行业。然而，传统OCR系统多依赖高性能服务器或云服务进行推理，存在响应延迟高、数据隐私风险大、部署成本高等问题。尤其在工业质检、移动巡检、智能终端等场景中，对低延迟、高安全性的本地化处理需求日益迫切。与此同时，主流OCR模型往往体积庞大、计算资源消耗高，难以直接部署于算力受限的边缘设备。如何在保证识别精度的前提下实现模型轻量化与高效推理，成为当前OCR工程落地的关键瓶颈。 1.2 DeepSeek-OCR-WEBUI的技术定位 DeepSeek-OCR-WEBUI 是基于 DeepSeek 开源 OCR 大模型构建的一体化轻量级 Web 推理框架，专为边缘计算场景优化设计。该方案通过模型压缩、硬件适配与前端集成三大技术创新，实现了“高性能+低功耗+易用性”的统一，显著降低了OCR技术在嵌入式设备、

前端科技新闻（WTN-4）你用了免费的 Trae 编辑器吗？排队多少名？我排在1584名

写在前面，怎么说呢？首先是为了支持国产，用于偷懒写git摘要和部分内容的代码补充还是有些效率提升的，但是plan模式，基本上没怎么完成过。可能是项目不太标准的原因，要是做已经成熟的产品副本或许更简单- 突然有了个点子，找那些收费高卖的贵的，出青春版，或许有搞头。也是首次，发现需要排队了，哈哈哈哈哈哈哈哈哈，让我想起某些游戏，付费插队一、技术快讯｜一次普通的 i18n 任务，却排到 1500 名之后最近在使用 Trae 编辑器（免费版）时，遇到了一件颇具“时代特色”的小插曲。我只是想让 AI 帮忙做一个非常常规的工程任务： * 扫描页面组件 * 提取未国际化的中文文案 * 生成 key-value * 替换为统一的 $t('xxx') 调用 * 保证多语言资源文件结构一致点击执行后，编辑器并没有立刻开始处理，而是弹出了一条提示：