FPGA Debug：PCIE XDMA没有Link up（驱动检测不到xilinx PCIE设备）使用LTSSM定位问题

优质文章学习记录

08 Apr 2026 — 5 min read

问题现象：

与驱动联调：驱动无法扫描到Xilinx的PCIE设备

通过ila抓取pcie_link_up信号：发现link up一直为低

问题分析：

出现这种情况，在FPGA中搭建测试环境，使用XDMA+BRAM的形式，减少其它模块的影响，框架如下：

1 检查PCIE的时钟

时钟，必须使用原理图上的GT Ref 差分时钟，通过IBUFDSGTE转为单端时钟

2 检查PCIE 复位

复位：PCIE复位信号有要求--上电后，PCIE_RESTN信号需在电源稳定后延迟一段时间再释放，通常是100ms以上

而这100ms的时间，系统主要做以下的事情：

电源稳定时间
参考时钟稳定时间
PCIe IP核的复位和初始化时间
链路训练时间

// 典型的100ms时间分配：
0-10ms : 电源稳定 (Power Stable)
10-20ms : 参考时钟稳定 (Refclk Stable)
20-30ms : 复位释放和PLL锁定 (Reset Release & PLL Lock)
30-50ms : 物理层初始化 (PHY Initialization)
50-70ms : 链路训练 (Link Training)
70-100ms : 设备配置 (Device Configuration)

所以为了避免这个问题，建议在程序中添加这么一段复位控制，但是有的时候你不添加也没有关系，因为有的时候硬件的复位时序可以满足这个100ms的要求，但是保险起见还是加上

3 LANE检查

检查你的LANE约束，一般XDMA IP核生成的时候会自带一个约束文件，约束每个LANE的对外接口，但我们也可以自己约束，保证端口与原理图匹配即可。

这些确认无误，还是无法link up的，先将PCIE降速为1.0 X1，看看情况

4 PCIE降速

如果还是不行，那我们需要检测pcie的相关的几个状态。

5 具体问题定位（PCIE LTSSM状态）

这里我们需要查看PCIE的LTSSM状态机，那什么是LTSSM状态机呢？

是一种常用于PCI Express（PCIe）接口的状态机，它可以控制PCIe总线的传输流程。LTSSM由多个状态组成，每个状态都代表了不同的总线传输阶段。

一般大家会找不到，按照如下的方式

5.1 给LTSSM信号添加debug

首先：勾选配置界面的Use Class Code Lookup Assistant这个选项

此时还是无法在端口显示出LTSSM信号，不要着急，按照你的流程生成IP核，执行完Run Syn操作，然后点击Set up debug

在这里搜索LTSSM的“小写”，就能找到ltssm_state的信号，将其添加到debug里面正常的综合实现就可以了。

5.2 LTSSM状态说明

LTSSM状态机根据厂商不同会有微小的差异，我们使用的是瑞芯微的，我的状态卡在了08即Lane顺序检测。意味着是lane的问题。

那我们通过这个方式监控的除了LTSSM信号以外，还有几个关键信号

5.3 其余关键信号说明

phy_rdy_n：物理层就绪，一种存在性检查，0：表示物理层就绪 1：表示异常

时钟是否存在？

复位序列是否正常？

PLL是否正常锁定？

电源是否power good

cfg_cuurent_speed_o：协商的速率，PCIE1.0/2.0/3.0 分别对应1/2/3

link_width：协商的宽度

6 故障点说明及解决

我的故障就是：

phy_rdy_n为0，说明物理层就绪，时钟和复位是正常的

LTSSM卡在了0x08，且Link_width为0，说明是LANE的异常导致的。

重新检查电路，发现主机的TX端，没有放置电容，而使用的是电阻，导致的AC耦合问题，将电阻更换为电容，链路问题解决

可以看到Link up拉起，驱动可以正常检测到PCIE设备。

前端通用AI rules定义，适用于Cursor ，Trae，Qorder等AI开发工具

前端通用 AI Rules 定义（适用于 Cursor、Trae、Qoder、Windsurf、Zed + AI、Codeium、Copilot 等几乎所有主流 AI 代码助手）以下内容是 2025–2026 年在前端圈被大量验证、反复迭代后相对好用的“通用前端 Rules”模板。你可以直接复制粘贴到 Cursor 的 Rules / Custom Instructions / 项目 .cursor/rules.md 中，或者 Trae、Qoder 等工具的类似位置。推荐的通用前端 Rules 结构（2026 年主流写法） # 前端通用 Rules - 适用于 React / Vue

Kubernetes与AI推理服务最佳实践

Kubernetes与AI推理服务最佳实践 1. AI推理服务核心概念 1.1 什么是AI推理服务 AI推理服务是指将训练好的AI模型部署为可访问的服务，用于实时或批量处理推理请求。在Kubernetes环境中，AI推理服务需要考虑资源管理、性能优化和高可用性。 1.2 常见的AI推理框架 * TensorFlow Serving：Google开源的机器学习模型服务框架 * TorchServe：PyTorch官方的模型服务框架 * ONNX Runtime：微软开源的跨平台推理引擎 * Triton Inference Server：NVIDIA开源的高性能推理服务器 2. GPU资源管理 2.1 安装GPU驱动和NVIDIA Device Plugin # 安装NVIDIA驱动（在节点上执行） apt-get install -y nvidia-driver-535 # 安装NVIDIA Device Plugin kubectl apply -f https://raw.githubusercontent.com/NVIDIA/

Spring AI 实战系列（五）：结构化输出，让大模型严格适配你的业务数据模型

一、系列回顾与本篇定位 1.1 系列回顾 * 第一篇：完成 Spring AI 与阿里云百炼的基础集成，基于ChatModel原子 API 实现同步对话与 API Key 安全注入，跑通Spring AI开发。 * 第二篇：解锁ChatClient，实现全局统一配置与链式调用，彻底告别大模型开发的重复样板代码。 * 第三篇：实现DeepSeek/Qwen双模型共存与动态切换，完成 ChatModel/ChatClient 双版本流式输出，解决长文本生成的用户体验痛点。 * 第四篇：深度拆解Prompt工程全体系，从底层Message手动组装到模板化动态生成，掌握了与大模型高效沟通的核心方法论。系列栏目：Spring AI Spring AI 实战教程（一）入门示例 Spring AI 实战系列（二）：ChatClient封装，告别大模型开发样板代码 Spring AI

保姆级豆包 AI 实战指南：从代码提效到 API 集成，开发者必看的全场景用法 + 避坑指南

保姆级豆包AI实战指南：从代码提效到API集成，开发者必看的全场景用法+避坑指南【本文核心干货速览】本文基于2026年3月最新版豆包实测编写，所有内容均可直接复现，核心干货提前看： 1. 实测验证：豆包代码生成可运行率达89%，稳居国内大模型第一梯队，适配200+编程语言与主流开发框架； 2. 全场景实战：覆盖代码开发、文档创作、多模态处理、IDE插件、API集成5大核心场景，附可直接复用的prompt模板与生产级代码； 3. 独家避坑：拆解豆包使用中10个高频踩坑点与解决方案，规避代码幻觉、API调用异常等常见问题； 4. 选型建议：明确哪些场景优先选豆包，哪些场景不建议用，客观中立无夸大。引言对于开发者而言，AI工具早已从「尝鲜玩具」变成了日常工作的核心提效利器：从基础的CRUD代码编写、线上bug排查，到技术文档撰写、架构方案设计，再到原型图生成、接口自动化测试，一款适配国内开发生态的AI工具，能直接把研发效率提升数倍。而在国产大模型赛道中，豆包凭借零门槛的使用成本、全场景的能力覆盖、对国内开发者生态的深度适配，已经成为很多个人开发者、