一、FPGA到底是什么？？？（一篇文章让你明明白白）

优质文章学习记录

07 Apr 2026 — 6 min read

一句话概括

FPGA（现场可编程门阵列） 是一块可以通过编程来“变成”特定功能数字电路的芯片。它不像CPU或GPU那样有固定的硬件结构，而是可以根据你的需求，被配置成处理器、通信接口、控制器，甚至是整个片上系统。

一个生动的比喻：乐高积木 vs. 成品玩具

CPU（中央处理器）：就像一个工厂里生产好的玩具机器人。它的功能是固定的，你只能通过软件（比如按不同的按钮）来指挥它做预设好的动作（走路、跳舞），但你无法改变它的机械结构。
ASIC（专用集成电路）：就像一个为某个特定任务（比如只会翻跟头）而专门设计和铸造的金属模型。性能极好，成本低（量产时），但一旦制造出来，功能就永远无法改变。
FPGA：就像一盒万能乐高积木。它提供了大量基本的逻辑单元（逻辑门、触发器）、连线和接口模块。你可以通过“编程”（相当于按照图纸搭建乐高）将这些基本模块连接起来，构建出你想要的任何数字系统——可以今天搭成一个CPU，明天拆了重新搭成一个音乐播放器。

“现场可编程”意味着它可以在出厂后，由用户在现场（比如你的实验室）通过软件进行配置，而不需要在芯片工厂里完成。

FPGA是如何工作的？

FPGA的核心组成部分包括：

可配置逻辑块：这是FPGA的基本构建单元，就像乐高积木的一块。每个CLB内部通常包含查找表、触发器和多路复用器等。
- 查找表 是FPGA实现组合逻辑的关键。你可以把它理解为一个预先存储好结果的小型内存。根据输入信号的不同组合，直接输出预先写好的结果，从而模拟出与、或、非等任何逻辑功能。
- 触发器 则用于存储数据，实现时序逻辑（比如计数器、状态机）。
可编程互连：这是连接所有CLB的“导线网络”。通过编程，可以像连接乐高积木一样，将这些CLB以任意方式连接起来，形成复杂的数字电路。
输入/输出块：这些是FPGA与外部世界（如传感器、内存、显示器等）通信的接口。它们可以被配置成不同的电压标准和协议（如LVDS, LVCMOS等）。
其他嵌入式硬核：现代FPGA通常还集成了固定的硬件模块，如：
- 块RAM：片上存储器。
- DSP切片：专门用于高速数学运算（乘加）。
- PLL：锁相环，用于时钟管理。
- 甚至包括完整的硬核处理器（如ARM Cortex-A系列），形成“片上系统”。

编程过程：开发者使用硬件描述语言（如 Verilog 或 VHDL）来描述所需的电路功能。然后通过专用的EDA工具进行综合、布局布线，最终生成一个比特流文件。将这个文件下载到FPGA中，就会配置其内部的CLB和互连资源，从而“创造”出你设计的硬件电路。

FPGA的主要特点与优势

并行处理：这是FPGA最核心的优势。与CPU的串行执行（一条指令接一条指令）不同，FPGA可以同时在芯片的不同区域执行多个任务，就像有很多个小处理器在同时工作，非常适合处理高速数据流。
可重构性：电路功能可以随时被擦除和重新编程。这使得硬件迭代和升级非常方便，也允许同一块FPGA板卡在不同的时间承担不同的任务。
低延迟：由于是硬件直接实现，信号处理路径是确定的，没有操作系统的调度开销，可以实现纳秒级的极低延迟。
能耗效率高：对于特定的任务，用FPGA实现的专用电路通常比用通用CPU执行软件模拟要高效得多。

FPGA的缺点

成本高：相比同等级的CPU，FPGA芯片本身和开发工具都比较昂贵。
开发难度大：需要硬件设计思维和专门的HDL语言知识，与软件开发完全不同。调试也更复杂。
功耗：虽然能效高，但FPGA的绝对功耗可能不小，因为大量资源在同时工作。

FPGA的应用场景

FPGA主要用于需要高性能、高灵活性或快速原型验证的领域：

通信与网络：5G基站、网络数据包处理、高速接口（如PCIe）协议转换。
航空航天与国防：雷达、声纳信号处理，加密解密，以及需要高可靠性和抗辐射的场合。
医疗电子：医疗影像（CT、MRI）的实时重建和处理。
汽车电子：高级驾驶辅助系统、传感器融合。
人工智能与数据中心：作为CPU的加速器，用于神经网络推理、数据库加速等。
原型验证与仿真：在流片制造ASIC之前，用FPGA来验证芯片设计是否正确，可以节省大量成本和时间。
视频与图像处理：4K/8K视频的编解码、转换和处理。

总结：与其他芯片的对比

特性	CPU	GPU	ASIC	FPGA
架构	通用，串行控制	并行，适合大规模简单计算	完全定制，为单一任务优化	可编程，半定制
灵活性	高（通过软件）	高（通过软件）	无	极高（通过硬件配置）
性能	通用任务强	浮点计算强	特定任务极强	特定任务很强，并行性好
能效	中等	中等（计算密集时）	极高	高
开发周期/成本	低	低	极高（NRE成本高）	中等
单位成本	低	中	极低（量产）	高

简单来说：

做通用计算和复杂控制，用CPU。
做大规模并行浮点运算（图形、AI训练），用GPU。
做某个特定功能，且需求量巨大、永不改变，用ASIC。
需要高性能并行处理、快速迭代、或者标准尚未确定，用FPGA。

盘点｜2025 无人机四大顶会最值得阅读的16篇论文（IROS/ICRA/RSS/CoRL）

「在看、在理解、在博弈」目录 01 IROS（4篇） Automatic Generation of Aerobatic Flight in Complex Environments via Diffusion Models Flying on Point Clouds with Reinforcement Learning Perception-aware Planning for Quadrotor Flight in Unknown and Feature-limited Environments PI-WAN: A Physics-Informed Wind-Adaptive Network for Quadrotor Dynamics Prediction in Unknown Environments 02 ICRA（4篇）

Diffusion Transformer(DiT)——将扩散过程中的U-Net换成ViT：近频繁用于视频生成与机器人动作预测(含清华Prediction with Action详解)

前言本文最开始属于此文《视频生成Sora的全面解析：从AI绘画、ViT到ViViT、TECO、DiT、VDT、NaViT等》但考虑到DiT除了广泛应用于视频生成领域中，在机器人动作预测也被运用的越来越多，加之DiT确实是一个比较大的创新，影响力大，故独立成本文第一部分 Diffusion Transformer(DiT)：将扩散过程中的U-Net 换成ViT 1.1 什么是DiT 1.1.1 DiT：在VAE框架之下扩散去噪中的卷积架构换成Transformer架构在ViT之前，图像领域基本是CNN的天下，包括扩散过程中的噪声估计器所用的U-net也是卷积架构，但随着ViT的横空出世，人们自然而然开始考虑这个噪声估计器可否用Transformer架构来代替 2022年12月，William Peebles(当时在UC Berkeley，Peebles在𝕏上用昵称Bill，在Linkedin上及论文署名时用大名William)、Saining Xie(当时在纽约大学)的两人通过论文《Scalable Diffusion Models with Trans

基于深度学习图像分割的无人机洪水灾害图像分割检测与水量估算洪水分割数据集图像分割算法

🌊 洪水检测与水量估算🌊 洪水检测与水量估算 🌊 洪水检测与水域估算该项目专注于利用深度学习技术，从卫星或航空图像中检测受洪水影响的区域，并估算水域覆盖范围。它整合了多种卷积神经网络架构，包括LeNet、ResNet、VGG和U-Net，以执行图像分割和分类任务。该项目专注于利用深度学习技术，从卫星或航空图像中检测受洪水影响的区域，并估算水域覆盖范围。它整合了多种卷积神经网络架构，包括LeNet、ResNet、VGG和U-Net，以执行图像分割和分类任务。该项目专注于利用深度学习技术，从卫星或航空图像中检测受洪水影响的区域，并估算水域覆盖范围。它整合了多种卷积神经网络架构，包括LeNet、ResNet、VGG和U-Net，以执行图像分割和分类任务。 🔍 主要特点🔍 主要特点 🔍 主要特点 * 使用U-Net进行图像分割，以识别水体和洪水淹没区域。使用U-Net进行图像分割，以识别水体和洪水淹没区域。使用U-Net进行图像分割，以识别水体和洪水淹没区域。 * LeNet、ResNet和VGG模型的比较，以评估洪水检测的性能。LeNet、ResNet和VGG模型的

实测Qwen2.5-0.5B极速对话机器人：CPU环境下的惊艳表现

实测Qwen2.5-0.5B极速对话机器人：CPU环境下的惊艳表现 1. 项目背景与技术选型随着边缘计算和本地化AI服务的兴起，轻量级大模型在资源受限设备上的部署需求日益增长。传统的大型语言模型通常依赖高性能GPU进行推理，这限制了其在低成本、低功耗场景中的应用。为解决这一问题，阿里云推出的 Qwen2.5 系列提供了从 0.5B 到 72B 不同参数规模的模型版本，其中 Qwen/Qwen2.5-0.5B-Instruct 是该系列中体积最小、响应最快的一款。本文基于官方发布的 Qwen/Qwen2.5-0.5B-Instruct 极速对话机器人镜像，实测其在纯 CPU 环境下的推理性能与交互体验。该模型经过高质量指令微调，在保持仅约 1GB 模型权重的前提下，具备出色的中文理解能力、逻辑推理能力和基础代码生成能力，特别适合用于本地聊天助手、智能客服前端、教育工具等对延迟敏感的应用场景。核心优势总结：✅ 官方正版模型，支持流式输出✅