什么是 PX4？无人机开发的第一步

优质文章学习记录

09 Apr 2026 — 4 min read

本文是《从零开始学 PX4：无人机开发全流程实战》系列第一篇，带你迈出无人机飞控开发的第一步。适合零基础、有嵌入式/C++背景的开发者。

✈️ 一、PX4 是什么？

PX4 是一套开源的飞控系统（Flight Control System），适用于多种类型的无人机与机器人。它不仅仅是一个固件，而是一个完整的无人系统开发生态，包括飞控软件、仿真平台、通信协议、地面站和开发工具链。

📌 PX4 的组成：

✅ PX4-Autopilot：飞控固件主仓库（C++ 开发）
✅ QGroundControl：图形化地面站，便于调参与监控
✅ MAVLink：轻量级通信协议
✅ Gazebo / jMAVSim：仿真模拟器
✅ MAVSDK / MAVROS：无人机接口（支持 Python / C++ / ROS）

顶层软件架构

下面的架构图对 PX4 的各个积木模块以及各模块之间的联系进行了一个详细的概述。图的上半部分包括了中间件模块，而下半部分展示的则是飞行控制栈的组件。

🧠 二、PX4 能做什么？

PX4 不只是“让无人机飞起来”，它支持多种控制任务，包括自动起降、路径规划、避障、返航、GPS 跟踪等。

能力	说明
自动飞行	自动起飞、巡航、返航、降落
多平台支持	多旋翼、固定翼、VTOL、水下无人机等
传感器驱动	支持 GPS、IMU、激光雷达、光流等
自主任务	路径规划、任务队列、自主决策
数据通信	与 QGC/MAVSDK/MAVROS 实时通信
模块拓展	支持自定义飞行逻辑、传感器、算法模块开发

🆚 三、PX4 vs ArduPilot 区别

两者都是开源飞控，但 PX4 更偏向现代架构与科研开发，而 ArduPilot 更成熟，广泛用于商用系统。

对比项	PX4	ArduPilot
核心语言	C++	C
通信协议	MAVLink	MAVLink
地面站	QGroundControl	Mission Planner
编程架构	模块化，uORB 发布订阅	调度式循环框架
学术友好度	高	一般
仿真支持	Gazebo、jMAVSim、AirSim	SITL、自研仿真器

🧩 四、PX4 架构全景图

PX4 拥有模块化、层次化的系统架构。核心通信机制是 uORB（一种发布/订阅系统），实现了模块间解耦。

[QGroundControl] ⇄ MAVLink ⇄ [PX4-Autopilot] ↑ ↓ MAVSDK / MAVROS 飞控模块（Commander / Navigator） ↓ 传感器驱动 / 电机控制

📌 核心模块包括：

Commander：飞行模式状态机
Navigator：航线导航逻辑
Firmware：飞控主循环逻辑
WorkQueue：任务调度线程池

🎯 五、谁应该学习 PX4？

PX4 是开源、免费、现代化的飞控平台，非常适合以下人群：

类型	场景
学生	毕业设计、无人机竞赛、课程项目
嵌入式开发者	希望参与飞控系统、自动驾驶控制等
ROS/AI 工程师	用于整合路径规划、视觉算法等
飞控厂商	需要二次开发、加装传感器、定制任务
爱好者	DIY 飞行器、地面站、自动控制系统

🧰 六、入门准备清单

项目	推荐
操作系统	Ubuntu 22.04 LTS
开发语言	C++（核心），Python（脚本），Bash
工具链	Git、VSCode、QGroundControl、Gazebo
开发板	Pixhawk 4 / 6C / Holybro / CUAV 等
网络资源	国内网络建议配置镜像或 GitHub 加速

🔜 下一篇预告

下一篇我们将带你进入实战部分：

🛠️如何从零开始搭建 PX4 开发与仿真环境（Ubuntu 22.04）

👉 包括工具安装、PX4 编译、Gazebo 仿真运行、常见报错解决。

春节寒假作业辅导：基于 Rokid 灵珠平台打造 AI Glasses 作业助手

本文应用基于Rokid灵珠智能体/CXR SDK开发，开发指南https://forum.rokid.com/index 文章目录 * 一、引言：为什么我们需要一个 AI Glasses 作业助手？ * 二、方案设计与架构 * 2.1 核心功能定义 * 2.2 端到端架构（AI Glasses） * 2.3 业务流程架构 * 三、开发实战：手把手搭建“作业救星” * 3.1 准备工作 * 3.2 步骤一：创建知识库（资源准备） * 3.3 步骤二：创建智能体（Agent） * 3.4 步骤三：搭建核心工作流（Workflow）

人工智能：大语言模型（LLM）原理与应用实战

人工智能：大语言模型（LLM）原理与应用实战 1.1 本章学习目标与重点 💡 学习目标：掌握大语言模型的核心原理、训练流程与微调方法，学会基于开源大语言模型完成定制化对话与文本生成任务。 💡 学习重点：理解大语言模型的Transformer decoder-only架构，掌握指令微调与RLHF技术，能够使用LoRA高效微调开源LLM。 1.2 大语言模型的核心概念与发展历程 1.2.1 什么是大语言模型 💡 大语言模型（Large Language Model, LLM）是参数量达到十亿级甚至万亿级的Transformer-based模型。它通过在海量文本数据上进行预训练，学习语言的语法、语义、常识和推理能力。 LLM的核心能力包括文本生成、理解、翻译、摘要、问答等。它可以处理复杂的自然语言任务，无需针对每个任务单独设计模型结构。 LLM与传统NLP模型的核心区别： * 参数量级：传统模型参数量通常在千万级，LLM参数量可达十亿到万亿级。 * 训练数据：传统模型依赖标注数据，LLM使用海量无标注文本进行预训练。 * 能力边界：传统模型只能处理单一任务，LL

AI Agent 开发门槛：零基础也能学吗

AI Agent 开发门槛：零基础也能学吗 📝 本章学习目标：本章是入门认知部分，帮助零基础读者建立对AI Agent的初步认知。通过本章学习，你将全面掌握"AI Agent 开发门槛：零基础也能学吗"这一核心主题。一、引言：为什么这个话题如此重要在AI Agent快速发展的今天，AI Agent 开发门槛：零基础也能学吗已经成为每个开发者和研究者必须了解的核心知识。无论你是技术背景还是非技术背景，理解这一概念都将帮助你更好地把握AI时代的机遇。 1.1 背景与意义 💡 核心认知：AI Agent正在从"对话工具"进化为"执行引擎"，能够主动完成任务、调用工具、与外部世界交互。这一变革正在深刻改变我们的工作和生活方式。从2023年AutoGPT的横空出世，到如今百花齐放的Agent生态，短短一年多时间，执行式AI已经从概念走向落地。根据最新统计，

装了 OpenClaw 却不会用？这 20 个 Skills 让你的 AI 助手聪明

更多信息参考 https://zhuanlan.zhihu.com/p/2015223422641259927 有人问：在行者的手中， OpenClaw 能自动抓热点、写文章、发朋友圈，我怎么就只能陪聊？还有有人问："装是装好了，但除了让它写周报，查天气，还能干啥？" 答案很简单：你装的是空壳子，别人装的是完全体。就像你买了台顶配电脑，但里面啥软件都没装。能开机，但干不了活。真正让它变强的，是 Skills。今天这篇，我把自己这两个月玩过的 20 个精选 Skills 全部掏出来。收藏好，照着装，你的 OpenClaw 也能变聪明。一、Skills 到底是个啥？在 OpenClaw 里，助手通过Skills（技能）