《从零搭建自主无人机》—2——硬件设备搭建及EGOPlanner实现

《从零搭建自主无人机》—2——硬件设备搭建及EGOPlanner实现

一、主要参考:

ZJU-FAST-Lab/ego-plannerhttps://github.com/ZJU-FAST-Lab/ego-planner【完结】从0制作自主空中机器人 | 开源 | 浙江大学Fast-Lab_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1WZ4y167me/?spm_id_from=333.1387.favlist.content.click&vd_source=cc27dfcb640aa62a70874f5ec72a2143

二、硬件组成:

这里所用硬件设备:

1、OrangePi 5 MAX/ Inter NUC

2、Holybro Pixhawk 6C

3、Intel RealSense D435i Depth Camera

4、格式4s 2300mah 45C

5、HKSRC 2205-2450KV / T-Motor V2306-2400KV

6、HSKRC 45A / Formula 32 bit 45A

7、乾丰 51466 V2三叶五寸桨

=》备选方案:怪象35机架,银燕2004 2000kv,d90三叶桨,微空micoair743飞控,微空50a电调,4s或6s锂电池。

二、依赖源码安装:

1、安装 Fast-Drone-250 项目:

git clone https://github.com/ZJU-FAST-Lab/Fast-Drone-250 # 若无法 clone,可直接下载 ZIP 并解压 cd Fast-Drone-250/

2、realsense驱动安装:

sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-key F6E65AC044F831AC80A06380C8B3A55A6F3EFCDE || sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv-key F6E65AC044F831AC80A06380C8B3A55A6F3EFCDE 
sudo add-apt-repository "deb https://librealsense.intel.com/Debian/apt-repo $(lsb_release -cs) main" -u
sudo apt-get install librealsense2-dkms sudo apt-get install librealsense2-utils sudo apt-get install librealsense2-dev sudo apt-get install librealsense2-dbg

然后运行realsense-viewer进行测试一下

3、安装ceres与glog与ddyanmic-reconfigure

解压 3rd_party.zip 压缩包,进入glog文件夹打开终端

cd glog ./autogen.sh && ./configure && make && sudo make install
sudo apt-get install liblapack-dev libsuitesparse-dev libcxsparse3 libgflags-dev libgoogle-glog-dev libgtest-dev

进入ceres文件夹打开终端:

mkdir build cd build cmake .. sudo make -j4 sudo make install sudo apt-get install ros-noetic-ddynamic-reconfigure

4、编译项目,仿真测试:

cd ~/Fast-Drone-250 catkin_make source devel/setup.bash # 测试运行 roslaunch ego_planner single_run_in_sim.launch 

在Rviz仿真:

三、实测:

分别在树林车库环境实机测试=》

四、总结:

参考:规划框架 | EGO planner 规划算法流程与ROS仿真_egoplanner-ZEEKLOG博客https://blog.ZEEKLOG.net/m0_61750953/article/details/144130349?ops_request_misc=&request_id=&biz_id=102&utm_term=egoplanner&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-0-144130349.142^v102^control&spm=1018.2226.3001.4187

高飞老师组的px4ctrl理解-ZEEKLOG博客https://blog.ZEEKLOG.net/m0_50633073/article/details/134885408?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522839fe5c3649219f8bd9bb539e7c8fb02%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=839fe5c3649219f8bd9bb539e7c8fb02&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~top_click~default-2-134885408-null-null.142^v102^control&utm_term=px4ctrl&spm=1018.2226.3001.4187

Read more

Qwen3-TTS部署教程:Qwen3-TTS与Whisper ASR构建双向语音对话系统

Qwen3-TTS部署教程:Qwen3-TTS与Whisper ASR构建双向语音对话系统 想象一下,你对着电脑说一句话,电脑不仅能听懂,还能用自然、有感情的声音回答你,整个过程流畅得就像在和朋友聊天。这听起来像是科幻电影里的场景,但现在,通过Qwen3-TTS和Whisper ASR这两个强大的开源模型,我们完全可以自己动手搭建这样一个系统。 今天,我就带你一步步实现这个目标。无论你是想做一个智能语音助手,还是想为你的应用增加语音交互功能,这篇教程都会给你一个清晰的路线图。我们会从最基础的部署开始,到最终实现一个能听会说的双向对话系统。 1. 准备工作与环境搭建 在开始之前,我们先来了解一下今天要用到的两个核心工具。 Qwen3-TTS 是一个强大的文本转语音模型。它最吸引人的地方在于,它支持10种主要语言,包括中文、英文、日文等,还能生成多种方言和语音风格。更厉害的是,它能理解你文本里的情感和意图,自动调整说话的语调、语速,让生成的声音听起来特别自然。 Whisper ASR 则是OpenAI开源的语音识别模型,它的识别准确率非常高,支持多种语言,而且对带口音、有噪声

2025终极指南:whisper.cpp跨平台语音识别部署全流程

2025终极指南:whisper.cpp跨平台语音识别部署全流程 【免费下载链接】whisper.cppOpenAI 的 Whisper 模型在 C/C++ 中的移植版本。 项目地址: https://gitcode.com/GitHub_Trending/wh/whisper.cpp 还在为语音转文字服务的网络延迟和高成本烦恼?whisper.cpp作为开源语音识别解决方案,提供了本地化部署的完美选择。本文将带你深入了解如何在不同平台上快速部署和使用这个强大的离线语音识别工具。 通过本文,你将掌握: * 多平台环境配置的一键安装方法 * 模型下载与优化的性能调优技巧 * 常见部署问题的快速解决方案 * 监控与维护的最佳实践 平台选择:找到最适合你的方案 平台类型安装难度推理速度内存占用适用场景Windows桌面⭐⭐1.2x1.1GB个人使用Linux服务器⭐⭐⭐1.5x0.9GB企业部署macOS开发⭐2.0x0.7GB移动应用Android设备⭐⭐⭐⭐0.8x0.5GB边缘计算 环境搭建:快速启动的完整步骤 基础环境准备

AIGC 新势力:探秘海螺 AI 与蓝耘 MaaS 平台的协同创新之旅

AIGC 新势力:探秘海螺 AI 与蓝耘 MaaS 平台的协同创新之旅

探秘海螺AI:多模态架构下的认知智能新引擎 在人工智能持续进阶的进程中,海螺AI作为一款前沿的多功能AI工具,正凭借其独特的多模态架构崭露头角。它由上海稀宇科技有限公司(MiniMax)精心打造,依托自研的万亿参数MoE大语言模型ABAB6.5以及MiniMax语音大模型,展现出非凡的技术实力与应用潜力。MiniMax的核心团队源自商汤科技等业内知名企业,在多模态大模型研发领域深耕细作,为海螺AI的诞生奠定了坚实基础。 在这里插入图片描述 一、核心模型架构剖析 (一)基础模型:abab - 6.5 海螺AI的基础模型abab - 6.5采用了创新的混合专家系统设计,借助动态路由机制,即Sparse Gating Network,可依据输入内容智能激活8 - 12个子专家模型。这些子专家模型涵盖代码专家、多语言专家、逻辑推理专家等,各司其职,协同作业。在参数规模上,abab - 6.5总参数量高达1.2万亿,同时通过巧妙的设计,将活跃参数量控制在2000亿/query,有效平衡了模型的高容量与低推理成本。在训练优化环节,

Llama-Factory微调Qwen2.5-VL从数据集制作到部署记录

Llama-Factory微调Qwen2.5-VL从数据集制作到部署记录 电脑环境配置: 1.ubuntu24 2.3090(24G) 3.Cuda==12.9 一、数据集制作 我的数据集主要是对图像内容进行描述 1.Label-studio制作数据集 这是最原始的从零开始制作数据集的方法,不建议这样做! 安装完label-studio后,输入指令启动 label-studio start 进入浏览器界面 创建项目:Create Project,引入图片后,选择图像描述数据集制作(Image Captioning) 2.利用Qwen2.5-VL半自动制作数据集 既然qwen本身具有较好的图像描述能力,那我们可以先使用qwen进行图像描述,在此基础上进行复核修改,这样做可以减少人力成本。 我这编写的脚本如下: import torch from modelscope import Qwen2_5_VLForConditionalGeneration, AutoTokenizer, AutoProcessor from