Read more

什么是 PX4?无人机开发的第一步

什么是 PX4?无人机开发的第一步

本文是《从零开始学 PX4:无人机开发全流程实战》系列第一篇,带你迈出无人机飞控开发的第一步。适合零基础、有嵌入式/C++背景的开发者。 ✈️ 一、PX4 是什么? PX4 是一套开源的飞控系统(Flight Control System),适用于多种类型的无人机与机器人。它不仅仅是一个固件,而是一个完整的无人系统开发生态,包括飞控软件、仿真平台、通信协议、地面站和开发工具链。 📌 PX4 的组成: * ✅ PX4-Autopilot:飞控固件主仓库(C++ 开发) * ✅ QGroundControl:图形化地面站,便于调参与监控 * ✅ MAVLink:轻量级通信协议 * ✅ Gazebo / jMAVSim:仿真模拟器 * ✅ MAVSDK / MAVROS:无人机接口(支持 Python / C++ / ROS) 顶层软件架构 下面的架构图对 PX4 的各个积木模块以及各模块之间的联系进行了一个详细的概述。

Qwen3Guard-Gen-WEB本地部署指南,无需GPU也能跑

Qwen3Guard-Gen-WEB本地部署指南,无需GPU也能跑 你是否试过部署一个安全审核模型,却卡在显卡配置上?显存不够、CUDA版本不兼容、vLLM编译失败……这些不是技术门槛,而是现实阻碍。而今天要介绍的 Qwen3Guard-Gen-WEB 镜像,专为“轻量落地”而生——它能在纯CPU环境稳定运行,不依赖GPU,不强制安装CUDA,甚至不需要你手动配置Python环境。只要一台普通笔记本(8GB内存起步),10分钟内就能跑起阿里开源的多语言安全审核大模型。 这不是简化版,也不是阉割版。它完整集成 Qwen3Guard-Gen 架构,支持三级风险判定(安全/有争议/不安全)、覆盖119种语言、输出带解释的结构化结论。更重要的是,它把所有复杂性封装进一个开箱即用的Web界面:不用写代码、不配API、不读文档,输入文本,点击发送,结果立刻呈现。 本文将手把手带你完成从镜像拉取到网页可用的全流程,全程无报错提示、无依赖冲突、无术语轰炸。哪怕你只用过Word和微信,也能照着操作成功。 1. 为什么这个镜像能“无GPU运行”

Qwen3-VL-WEBUI地标识别:旅游AI助手部署教程

Qwen3-VL-WEBUI地标识别:旅游AI助手部署教程 1. 引言 随着人工智能在多模态理解领域的飞速发展,视觉-语言模型(Vision-Language Model, VLM)正逐步成为智能应用的核心引擎。尤其是在旅游、导航、文化导览等场景中,自动识别地标并生成自然语言描述的能力,已成为构建“AI旅游助手”的关键技术路径。 阿里云最新开源的 Qwen3-VL-WEBUI 正是为此类应用量身打造的一站式解决方案。它基于迄今为止 Qwen 系列中最强大的视觉-语言模型 Qwen3-VL-4B-Instruct 构建,内置完整推理界面,支持图像上传、实时分析与交互式对话,特别适用于如“拍照识地标”这类高价值旅游AI功能的快速落地。 本文将带你从零开始,手把手部署 Qwen3-VL-WEBUI 实例,并实现一个可运行的旅游AI助手原型——通过上传地标照片,自动识别地点并生成生动讲解文案。无论你是开发者、产品经理还是AI爱好者,都能在30分钟内完成部署并看到成果。 2. 技术方案选型与核心优势 2.1 为什么选择 Qwen3-VL-WEBUI? 在众多视觉语言模型中,Qw

眼科OCT图像分析:GLM-4.6V-Flash-WEB测量视网膜厚度

眼科OCT图像分析:GLM-4.6V-Flash-WEB测量视网膜厚度 在现代眼科临床实践中,医生每天要面对数十甚至上百张OCT图像。这些高分辨率的横截面影像虽然能清晰展示视网膜各层结构,但手动测量黄斑区厚度、追踪病灶变化的过程却极其耗时且易受主观因素影响。尤其是在基层医院或远程诊疗场景中,专业阅片医师资源紧张,亟需一种既能保持精准度又能快速响应的自动化分析工具。 正是在这样的背景下,GLM-4.6V-Flash-WEB 的出现显得尤为及时。它不是传统意义上的图像分割模型,而是一个具备“看懂图像+理解语言”双重能力的轻量级多模态视觉语言模型(VLM)。这意味着我们不再需要为每个测量任务单独训练一个深度学习网络,而是可以通过自然语言直接向系统提问:“请测量中心凹内核层的视网膜总厚度”,模型就能自动定位目标区域并返回结果——就像一位经验丰富的AI助手实时协助诊断。 模型架构与工作流程:从图像到语义推理 GLM-4.6V-Flash-WEB 基于Transformer的编码器-解码器结构构建,融合了视觉感知与语言理解两大能力。其核心流程并非简单的“输入图像→输出标签”,而是实现了真