
YOLO-DRONE 无人机低空巡检模型实测与电力部署解析
清华大学团队提出的 YOLO-DRONE 模型,该模型入选 CVPR 2026 口头报告。针对无人机低空巡检中小目标漏检、抗扰动差及实时性不足等痛点,模型融合了自适应尺度感知头与风速补偿特征对齐模块。实测数据显示,在 UAV-DT 数据集上小目标召回率显著提升,支持 1080p@45FPS 实时处理,并已部署于省级电力巡检系统。
博客作者
奶茶爱好者
363
已发布文章
8.8K
博客获赞
686K
博客浏览
第 6 页

清华大学团队提出的 YOLO-DRONE 模型,该模型入选 CVPR 2026 口头报告。针对无人机低空巡检中小目标漏检、抗扰动差及实时性不足等痛点,模型融合了自适应尺度感知头与风速补偿特征对齐模块。实测数据显示,在 UAV-DT 数据集上小目标召回率显著提升,支持 1080p@45FPS 实时处理,并已部署于省级电力巡检系统。

一个用于滑坡检测的目标检测数据集,共包含 1660 张无人机遥感图像。数据集划分为训练集(1364 张)、验证集(197 张)和测试集(99 张)。标注类别主要为滑坡泥石流(ID 为 0)。图像支持多种常见格式,标注数据提供 YoloDarknet txt 及 JSON 两种格式,适用于主流目标检测模型。

解析了 OpenClaw 作为数字员工的核心逻辑与技术架构。OpenClaw 不同于传统机器人或对话 AI,具备自主执行与闭环落地能力。其核心架构采用网关 - 节点 - 渠道三层解耦设计,配合纯文本存储、Lane 队列及混合记忆系统,实现分布式扩展与高稳定性。核心能力涵盖系统级执行、多渠道交互、插件化扩展及本地优先安全策略。应用场景覆盖个人效率提升与企业流程…
探讨了前端代码质量保证的重要性及实施方法。通过对比反面教材与正确实践,介绍了使用 ESLint、Prettier、TypeScript 等工具规范代码风格,利用 Jest、Playwright 进行单元测试和端到端测试,并结合 GitHub Actions 实现自动化审查。文章强调在保证质量的同时需平衡开发效率,避免过度工程化,旨在提升代码的可靠性、可维护性…
介绍基于乐鑫 ESP32-C5 开发板的 Moji 2.0 AI 桌面机器人。该设备配备 1.5 寸高清屏和 ES8311 音频方案,支持 Wi-Fi 6 连接及多语言语音交互。核心功能包括离线唤醒、流式对话、声纹识别及接入 DeepSeek、Qwen 等大模型。文章详细阐述了硬件组装注意事项,如麦克风温控与屏幕排线安装,并提供了技术架构与物料清单参考,适合…

如何在鸿蒙(OpenHarmony)平台上适配 Flutter 组件 tavily_dart,以实现 AI 驱动的互联网搜索功能。内容涵盖 Tavily 搜索调度模型原理、环境集成步骤、核心 API 详解及典型应用场景。文章还分析了适配过程中可能遇到的 UI 假死风险及敏感内容合规问题,并提供了相应的解决方案,如增量内容推送和异步 Worker 网关。通过该…

VS Code 内置聊天默认使用 Cody 助手,而 GitHub Copilot Chat 需单独安装扩展。两者在来源、订阅依赖及功能深度上存在差异。内置聊天图标为对话框,Copilot Chat 为帆船图标。关于语言支持,AI 生成内容通常跟随提问语言,UI 界面可通过设置中文包汉化。建议付费用户安装完整 Copilot 扩展以获得最佳体验。
无人机 5.8G 模拟图传的工作原理、电路设计方案及性能分析。内容涵盖信号采集、调制、功率放大及天线发射等核心环节,提供了基于 RTC6705 和 RTC6659E 芯片的具体选型与连接方案。文章还分析了布局布线要点、传输距离、延迟及抗干扰性能,对比了主流产品并评估了 DIY 成本。最后总结了常见故障排查方法及相关法规注意事项,适合 FPV 竞速及巡检场景参…
介绍 Verilog 语言入门基础,涵盖数字电子与 C 语言前提要求。内容包含仿真环境选择(如 Vivado、Quartus),强调路径英文约束。详细阐述设计流程从需求分析到比特流下载。核心语法规则涉及大小写敏感、注释、标识符、数值表示(二进制/八进制等)及数据类型。适合 FPGA 初学者建立代码到硬件的映射逻辑。

利用 AI 智能体辅助完成高校实训项目的流程。通过选择合适的大模型,编写清晰的提示词,可自动生成 C 语言学生成绩管理系统和 React 全栈博客系统。过程涵盖需求生成、代码编写、环境初始化、调试修复及报告输出。相比传统方式,该方法能显著缩短开发时间并保证功能完整性,帮助用户将精力集中于核心逻辑理解而非重复编码。
一套基于 AI Agent 的米家智能家居通用控制方案。该方案支持自然语言理解,可联动 Claude、Cursor 等 AI 助理控制米家设备。核心架构包含 mijiaAPI 驱动、Skill 定义及执行脚本。用户需配置 Python 环境,通过扫码授权登录米家 API。方案具备自愈式环境配置与安全二次确认机制,确保指令本地执行与隐私安全。
介绍利用 Qwen3-ASR-1.7B 模型构建博物馆智能导览系统。该系统通过语音识别、意图理解及知识图谱查询,实现游客语音提问到多媒体内容推送的闭环。文章分析了模型在嘈杂环境下的优势,展示了系统架构、核心代码实现(Python)及无障碍参观等扩展场景,并提供了落地部署建议。

介绍 WebGIS 开发中 WKT 转 GeoJSON 的三种方案:基于 PostGIS 数据库函数转换、使用 GeoTools Java 库后台转换,以及利用 wellknown.js 在前端直接转换。结合 Leaflet 地图库演示了如何将转换后的 GeoJSON 数据加载并渲染到地图上,提供了从后端存储到前端可视化的完整技术路径。

SpringAI 是基于 Spring 生态的大模型应用框架,兼容 JDK17 及 SpringBoot 3.x。介绍其核心概念与入门流程,包括依赖配置、ChatClient 构建、同步与流式调用方式。此外涵盖 System 提示词设定、日志记录增强以及基于 AOP 的会话记忆功能实现,帮助开发者快速集成大模型能力至 Java 项目中。

总结了 Vue 3 开发中常见的 20 道面试题,涵盖 Composition API、响应式系统(ref/reactive)、生命周期钩子、组件通信、Teleport、Suspense 等核心知识点。内容包含详细解释与代码示例,适合前端技术面试准备。

阐述了 FPGA 开发中 JTAG 接口的两大核心作用:下载配置代码与在线调试波形。通过一个 14-pin 的硬件设计实例,展示了 JTAG 接口电路图及其包含的四大核心信号基础。
介绍基于 SpringBoot、Vue、Netty 和 WebRTC 实现实时视频聊天的完整方案。核心架构利用 SpringBoot 作为信令服务器,Netty 处理高并发 WebSocket 连接,负责交换 SDP 和 ICE 候选信息;客户端通过 WebRTC 建立点对点(P2P)音视频传输,借助 STUN 服务器解决 NAT 穿透问题。文章详细阐述了…

基于FPGA的CARRY4抽头延迟链TDC的设计与仿真。利用Xilinx FPGA中CARRY4进位单元的固定低抖动级联延迟构建延迟线,通过锁存信号传播位置实现亚纳秒级时间测量。单级进位延迟约10-30ps,结合粗计数拓展动态范围。文章分析了CARRY4单元结构、抽头延迟链工作原理及Verilog行为建模,展示了硬件实现高精度时间测量的优势。
IBM WebSphere Application Server 中的反序列化漏洞 CVE-2015-7450。该漏洞存在于 JMX 通信协议中,允许攻击者通过 SOAP 接口发送恶意序列化数据。受影响版本主要为 7.0 和 8.5。漏洞利用涉及 Apache Commons Collections 库的 InvokerTransformer 类,可导致任意…
对比了 AMD Xilinx FPGA 开发的两种主流流程:Vivado 自底向上硬件构建流与 Vitis 自顶向下软件加速流。Vivado 流适合板卡设计者,需手动管理 IP 核集成与时序;Vitis 流适合算法加速者,利用 C++ Kernel 和 XRT 实现软硬件解耦,支持快速迭代。文章详细解析了 HLS、OpenCL 及 C++ Kernel 在现…