
基于 YOLO 与相机运动补偿的单目无人机车辆测速:加权滑动平均速度优化
提出了一种基于置信度加权的自适应速度平滑方法,用于解决固定系数指数滑动平均在无人机测速中因检测噪声、几何不稳定等因素导致的波动问题。通过引入目标框一致性、单应性质量、图像边缘邻近及速度突变门控四个维度的权重,动态调整平滑系数,提升了速度估计的稳定性与物理合理性。该方法适用于复杂斜视场景下的连续目标速度估计。

博客作者
这位作者暂未填写个人简介。
353
已发布文章
13K
博客获赞
758K
博客浏览
第 5 页

提出了一种基于置信度加权的自适应速度平滑方法,用于解决固定系数指数滑动平均在无人机测速中因检测噪声、几何不稳定等因素导致的波动问题。通过引入目标框一致性、单应性质量、图像边缘邻近及速度突变门控四个维度的权重,动态调整平滑系数,提升了速度估计的稳定性与物理合理性。该方法适用于复杂斜视场景下的连续目标速度估计。

对比分析了机器人通讯中主流的 RS485、CAN/CAN FD 及 EtherCAT 三种总线技术。针对低自由度、中高自由度及超高自由度机器人的不同需求,阐述了各方案的优劣。RS485 成本低但实时性差;EtherCAT 性能极致但拓扑风险高且开发复杂;CAN FD 在成本与性能间取得平衡,适合升级路径。结论指出不存在唯一最优解,需根据项目预算、实时性及可靠…
基于 MC.JS WEBMC 1.8.8 PLUS MOBILE 构建在线教育平台的技术方案。通过浏览器实现 3D 编程环境,降低学习门槛。项目包含基础教学框架、渐进式任务体系、辅助功能及作品展示区。采用响应式设计适配多端,优化移动端触控体验。利用截图 API 和 localStorage 实现作品保存与持久化。部署流程便捷,支持即开即用,有效缩短备课时间,…

一个基于 SpringBoot2 和 Vue3 的桂林旅游景点导游平台系统。系统采用前后端分离架构,后端使用 MyBatis-Plus 和 MySQL8.0,前端利用 Vue3 响应式特性。主要功能包括景点信息展示、用户评论管理、路线推荐及订单管理。文章详细阐述了系统架构、技术栈选型以及核心数据表设计,旨在为游客提供一站式旅游服务,提升体验便捷性与个性化。
2026 年 Python 已进化为全球数字生态核心基础设施语言。在 AI 与大模型领域,凭借 PyTorch、TensorFlow 等框架垄断及高效开发体验,成为开发者首选。同时覆盖数据科学、自动化运维及 Web 开发场景,维持全场景通用胶水语言特性,呈现一核多翼、优势固化的发展格局。
介绍基于 Qwen3-0.6B-FP8 模型构建跨平台 AI 助手的方案。通过 vLLM 部署模型,利用 FastAPI 创建统一后端,集成 Web(Chainlit)、Telegram 及 Discord 前端。实现了多端请求转发、对话历史管理及资源监控,并提供一键启动脚本简化部署。实测显示响应速度快,资源占用低,适合中小规模应用。

记录了 NewStarCTF2025 Week2 Web 赛道的五道题目解题过程。涉及环境变量泄露、自定义加密(Atbash+Rot13+Base64)、动态 Session 数学验证、文件包含及前端绕过、SQLite 联合注入等知识点。提供了相应的 Python 脚本和 Payload 示例。

一款基于ChatGPT学术版的论文写作辅助工具。该平台提供从大纲生成、文献综述、正文撰写到查重降重及答辩准备的全流程服务。支持多格式数据上传与分析,可自动生成学术规范图表。具备全学科适配能力,涵盖文理工医经管等领域,并内置高校主流查重数据库与格式模板。旨在提升学术创作效率,降低机械性工作负担。

回顾了 CCF-CV 主办的《打造大模型时代的可信 AI》论坛。活动背景聚焦于 AI 技术快速发展伴随的安全隐患,如数据泄露、深度伪造等。论坛邀请了金耀辉、何延哲、谢洪涛、郭丰俊、赫然等多位专家,分别就生成式 AI 创新与风险平衡、安全检测评估逻辑、深度伪造攻防技术、视觉内容安全应用及生成式 AI 治理等议题展开分享。会议强调了建立监管机制、加强技术研发及国…
Seedance 2.0 是字节跳动发布的 AI 视频生成模型,支持文本、图片、视频、音频多模态输入,可生成约 20 秒电影级视频。具备原生音视频同步、物理级真实运动及专业运镜控制能力。主要通过即梦 AI 平台及 API 接口使用,适用于短视频创作、广告营销及影视预演等场景。目前处于灰度测试阶段,支持中文提示词。

探讨了 AI 技术从模型层向系统层的范式转移。指出 2023-2025 年的 Copilot 架构因不可控、幻觉及任务不稳定等问题难以进入生产环境。当前阶段的共识是 Flow Engineering 取代 Prompt Engineering,通过 Agent Native 架构实现可控 AI。该架构包含规划中枢(Brain)、长期记忆(Memory)和确定…
如何将多个 OpenClaw 系统对接至飞书应用,并通过配置群 ID 实现多机器人自动群聊功能。步骤包括创建应用、拉群添加机器人及配置文件设置。测试表明机器人可响应议题并进行讨论,实现了多智能体协作的基础场景。

介绍前端多语言国际化的核心概念与实施方案。涵盖主流方案选型(i18next, vue-i18n, react-i18next),资源文件组织规范,动态加载策略,以及复数、日期、货币本地化处理。重点讲解 RTL 布局适配、SEO hreflang 优化及内存泄漏预防。提供自动化扫描、API 对接及类型安全配置技巧,帮助开发者构建健壮的多语言系统。

探讨了基于全志 MR100 主控与 CSNP32GCR01-AOW 工业级 SD NAND 芯片的无人机飞控存储方案。针对无人机在恶劣环境下对数据存储可靠性、高耐久性及宽温工作的严苛需求,该方案采用贴片式存储替代传统 TF 卡,解决了振动松动与寿命短的问题。实测显示,该芯片在顺序读写与随机读写性能上满足 4K 视频流及高频日志记录要求,容量真实且数据完整性校…
介绍基于大疆 MSDK 实现无人机视觉引导自适应降落的方案。针对部分机型不支持 FlyTo 功能的问题,采用虚拟摇杆模拟导航至目标点。通过视觉识别计算 X/Y 偏移量,结合高度动态调整下降速度与位置修正阈值。高空允许较大偏差快速下降,低空严格对齐并关闭下视避障,最终实现安全精确着陆。
基于 FPGA 的摄像头采集到 HDMI 显示的完整链路设计。内容涵盖 OV5640 摄像头的工作原理、SCCB 配置协议及 DVP 接口时序;FPGA 端图像采集模块设计,包括行列计数、数据格式转换及时序同步;利用 SDRAM/DDR3 进行帧缓存管理及乒乓操作原理;HDMI 显示输出的 VGA 时序生成、TMDS 编码及驱动芯片选型;最后提供了完整的工程…

在 VSCode 中配置自定义 Copilot Agent 的方法,包括通过右下角菜单进入配置界面,选择工作区或用户数据路径生成 agent.md 文件。此外,还推荐了 awesome-copilot 项目,提供丰富的 Agent、Prompt 及 Skill 模板供参考使用。

对比了 OpenClaw、Coze、Dify 和 n8n 四款主流 AI Agent 工具。通过部署方式、数据隐私、记忆能力、上手难度等八个维度进行分析。Coze 适合快速搭建客服 Bot,Dify 适合有开发团队的私有知识库,n8n 擅长跨平台自动化,而 OpenClaw 则提供私有部署、长期记忆及技能系统,适合内容创作者及独立开发者构建个性化数字员工。文…
介绍如何使用 LLaMA-Factory 将微调后的 LoRA 适配器合并到基础模型中,生成独立可部署模型。核心命令为 llamafactory-cli export,配合 YAML 配置文件完成权重融合。文章详细解析了配置参数、合并流程及常见问题。同时提供了 Transformers、Ollama 及 Hugging Face Hub 三种使用方式,并给出…

深入对比了五种主流深度生成模型:VAE、GAN、AR、Flow 和 Diffusion。涵盖各模型的核心概念、训练损失函数及优缺点分析,并提供了基于 PyTorch 的代码实现示例。适合希望系统理解生成式 AI 原理与应用的开发者阅读。