
无人机视觉目标检测数据集 VisDrone 详解
VisDrone 是天津大学推出的大规模无人机视觉数据集,涵盖航拍、监控等场景,源自中国 14 个城市。数据集分为训练集、验证集和测试集,共约 8600 张图像。原始标注包含 12 类,其中 ignored regions 因难以标注被遮挡处理,实际可用类别为 10 类,包括行人、车辆等。该数据集适用于小目标检测及密集场景下的鲁棒性优化研究,支持转换为 YO…
博客作者
系统性能优化师
332
已发布文章
11K
博客获赞
895K
博客浏览
第 4 页

VisDrone 是天津大学推出的大规模无人机视觉数据集,涵盖航拍、监控等场景,源自中国 14 个城市。数据集分为训练集、验证集和测试集,共约 8600 张图像。原始标注包含 12 类,其中 ignored regions 因难以标注被遮挡处理,实际可用类别为 10 类,包括行人、车辆等。该数据集适用于小目标检测及密集场景下的鲁棒性优化研究,支持转换为 YO…
基于 SpringBoot、Vue、Netty、WebSocket 和 WebRTC 技术栈的全栈视频聊天系统搭建过程。涵盖后端信令服务实现、前端音视频采集与传输、NAT 穿透原理(ICE/STUN)及全流程测试步骤。提供完整可运行代码,解决端口占用、权限拒绝、信令转发失败等常见问题,并给出集成 TURN 服务器及部署上线的扩展建议。

基于 WebGIS 技术,整合百度天气接口与空间地理数据,对中国十大火炉城市的体感温度进行实证分析。通过后端 MyBatis Plus 查询关联天气与行政区划信息,前端 Leaflet 渲染展示。结果显示长三角地区如杭州、南京、南昌体感温度较高,处于蒸烤模式;而重庆和西安体感相对舒适。该方案为城市热环境评估及规划提供了数据支持。
2026 年初国内多家厂商推出 AI 编程订阅套餐,涵盖火山方舟、阿里云百炼、MiniMax、Kimi、智谱 GLM 及无问芯穹。报告对比了各平台定价、模型支持、额度机制及稳定性。MiniMax 性价比最高,Kimi 多模态优势明显,智谱 GLM 适合重度开发但存在扩容争议,火山方舟和阿里云百炼用户反馈稳定性较差。建议根据预算和场景选择,低预算选 MiniM…
Web 服务核心模型(Apache prefork/worker/event 及 Nginx),详细解析了五种网络 I/O 模型(阻塞、非阻塞、信号驱动、异步、多路复用)的区别与应用场景。重点阐述了零拷贝技术原理及优化手段。最后提供了 Nginx 源码编译安装、平滑升级回滚、配置优化(进程数、CPU 绑定、句柄限制)等实战操作指南,帮助读者掌握高性能 Web…

ToDesk 发布 ToClaw,一款基于 OpenClaw 定制的 AI 助手,集成于最新版 ToDesk 中。该工具支持通过自然语言指令直接操作电脑,如打开软件、填写表单等,结合远程控制功能,允许用户在移动端调度电脑任务。相比传统 AI 仅生成内容,ToClaw 强调任务执行能力,降低了 AI Agent 的使用门槛,无需额外安装或配置环境,旨在推动 A…
FPGA(现场可编程门阵列)的概念,通过比喻解释其与 CPU、ASIC 的区别。阐述了核心组成、工作原理及编程流程。分析了并行处理、可重构等优势,以及成本高等缺点。列举了通信、航天、医疗、AI 等应用场景,并与 CPU、GPU、ASIC 进行对比总结。
对比了大模型驱动地图的两种方案:前端直连模型与完整 MCP 架构。详细解析了 Host、MCP Server 及浏览器的角色分工,通过 Vue、Cesium、Node.js 和 WebSocket 搭建最小化 Demo,演示了从用户输入到地图动作执行的完整链路。重点阐述了为何完整 MCP 更适合扩展与复用,并提供了新手避坑指南与能力扩展建议。

是 Quartus Prime FPGA 开发环境的新手入门指南,涵盖软件安装、工程创建、Verilog 代码编写、编译验证、ModelSim 仿真及硬件下载全流程。重点介绍了 Cyclone IV 系列器件的配置、引脚约束方法及常见错误排查技巧,帮助零基础用户快速掌握从设计到落地的核心逻辑,适合课程设计与基础项目开发参考。

基于 Spring Boot 和 Vue 的前后端实时匹配系统实现。前端使用 Vue 3 和 Vuex 管理状态,通过 WebSocket 建立连接;后端采用 Java Spring Boot,利用 JWT 进行身份验证,并通过 ConcurrentHashMap 维护用户会话。系统实现了匹配池逻辑、游戏地图生成算法以及前后端状态同步,确保用户在匹配成功后能…

多款国内主流 AIGC 工具(如腾讯混元、Holopix AI、即梦 AI、可灵 AI 等)在 2D 游戏美术全流程中的应用。涵盖 UI 设计、道具生成、插画、背景、角色及动画制作。文章详细分析了各工具的核心功能、技术架构、操作流程及适用场景,提供了具体的提示词示例和避坑指南,旨在帮助独立开发者和团队降低美术成本,提升生产效率。

分享了小厂架构师落地 AI Agent 的实战经验,主张放弃全能幻想,从最小可用场景(如 Bug 定位)入手。通过接入错误日志和代码库结构,Agent 能高效辅助修复问题。作者强调 AI 是工具而非魔法,需保持判断力并注重团队协作,最终目标是提升效率以平衡工作与生活。

具身机器人软件系统采用分层架构设计,包含感知层、认知决策层和运动控制层,辅以通信、驱动及系统管理层。感知层负责多传感器数据融合与环境建模;决策层实现任务规划与动态路径规划;控制层确保高精度执行。支撑层保障模块交互与硬件适配。架构设计遵循模块化、实时性、鲁棒性原则,发展趋势包括端云协同、AI 原生及数字孪生联动,为家庭服务、工业制造等场景提供支撑。
介绍 Google Gemma-3-12B-IT 模型的 WebUI 部署流程与使用指南。内容包括模型特性解析、WebUI 访问方法、界面功能说明、参数调节技巧、代码生成示例及常见问题排查。旨在帮助用户快速搭建本地 AI 助手环境,掌握指令微调模型的基础交互与应用场景。

GitHub Copilot 是一款集成在 VS Code 中的 AI 编码助手,支持代码补全、代理模式及自然语言交互。安装设置步骤,并通过构建任务管理应用演示了智能补全、Agent 模式、内联聊天及自定义指令等核心功能,最后提供了多模型切换与隐私配置等高级选项,帮助开发者提升效率。

利用 AI 智能体平台构建费曼学习法知识助手的实践方法。通过定义特定角色设定,助手可执行术语审查、认知缺口挖掘及辅助建构步骤,帮助用户检验知识理解程度。文中提供了光合作用与通货膨胀两个案例的交互演示,并详细阐述了费曼学习法的理论溯源、认知机制及进阶变体,为深度学习策略提供参考。

探讨了人类与大模型在处理'意群'(Chunking)时的异同。人类基于语法、语境和常识主动划分意群,而大模型基于 Token 切分和注意力机制统计概率生成伪意群。文章对比了两者在主动性、灵活性与数据依赖上的区别,并提出了结合两者的英语学习技巧,如分块阅读训练、聚焦语义单元及利用大模型分析复杂句子,旨在通过意群思维提升阅读效率。

提供一份详细的 Linux Web 服务器搭建指南。内容涵盖在 Ubuntu 22.04 和 CentOS Stream 9 系统上安装配置 Nginx 和 Apache 两种主流 Web 服务器软件。教程包括通过 SSH 连接服务器、更新系统、配置防火墙(ufw/firewalld)、管理服务状态以及部署自定义 HTML 网页等关键步骤。旨在帮助开发者从零…
GitHub Copilot 在 Visual Studio Code 中的 AI 代理开发功能。内容包括代理会话的管理、执行方式、任务规划及代码实现。详细说明了如何设置 Copilot、启动首次代理会话,以及利用内联建议、内联聊天和智能行动提升编码效率。此外还涵盖了根据工作流程定制 AI 的方法,如自定义指令和钩子。最后简述了定价与支持信息。

AI 对话应用接口开发,对比同步接口与 SSE 流式输出实现方式。通过 Spring Boot 整合 TravelApp 与智能体 BaseAgent,支持 Flux 及 SseEmitter 流式响应。涵盖前端 Vue3 项目生成、跨域配置及工具提示词优化,实现从后端流式处理到前端实时展示的全流程对接。