
无人机视角山区泥石流与滑坡图像识别数据集介绍
本数据集专注于无人机遥感场景下的山区泥石流与滑坡目标检测任务。包含 1660 张图像,按训练集、验证集、测试集划分为 1364、197、99 张。标注格式支持 YOLO Darknet txt 及 JSON 转换,类别标识为 0。分辨率示例 640x480,适用于深度学习模型训练与评估。
博客作者
静心禅修
348
已发布文章
8.8K
博客获赞
548K
博客浏览
第 1 页

本数据集专注于无人机遥感场景下的山区泥石流与滑坡目标检测任务。包含 1660 张图像,按训练集、验证集、测试集划分为 1364、197、99 张。标注格式支持 YOLO Darknet txt 及 JSON 转换,类别标识为 0。分辨率示例 640x480,适用于深度学习模型训练与评估。
基于 Whisper-large-v3 构建多语言翻译系统,涵盖语音识别、文本预处理、机器翻译及后处理全流程。系统采用模块化设计,支持懒加载翻译模型与英语中转机制,可处理长音频分段及实时流。通过量化、批处理优化性能,适用于跨国会议、视频字幕及客服场景。相比商业服务成本低且灵活可扩展。
VSCode Copilot 自定义指令通过设置 promptPrefix 等配置,引导 AI 生成符合团队规范和项目需求的代码。文章介绍了基础配置方法、不同场景的指令策略、上下文感知机制以及自动化生成 API 和单元测试的高级用法。结合注释模板和设计模式片段,开发者能显著提升编码效率与一致性,适应从前端到云原生的多种开发环境。
Trae 编辑器由字节跳动推出,内置 Doubao 等 AI 模型,支持 Windows、macOS 及 Linux 系统。核心功能涵盖 AI 代码补全、编辑器内对话、自然语言生成代码、代码解释与 Bug 修复。支持跨文件编辑、代码库理解及自定义规则配置。兼容 VS Code 插件生态,支持多种主流编程语言。提供免费版与专业版订阅,旨在提升开发者编程效率。

介绍在 Ubuntu 22.04 系统下,结合 ROS2 Humble 与 Micro XRCE-DDS Agent,完成 PX4 无人机仿真环境的完整搭建流程。涵盖源码获取、依赖安装、Gazebo 配置、代理编译及 offboard 控制测试,解决常见编译错误与通信问题,适用于希望快速上手 PX4 仿真开发的开发者。
Vivado 2022.1 后源文件与生成文件分离,使 Git 管理更清晰。 .srcs 与 .gen 目录区别,演示如何仅提交必要文件至仓库,并通过 clone 快速重建工程,实现 FPGA 设计的标准化版本控制。

NVIDIA GTC 2026 开幕,发布 NemoClaw 平台并确立 Physical AI 主轴。微软开源 AgentRx 解决 AI Agent 调试难题。Anthropic 披露 Claude 完成 70–90% 模型开发代码。大晓机器人开源端侧具身世界模型 Kairos 3.0-4B,推理速度提升 72 倍。北京通用 AI 研究院发布 OmniX…

OpenClaw 因默认配置脆弱存在较高安全风险,AI 代理获取系统权限后可能引发数据灾难。通过全量日志采集、智能关键词告警及长期存储策略,可实现对 AI 行为的可追溯审计。本文分析主要风险点,探讨如何利用日志服务构建安全防线,确保每一行指令都有迹可循,满足合规要求并快速定位异常。

AI 语言大模型基于海量数据预测下一个词,具备对话、推理等通用能力。核心采用 Transformer 架构,参数量达数十亿至万亿级。相比传统模型,支持零样本学习与跨任务泛化,但面临幻觉、高算力成本及安全伦理等挑战。

基于 Spring Boot 和 Vue 的停车场管理系统采用前后端分离架构。后端技术栈包含 Spring Boot、MyBatis、Redis 及 MySQL 8.0,前端使用 Vue 配合 ElementUI。核心功能涵盖用户与车辆信息管理、停车位安排、入场出场登记、车位预约、收费规则配置及权限管理。系统通过柱状图和饼图直观展示车辆统计信息,支持角色资源…
Xinference v1.17.1 在双 RTX 4090 环境下实现 Llama3-70B、Qwen2-VL 与 Whisper-large-v3 并发推理。通过资源隔离与异构调度,显存峰值控制在 93%,首字延迟增幅仅 12%。OpenAI 协议兼容性强,支持 LangChain 无缝集成,证明单节点可稳定承载多模态服务,降低部署成本。

OpenClaw 网络搜索能力涉及 web_search 抽象接口、原生 Provider 与扩展 Skill 的区分。核心在于理解'先搜索找来源,再抓取读内容'的工作流。Tavily 和 Firecrawl 属于需手动安装的扩展 Skill,而 Brave、Gemini 等为原生支持。梳理了标准使用分工、提示词模板及命令行验证方法,帮助开发者避免混淆概念,…

小米发布 MiMo-V2 系列大模型,包含 Pro、Omni 和 TTS 三款产品。MiMo-V2-Pro 拥有超万亿参数,上下文窗口达 100 万 tokens,在 Artificial Analysis 排名中位列全球第 8、中国第 2,性能超越 Claude Sonnet 4.6 且价格仅为五分之一。支持复杂 Agent 工作流及代码生成,提供 API…

基于腾讯云轻量应用服务器部署 OpenClaw 智能体,涵盖镜像选购、模型 API 配置、QQ 及飞书机器人通道对接、Skill 技能安装与使用、日志管理及数据持久化存储等核心环节。通过命令行工具实现自动化运维,提供时间管理与任务执行能力。
Telegram 群组管理机器人通过官方 BotFather 创建,获取 Token 后拉入群组并设置 chat_id。需赋予管理员权限以实现自动回复、广告过滤及定时通知等功能。无需复杂服务器,利用 HTTP 请求即可实现基础自动化管理,提升社群运营效率。

前端开发核心三件套详解,涵盖 HTML 结构标记、CSS 样式布局及 JavaScript 交互逻辑。重点讲解 HTML 常用标签、语义化布局、表单处理及 HTTP 请求基础;深入解析 CSS 选择器、盒模型、Flex 弹性布局及文本样式。适合初学者快速建立前端知识体系,掌握网页构建的基本原理与实战技巧。
Stable Diffusion API 本地部署依赖 NVIDIA 显卡及 Python 环境。通过克隆官方项目并配置启动参数即可启用服务,默认监听 7860 端口。建议设置 Basic Auth 增强安全性,验证接口连通性后可进行图像生成调用,注意模型文件下载及显存管理。

StreamVLN 具身导航复现涉及环境配置、仿真部署及模型推理全流程。本文详细记录了 Conda 环境搭建、Habitat 仿真安装、数据集准备(MP3D、VLN-CE)、模型权重加载与评估脚本修改要点。内容涵盖单卡与多卡分布式训练及评估,展示了在 Unitree Go2 机器狗上的真实世界部署延迟表现,为复现该前沿导航模型提供完整的技术参考。
在 Discord Developer Portal 创建应用并添加 Bot 用户,配置 Privileged Gateway Intents 如 Message Content Intent 以读取消息内容。获取 Bot Token 存入环境变量保障安全,通过 OAuth2 URL Generator 生成邀请链接赋予 View Channels、Read…
2026 年 3 月全球 AI 行业呈现 IPO 集中爆发态势,Anthropic、OpenAI 等头部企业推进上市。模型技术方面,Claude Mythos、GLM-5.1 及 Gemini 3.1 Flash Live 能力跃升,Token 经济学与推理成本优化成焦点。具身智能标准落地,智元机器人等在工业场景实现高精度作业。硬件端算力集群与芯片创新加速,…