
AI 农业创业:基于 ViT 的轻量化病虫害检测系统
一名大学生利用 AI 技术解决农业病虫害检测问题的创业实践。针对传统人工巡检效率低的问题,项目采用 Vision Transformer(ViT)架构进行轻量化改造,结合知识蒸馏与剪枝技术,将模型压缩至 50MB 以内。在 PlantVillage 数据集上训练准确率达 99.44%,支持 ONNX 格式导出及边缘设备部署。未来计划构建多模态融合预测框架,推…
博客作者
御剑飞行
363
已发布文章
12K
博客获赞
708K
博客浏览
第 4 页

一名大学生利用 AI 技术解决农业病虫害检测问题的创业实践。针对传统人工巡检效率低的问题,项目采用 Vision Transformer(ViT)架构进行轻量化改造,结合知识蒸馏与剪枝技术,将模型压缩至 50MB 以内。在 PlantVillage 数据集上训练准确率达 99.44%,支持 ONNX 格式导出及边缘设备部署。未来计划构建多模态融合预测框架,推…
DeepSeek-OCR 是基于大语言模型的多模态理解系统,具备版面感知和上下文理解能力。其 WebUI 的 Docker 部署流程,提供 5 类高频场景提示词模板,包括自由 OCR、文档转 Markdown 及区域定位等。同时分享分辨率档位选择、Gundam 动态裁剪策略及 vLLM 并发调度等吞吐优化实战方案,帮助开发者利用 4090D 单卡实现高效文档…

综述了 2024-2026 年间视觉 - 语言 - 动作(VLA)机器人领域的 10 篇关键论文,分为 5 篇基础理论和 5 篇前沿突破。内容涵盖 RT-2、OpenVLA、NVIDIA GR00T N1 等代表性模型,分析了其架构设计、训练数据策略及泛化能力。文章探讨了从单一任务到开放世界泛化的技术演进,指出数据稀缺、仿真到现实迁移、实时性及安全性是当前核…

介绍如何使用 Chroma、Ollama 和 Llama 3.1 构建本地私有知识库系统。方案采用 RAG 架构,结合向量检索与本地大模型推理。步骤涵盖基础环境安装、Python 依赖配置、文档解析分块、向量化存储及问答服务启动。提供优化建议如隐私保护、性能调优及中文增强,并包含效果验证用例与进阶扩展方向,适合希望部署离线 AI 助手的技术人员参考。
MoltBot 机器人通过 Stream 方式接入钉钉的配置流程。主要步骤包括安装 dingtalk-moltbot-connector 插件、配置 package.json 扩展项、更新 moltbot.json 中的钉钉客户端凭证(AppKey 与 AppSecret)、重启 Gateway 服务,以及在钉钉开发平台将机器人模式切换为 Stream 并禁…

探讨 VR、具身智能与人形机器人的融合趋势。分析了技术原理、系统组成及协同结构,涵盖工业、医疗、教育、军事等应用场景。阐述了商业价值、数据积累及未来发展趋势,指出三者结合将推动人机共生新纪元的到来。

在 NVIDIA Jetson 设备上使用 HuggingFace LeRobot 框架进行端到端机器人学习的完整流程。内容包括硬件环境配置、Jetson Containers 容器化部署、真实机器人(Koch v1.1)的数据采集与遥操作设置、模型训练(ACT 及扩散策略)以及评估方法。教程涵盖了从基础环境搭建到实际部署的关键步骤,支持在边缘设备上快速迭代…
介绍 Z-Image i2L 本地 AI 绘画工具的部署与使用方法。针对在线 AI 绘画的数据隐私问题,该方案通过本地运行保障数据安全。核心原理为底座模型加权重注入,支持 BF16 精度优化及 CPU 卸载策略,降低显存占用。文章涵盖环境准备、界面功能、参数详解(Prompt、Negative Prompt、Steps 等)、实战案例及常见问题解决。适合希望…

DepRadar 是一款针对深度学习库的多智能体协作框架,通过缺陷语义提取、模式生成和影响分析三步流程,结合静态分析与领域规则,精准识别静默缺陷并评估客户端影响。在 Transformers 和 Megatron 库上验证,缺陷识别 F1 值达 95%,影响分析召回率 90%,有效解决依赖升级成本高、缺陷难察觉等痛点,帮助开发者降低维护风险。
介绍 Capacitor 跨平台打包工具的优势、原理及实战教程。阐述其零框架侵入、现代 WebView 支持及原生 API 调用能力。教程涵盖 Vue 项目初始化、平台添加、代码同步、相机插件调用及安装包生成全流程。适合希望快速将 Web 应用转为 iOS/Android 应用的前端开发者。
在 VS Code 远程连接服务器时 GitHub Copilot 无法使用的常见原因及解决方法。主要涉及本地环境确认、服务器网络连通性检查、扩展安装与启用、账号重新登录以及配置验证等步骤。通过排查网络代理、清除缓存及调整设置,可解决大部分连接或认证失败的问题。

一款开源 AI 联网搜索工具 OpenWebSearch MCP。该工具支持多引擎实时搜索(如 Bing、DuckDuckGo 等),兼容 MCP 协议并提供流式响应。它无需 API Key,可自托管且免费,支持 Docker 一键部署。通过配置环境变量和 MCP 客户端,用户可在 Claude、LangChain 等环境中集成实时搜索与文章抓取功能,解决…
腾讯 WorkBuddy 桌面 AI 智能体的一键部署流程,涵盖下载安装、企业微信集成、核心功能体验及技能包配置。内容包含多平台(企微、QQ、飞书、钉钉)接入方法,模型切换与多 Agent 并行的高级配置,以及自动化日报、会议纪要等实战案例。文章对比了其与 OpenClaw 的差异,提供了常见问题解决方案,适合希望实现办公自动化的用户参考。

ASP.NET Core 中的三种主机模型:WebHost、Host 和 WebApplication。WebHost 适用于旧版 Web 项目但已过时;Host 用于非 HTTP 场景如后台服务;WebApplication 是 6.0+ 推荐的现代 Web 主机,支持最小 API。文章提供了代码示例、对比表格及从 WebHost 迁移到 WebAppli…

大语言模型分布式训练的核心挑战及三种并行范式(数据并行、张量并行、流水线并行),详细讲解了基于 DeepSpeed 的 ZeRO 优化器实战,并提供了使用 Optuna 进行超参数自动搜索的方法。内容涵盖硬件选型、集群通信优化及调参最佳实践,旨在解决大模型训练的算力瓶颈与效果优化问题。

AI 绘画中建筑设计提示词的七大核心模块,涵盖主体类型、风格参考、环境场景、材质细节、构图视角、灯光氛围及画质参数。通过分步解析与实战案例,指导用户如何组合关键词生成高质量建筑效果图,并提供权重调整与创意融合技巧。

一种结合 AIGC 与 Photoshop 的高效 2D 角色动画拆件工作流。针对传统流程中层级拆分繁琐及遮挡部位补图困难的问题,提出利用 AI 生成符合动画要求的 A-pose 立绘,通过 Photoshop 对象选择工具快速剥离部件,并使用创成式填充自动修复缺失的底层细节。最后通过 Spine 官方脚本将图层转换为 JSON 数据,完成骨骼绑定与网格形变…

基于 FPGA 的北斗导航系统自适应抗干扰算法的设计与实测。研究包含空域滤波和空时二维联合两种算法,分别在 NIOS II 软核和硬件逻辑中实现。通过数字下变频、权值计算及数据加权模块完成信号处理。实验验证了不同干扰环境下的频谱抑制效果及搜星定位能力,对比 MATLAB 仿真结果确认了 FPGA 实现的正确性与实时性。

对比了 XMLHttpRequest 和 Fetch API 的差异,分析了 XHR 的回调地狱、错误处理模糊等缺陷,以及 Fetch 基于 Promise 的优势。内容涵盖响应处理机制、状态码差异、请求控制能力对比,并提供了渐进式迁移策略、兼容层实现、流式数据处理及性能监控方案,帮助开发者完成前端网络请求的现代升级。

在 Docker 环境下使用 LLaMA-Factory 进行大语言模型全流程训练的教程。内容包括 Docker 容器启动、CUDA 驱动安装、Python 环境配置、LLaMA-Factory 工具部署及模型下载。详细说明了通过配置文件进行监督微调(SFT)的步骤,展示了训练过程中的关键指标监控,并提供了模型加载对话、评估及推理的具体代码示例与命令行操作。