LLaMA-Factory 微调至高通 NPU 部署:Qwen-0.6B 全链路移植指南
Qwen-0.6B 模型基于 LLaMA-Factory 微调后,通过 Safetensors 转 PyTorch 再导出为 ONNX 格式,利用 Optimum 库开启 KV Cache 优化。经 Opset 版本调整与静态形状固定后,使用高通 QNN SDK 进行量化编译生成 HTP 后端 Context Binary,最终集成至 Android 项目实…
博客作者
撸猫日常
310
已发布文章
12K
博客获赞
1.1M
博客浏览
第 2 页
Qwen-0.6B 模型基于 LLaMA-Factory 微调后,通过 Safetensors 转 PyTorch 再导出为 ONNX 格式,利用 Optimum 库开启 KV Cache 优化。经 Opset 版本调整与静态形状固定后,使用高通 QNN SDK 进行量化编译生成 HTP 后端 Context Binary,最终集成至 Android 项目实…
GitHub Copilot 在 VS Code 中已演变为多模型驱动的智能编程平台。文章解析了其支持 OpenAI、Anthropic 等多厂商模型的架构,对比了 Free、Pro、Pro+ 等订阅计划的计费差异,重点探讨了 Agent 模式下的动态模型路由与自动升级决策机制。通过规划、执行与验证模型的协作,Copilot 实现了复杂任务的自动化处理,用户…
深圳汇聚了众多机器人企业,覆盖人形智能、工业协作、移动物流及服务清洁等领域。本文整理了优必选、大疆、海柔创新等代表性公司的核心业务与研发坐标,并补充了自动驾驶及互联网大厂的相关布局,为求职者和技术人员提供行业参考。

AIGC 市场正经历快速扩张,涵盖文本、图像及多模态生成。核心挑战包括数据质量清洗、模型偏差缓解及内容真实性验证。通过 Transformers 与 Diffusers 库的实战代码,可掌握微调、生成及检索的关键流程。未来趋势指向垂直领域深化与多模态深度融合,技术落地需兼顾效率与伦理规范。
营销团队面临内容需求爆发与创意产能瓶颈。通过部署 Meixiong Niannian 画图引擎,构建 AIGC 内容流水线。方案涵盖提示词库建设、WebUI 定制权限分组及现有工作流接入。实测显示主图交付周期从 4.2 小时压缩至 18 分钟,错误返工率为零。文章分享了技术选型依据、显存优化策略、落地避坑指南及版权原则,强调工具让专业回归创意本质,实现可复用…
Z-Image Turbo 是一款基于 Diffusers 的轻量级 AI 绘画工具。介绍其本地部署流程,包括镜像下载、环境配置及 WebUI 启动。内容涵盖提示词编写技巧、参数调整策略、LoRA 模型加载方法以及常见问题排查。相比云端方案,本地部署在数据隐私、响应速度和长期成本上更具优势,适合有显卡资源的创作者进行日常创作。
2026 年 3 月 AI 领域发布 6 篇重要论文,涉及 LLM Agent 记忆机制、长上下文搜索策略、医疗真实场景评测、研究型 Agent 验证流程、机器人生成式策略优化及世界模型 sim-to-real 迁移。分析指出 AI 系统发展趋势正从单纯堆叠模型规模转向提升系统稳定性、管理记忆与控制过程,强调真实工作流偏好评估及推理链的可验证性,为具身智能与…

基于射频反向散射技术的无源无线传感器平台 HARVEST,利用无人机辅助读取地下土壤体积含水量和电导率。系统采用钉状探头与地面开口环谐振器天线耦合,无需电池和芯片,成本低廉。通过电磁仿真、实验室测试及玉米田全生育期部署验证,实现了高达 1.8 米高度的可靠探测,支持大规模分布式监测,为精准农业提供数据驱动的土壤健康解决方案。

AirSim 是基于 Unreal Engine 的开源飞行模拟器,支持无人机与自动驾驶汽车仿真。本文详细记录环境搭建过程,包括 UE 4.27.2 版本选择、插件导入配置及 Python API 连接方式。通过 msgpack-rpc 协议实现仿真器与控制端通信,演示了起飞、降落及摄像头窗口配置的具体操作,为后续算法迁移提供基础环境。

DeerFlow 2.0 是字节跳动彻底重写的 Super Agent 调度框架,从深度研究工具演变为 Agent 运行时基础设施。核心特性包括基于 Markdown 的 Skills 系统、支持并行执行的 Sub-Agents、隔离的 Docker Sandbox 文件系统、上下文工程优化及跨会话长期记忆。支持多端接入(IM、终端),提供 Python S…
档详细说明了库卡机器人离线编程软件 OrangeEdit 2.0.14.95 的安装步骤、界面布局及核心功能。内容涵盖系统兼容性检查、KRL 语言基础语法、脚本调试技巧以及仿真视图的配置方法。此外,还介绍了程序导入导出、版本控制集成与团队协作流程,旨在帮助工程师高效完成机器人程序的编写与优化工作。
二次元 AI 绘画涉及多种技术路线,包括本地部署的 Stable Diffusion 及各类在线平台。核心在于模型选择、环境搭建与提示词优化。掌握 ControlNet 与 LoRA 能显著提升画面控制力与角色一致性。常见问题如手指崩坏可通过负面提示词或局部重绘解决。选择合适的工具取决于对画质、成本及可控性的需求平衡。
基于 LLaMA-Factory 框架演示大语言模型 DPO 对齐训练全流程。涵盖从 HuggingFace 数据集加载、格式转换至 JSON、配置自定义数据集信息,到启动 WebUI 进行多卡分布式训练及最终模型合并的关键步骤。重点解决数据预处理规范与显存优化策略,适用于具备基础 Python 环境的开发者快速上手 RLHF 环节中的偏好优化任务。

桌面 AI 助手领域迎来新竞争者。元气 AI 主打 Windows 本地化与易用性,集成飞书钉钉,适合普通用户;OpenClaw 基于 Node.js 开源架构,支持多平台多渠道,适合开发者。两者在部署方式、扩展性及本地化支持上各有侧重。选择取决于技术背景与具体办公场景需求。
HTML5 与 AI 技术融合正在重塑前端开发模式,从静态展示转向智能交互。探讨了 HTML5 核心特性与 AI 应用的结合方式,包括 Canvas 绘图识别、AI 接口封装及智能表单等实战案例。内容涵盖技术选型、性能优化策略(如模型量化、懒加载)以及错误处理机制,旨在帮助开发者构建高效、智能的前端应用。
主要介绍 GitHub Copilot 的网络配置与代理部署方案。涵盖本地代理服务器搭建、Hosts 文件修改、SSH 隧道及 Nginx 反向代理等实用技术。内容涉及正向与反向代理原理、HTTPS 加密传输、DNS 防污染策略以及多云容灾部署模型。通过具体代码示例与配置片段,帮助开发者解决网络连接问题,优化开发环境稳定性,实现高效安全的代码辅助体验。

OmniInsert 提出了一种无需掩码的视频插入框架,利用扩散变换器模型解决数据稀缺、主体场景平衡及融合和谐三大挑战。通过 InsertPipe 构建多样化数据集,结合条件特征注入与渐进式训练策略,配合主体聚焦损失和偏好优化,显著提升了插入主体的保真度与自然度。在 InsertBench 基准测试中,其性能优于 Pika-Pro 等商业方案,为视频编辑领域…

智能体工作流导出导入实战:通过 12345 热线分拨场景,演示如何在不编写代码的情况下,将调试好的流程打包为模板文件,并在不同环境间无缝迁移。涵盖节点配置、变量绑定技巧、常见错误排查及多场景复用方法,帮助业务人员快速实现 AI 能力的标准化交付与跨部门共享。
ESP32 开发环境搭建涉及 ESP-IDF 框架安装、工具链配置及分区表管理。通过编译 Blink 程序验证硬件连接,利用 esptool.py 进行固件烧录。Wi-Fi 模块初始化后接入 Home Assistant,借助 MQTT 协议实现设备发现与远程控制。过程中需注意 GPIO 模式设置、波特率匹配及 Flash 加密限制,确保设备稳定运行于智能家…

!在这里插入图片描述 文章目录 大模型 RAG 技术深度解析:从入门到进阶 一、大语言模型(LLM)的三大痛点 1.1 幻觉问题:一本正经地胡说八道 1.2 时效性问题:知识更新不及时 1.3 数据安全问题:敏感信息泄露风险 二、RAG 技术:检索增强生成 2.1 RAG 的定义 2.2 RAG 的架构 2.2.1 检索器模块 2.2.2 生成器模块 三、使…