Unsloth 模型兼容性详解:Llama、Qwen、Gemma 全支持
Unsloth 是一款开源大模型微调框架,支持 Llama、Qwen、Gemma、DeepSeek 等主流架构。通过 PEFT 策略(如 LoRA、QLoRA)实现 2 倍训练速度和 70% 显存降低。提供便捷的 API 加载模型,支持 4-bit 量化及 RoPE 缩放。除 Linux/Windows 外,社区分支还实现了 macOS Apple Sili…
博客作者
MongoDB专家
327
已发布文章
11K
博客获赞
583K
博客浏览
第 6 页
Unsloth 是一款开源大模型微调框架,支持 Llama、Qwen、Gemma、DeepSeek 等主流架构。通过 PEFT 策略(如 LoRA、QLoRA)实现 2 倍训练速度和 70% 显存降低。提供便捷的 API 加载模型,支持 4-bit 量化及 RoPE 缩放。除 Linux/Windows 外,社区分支还实现了 macOS Apple Sili…

如何在本地使用 Cherry Studio 部署 OpenClaw 龙虾机器人。首先准备硅基流动或推理时代的免费 API Key,安装 Cherry Studio、Node.js 和 Git 环境。接着在 Cherry Studio 中配置模型并启动 ClawBot。进阶操作包括通过 npm 安装 ClawHub 并切换阿里云镜像源,安装 tavily-se…

介绍 Stable Diffusion v4.10 及 ComfyUI 整合包的使用指南。内容包括环境要求、不同硬件(Intel CPU、AMD 显卡)的配置方案、常见问题解决及更新日志。旨在帮助用户快速部署本地 AI 绘画工具,无需手动配置复杂依赖。
KoboldAI 的安装与配置方法。KoboldAI 是一款基于浏览器的 AI 辅助写作前端,支持本地和远程模型。提供在线 Colab、Windows 离线及 Linux/Docker 部署方案。主要依赖 Python 环境,包括 transformers、torch 和 Flask。支持冒险模式、写作助手模式和聊天模式三种使用场景。文章还涵盖了性能优化技巧…

机器人设计的核心框架,涵盖感知、决策、执行、支撑四大维度。内容包括机械结构选型(底盘、驱动、外壳)、电源管理、传感器配置(环境/自身状态)、主控硬件(Arduino/STM32/Jetson)及软件算法(PID/SLAM/AI)。此外提供工程实践建议,涉及开发流程标准化、可靠性冗余设计及分阶段成本控制策略,助力开发者从理论到落地高效构建机器人系统。

利用 AI 生成一镜到底视频的技术方法。内容包括理解 AI 一镜到底的核心原理,掌握推进、拉远、环绕等核心运镜技巧,以及编写包含镜头动作、主体、环境氛围和时长的有效提示词。文中对比了多种 AI 视频工具的特点,并提供了将教材插图转化为沉浸式 VR 视频的具体步骤和应用技巧,旨在提升课堂教学互动性。

介绍如何使用 Python 和 LangChain 框架从零搭建一个自动化 Excel 处理 AI 智能体。内容包括环境配置、核心代码编写(工具模块、Agent 逻辑、入口文件)及运行测试。适合希望掌握 Agent 开发的新手,涵盖 OpenAI API 集成、Chroma 向量数据库记忆功能及 pandas/matplotlib 数据处理实战。

详细阐述了 Flutter 结合 OpenHarmony 开发智能家居应用的收尾阶段工作。内容包括多设备(手机、平板、开发板)运行验证、遗留 BUG 排查修复、APP 性能优化(启动速度、内存、图表加载)、规范打包发布流程及开发文档完善。通过具体代码示例和实操步骤,确保应用在鸿蒙生态中稳定运行并具备商业化落地能力。
解读了 DSRL 论文,提出在扩散模型的潜噪声空间进行强化学习以解决样本效率低的问题。通过冻结预训练扩散模型权重,仅训练轻量级 Actor 预测噪声位移,结合 SAC 框架实现策略微调。实验表明该方法在模拟和真机环境中均能显著提升成功率,且无需修改扩散模型内部架构。

万方AIGC检测与其他平台(如知网)的差异,指出通用工具可能无法通过万方检测。对比了嘎嘎降AI、率降、去AIGC等工具的万方适配情况、价格及效果数据。建议用户先确认学校检测平台,选择支持万方的工具,并利用免费额度测试后再付费。主要推荐嘎嘎降AI(多平台适配、达标率高)和率降(性价比高)。
Stable Diffusion 3.5 模型虽强但显存占用高、生成速度慢。介绍通过 FP8 量化技术优化模型,在低成本 GPU(如 RTX 3060/4060)上实现显存占用减半、速度提升约 2.6 倍,且画质几乎无损。结合 ComfyUI 工作流部署,提供提示词技巧与高清修复建议,平衡效率与质量。

Pico 4XVR 1.10.13 版本的功能特点及安装方法。该软件支持高码率视频、蓝光原盘及 3D 播放,兼容内置存储、外接存储和局域网共享。适用于 Pico 设备用户及 VR 影音爱好者,建议保证足够存储空间并使用高速存储设备或千兆网络以获得最佳体验。

深入解析文心大模型 ERNIE 4.5 的开源情况,涵盖模型架构特性、技术分析及部署实践。文章介绍了 ERNIE 4.5 的多模态异构 MOE 结构、高效训练并行架构及后训练策略,并提供了基于 FastDeploy 的详细部署步骤与环境配置指南。通过基础通识、推理、视觉、代码等多维度对比评测,展示了 ERNIE 4.5 在中文理解、指令遵循及多模态任务上的优…
基于 GitHub Actions 为 Whisper-large-v3 语音识别服务搭建持续集成与灰度发布系统的方案。通过自动化工作流实现代码提交后的自动测试,包括单元测试、集成测试及性能测试。采用版本管理器支持多模型共存,结合流量分配策略实现平滑的模型灰度发布与回滚。此外,还包含服务健康监控与性能指标收集机制,确保系统稳定性与服务质量。该方案帮助开发者减…

介绍使用 Vue 3 和 TypeScript 从零构建类似 Dify 的 AI 聊天前端项目。内容涵盖项目初始化、Vite 配置、TypeScript 类型体系设计(消息、文件、Agent 思考过程、工作流追踪)、路由与 SSO 认证流程、Axios HTTP 客户端封装以及 Pinia 状态管理(用户与会话)。重点解决了 SSE 流式输出、Markdow…
在 Ubuntu 22.04 LTS 环境下部署 Gemini QQ 机器人的步骤。采用 OneBot V11 (NapCat) 协议端结合 NoneBot2 框架,集成 Google Gemini Flash 模型实现智能对话。内容涵盖服务器基础环境搭建、Docker 容器配置、Python 虚拟环境及依赖安装、核心业务代码编写、Systemd 服务管理及…

WebMCP 是一种新兴的 Web API 规范,旨在让网页直接暴露 JavaScript 工具供 AI 智能体调用。相比传统后端集成或 UI 自动化,WebMCP 允许前端复用现有逻辑,实现用户与智能体共享上下文和状态。其核心概念包括工具(Tools)、代理(Agent)和人类在环(Human-in-the-Loop)。典型场景涵盖创意设计、智能购物及代码…

Xilinx Virtex-7 FPGA 上 PCIe Gen3 IP 核的配置与使用流程。内容涵盖 7 系列不同 PCIe IP 核(Integrated Block, AXI MM, XDMA)的区别与选型建议,深入解析了 PCIe 数据链路信号(如 m_axis_cq, s_axis_rq)及 tuser 元数据结构。文章提供了 PC 与 FPGA 双…

网易 LobsterAI 0.2.2 支持企业微信和 QQ 机器人接入,通过本地部署 Python 环境并配置 LLM 及 IM 桥接,可实现自动化办公场景。重点讲解工具链配置与避坑指南,适合希望引入 AI Agent 提效的团队或个人开发者。

Isaac Lab 框架下 Robot Lab 库的强化学习配置体系。涵盖配置继承机制、新机器人添加五步流程(资产、Agent、环境配置、注册)及调参策略。重点解析四足、人形、轮式机器人的奖励函数设计差异,如人形需禁用地形课程并强化腾空时间奖励。提供训练测试命令及 TensorBoard 监控方法,帮助开发者快速构建稳定高效的机器人运动控制策略。