llama.cpp 本地部署:显存优化与常见报错排查
在 Windows 环境下使用 llama.cpp 进行本地大模型部署时,记录了从 LMStudio 切换后的常见问题与解决方案。涵盖基础启动脚本编写、GGUF 分片合并、DeepSeek 模型在 SillyTavern 中的推理模板配置及思考模式关闭技巧,以及端口绑定失败的网络排查方案。重点分享了针对 enable_thinking 不兼容问题的自定义 J…
博客作者
开发环境搭建师
357
已发布文章
11K
博客获赞
780K
博客浏览
第 3 页
在 Windows 环境下使用 llama.cpp 进行本地大模型部署时,记录了从 LMStudio 切换后的常见问题与解决方案。涵盖基础启动脚本编写、GGUF 分片合并、DeepSeek 模型在 SillyTavern 中的推理模板配置及思考模式关闭技巧,以及端口绑定失败的网络排查方案。重点分享了针对 enable_thinking 不兼容问题的自定义 J…
探讨了在使用 Qwen3-4B-Instruct 进行 AI 写作时常见的五个误区,包括将指令误作对话、低估上下文长度限制、忽视 WebUI 交互价值、误解 CPU 运行速度以及未充分利用模型参数优势。通过提供具体的提示词优化策略、分段生成技巧及任务设计建议,帮助开发者更精准地控制模型输出,提升长文本逻辑连贯性与代码质量,实现从模糊指令到高质量交付的转变。
OpenClaw 是一款开源 AI 助理工具,支持浏览器操作、电脑控制及 24 小时运行。部署需搭配大模型 API,推荐使用 Coze 平台简化环境配置。核心步骤包括复制官方项目、测试响应、部署保活及配置飞书渠道。建议安装自我进化、浏览器控制、桌面控制等 8 个关键技能以提升效率,并可通过 Awesome-openclaw-skills 扩展更多功能。
AI 编程工具正重塑开发流程。本文对比 GitHub Copilot、Cursor、Windsurf 及 Trae 四款主流工具。实测显示,Cursor 在上下文感知与幻觉抑制上表现优异,适合全栈开发;Windsurf 凭借终端集成与复杂项目重构能力胜出;Trae 在中文语义理解方面具有本土化优势;而传统 Copilot 仍侧重于片段补全。开发者可根据项目复…
GLM-4.7-Flash 基于混合专家架构提供高效推理,针对中文场景深度优化。通过预配置镜像可快速部署,支持 OpenAI 兼容 API 接口。实战演示涵盖基础调用、多轮对话、智能客服及内容生成场景,并包含流式输出优化与错误重试机制,帮助开发者以最小成本实现 AI 能力集成。
MIT 电机模式(Mixed Integrated Torque)通过在同一帧数据中融合位置、速度与扭矩指令实现混合控制。核心在于合理配置 kp、kd 等参数以平衡刚度与阻尼,避免振荡。调试时需遵循先位置后速度的原则,注意 kd 不为零以防失控,并结合 CAN 报文监测电流状态。总结了常见场景的参数设置及故障排查方法,适用于机械臂阻抗控制及力矩调节等应用场景…

**作者:海风 | 日期:2026年3月17日** > 记录了我用 OpenClaw 2026.3.8 搭建 AI 自主模拟炒股系统的完整过程。trader Agent 拥有 5 万元虚拟资金,每天自主选股、自主决策买卖、自主管理仓位——完全不需要人类干预交易决策。 * * 一、背景:为什么让 AI Agent 炒股? 2026 年,AI Agent 已经从…

在人工智能(AI)与增强现实(AR)技术深度融合、加速渗透千行百业的产业浪潮中,深圳企业凭借前沿硬件研发实力与生态构建思维,率先完成从单一硬件供给到全链条系统生态布局的关键跨越,推出AI+AR眼镜应用开放平台。该平台打破行业壁垒,兼容不同厂家的AI/AR眼镜技术方案,彻底解决当前市场核心痛点——市面上多数AI/AR眼镜方案局限于自有品牌闭环,未开放音视频推拉…
简介 **Webnovel Writer** 是由开发者lingfengQAQ创建并维护的开源项目,其核心使命是**为网文作者提供一个基于Claude Code的智能创作系统,专门解决AI写作中的'遗忘'和'幻觉'问题,支持长周期、多章节的连载创作**。在AI辅助写作日益普及的今天,创作者们面临着一个普遍挑战:大型语言模型在处理长篇连续内容时容易遗忘前文细…

* 一百万行代码,没有一行是人写的 2026 年 2 月,OpenAI 公开了一个令整个行业瞩目的内部实验:一个最初只有 3 名工程师的团队,在 5 个月内从零交付了一款拥有内部日活用户和外部测试者的软件产品。这款产品的代码量超过 100 万行,累计合并了约 1500 个 Pull Request,开发耗时仅为传统人类团队的十分之一。最关键的一点是 —— 从…
MI-MBFT:基于多分支融合 Transformer 框架的原始脑电数据运动想象解码增强方法 **全名**:MI-MBFT: Superior Motor Imagery Decoding of Raw EEG Data Based on a Multi-Branch and Fusion Transformer Framework **Authors**…

jQuery 核心知识详解:基础、DOM 操作与插件应用 文章目录 从零开始学 jQuery jQuery 核心知识 一、jQuery 简介:为什么选择它? 核心用途 核心优势 下载与引入 二、jQuery 语法:基础与选择器 常用选择器 ready 方法:确保文档加载完成 三、DOM 元素操作:内容、属性、样式 操作元素内容 操作元素属性 操作元素样式 (…

前言 在数字技术飞速发展的今天,我们常常沉浸于各种高科技带来的便捷与震撼之中,却容易忽视那些曾经陪伴我们成长、承载着时代记忆的旧事物。80 年代的天气预报,便是这样一份珍贵的文化遗产。它以简洁而质朴的方式,传递着天气信息,也传递着那个时代的气息。然而,随着时间的推移,天气预报的形式已经发生了翻天覆地的变化。高清的画面、精准的数据、个性化的推送……这些现代技术…

一、OpenCode 是什么? **Open Source AI Coding Agent**:开源、可自托管、可用任何大模型(Claude / OpenAI / Google / 自建本地模型)的'AI 编程代理',以终端为主界面,同时提供桌面应用和 IDE 插件等形式。 **终端优先 TUI + 桌面应用 + IDE 插件**:你可以在终端里和它聊天、让…

背景说明:Agent Mode 与 MCP 的意义 **Agent Mode** 是 GitHub Copilot 的新形态,它能理解自然语言指令,自动拆分任务,遍历项目文件,执行命令并修改代码,像一个'自主项目助手'一样工作。 **Model Context Protocol (MCP)** 是一套用于 Copilot 调用外部工具的协议标准,让 Agen…
引入方式 内部脚本 将代码定义在 HTML 页面里面。 将 JS 定义在 <script></script> 之间 可以在 HTML 里面的任意位置放置任意数量的 <script></script> 一般放置在 <body> 元素的底部,改善显示速度 外部脚本 额外定义一个 .js 文件,引入到 HTML 里面。 只能包含 JS 文件,不包含 <script…

!在这里插入图片描述 LLaMA 大模型 LoRA 微调实践与心得 随着大模型的发展,越来越多的 AI 开发者开始尝试对开源模型进行微调,以适配垂直场景需求。但由于训练资源昂贵、部署过程繁琐,很多人仍止步于'想做'阶段。 将结合在算力平台上的 LLaMA 模型微调实践,分享完整流程、调优经验以及平台带来的优势,帮助更多开发者低门槛开启大模型实践之路。 一、选…

AI 编程工具选型:Copilot、Cursor、Codex 核心差异 Copilot Copilot 是代码补全领域的代表工具,类似于'代码小秘书'。它在用户编写代码时提供实时补全建议,例如输入 for 循环时自动补全完整结构。它支持多 IDE 环境,包括 VS Code 和 JetBrains 系列,能够无缝对接。然而,Copilot 更擅长代码补全,在…

**摘要** > 2024 年 4 月敲下第一个字,2025 年关注者数量显著增长。这一年,我从 Java 图形化编程的'速通'起步,在 Linux 终端里探索,结束 C++ 的理论学习。更在资深导师的指引下,不仅点亮了'智能体开发'的新技能树,还用 AI 重塑了我的编程与创作流。这是关于技术、AI 与成长的 2025。 📅 前言:起跑与遇见 回望 202…

ESP-SparkBot 是一款基于乐鑫 ESP32-S3 微控制器构建的开源大模型 AI 桌面机器人。该项目集成了语音交互、图像识别、远程遥控与多媒体功能于一体,通过创新的边缘 - 云端协同架构,在低成本硬件上实现了复杂的多模态交互能力,为嵌入式 AI 应用提供了一个高性价比的参考设计。 ![](https://qiniu.meowparty.cn/cod…