OpenClaw之Memory配置成本地模式，Ubuntu+CUDA+cuDNN+llama.cpp

优质文章学习记录

07 Apr 2026 — 9 min read

文章目录

背景：Memory不生效的问题
OpenClaw的Memory配置
Ubuntu24.04安装CUDA和cuDNN
编译llama.cpp
- 验证方案1：
- 验证方案2：下载并运行Llama-2 7B模型
安装node-llama-cpp
验证Memory
sqlite-vec unavailable
踩过的坑

承接上文：Windows11基于WSL2首次运行Openclaw，并对接飞书应用，我已经在电脑上安装了OpenClaw，接下来解决Memory问题。走了很多弯路，下面主要讲我总结的正确的安装过程。
总结来说：针对Memory不生效的问题，又不想用OpenAI或Gemini，或者只想单纯的节省token，可以按照如下的方式，设置为local模式：

修改openclaw.json配置
安装CUDA和cuDNN
编译llama.cpp，使用cuda
安装node-llama-cpp
验证

背景：Memory不生效的问题

执行openclaw doctor命令，有如下提示

◇ Memory search Memory search is enabled but no embedding provider is configured. Semantic recall will not work without an embedding provider. Fix (pick one): - Set OPENAI_API_KEY or GEMINI_API_KEY in your environment - Add credentials: openclaw auth add --provider openai - For local embeddings: configure agents.defaults.memorySearch.provider and local model path - To disable: openclaw config set agents.defaults.memorySearch.enabled false Verify: openclaw memory status --deep

这是因为“长期记忆检索”（memory_search）的 provider 只支持 openai | gemini | local，其中 openai/gemini 都需要单独的 API Key（或 remote.apiKey）。
这一块网上的资料很少，且部分缺少上下文。我就决定自己来配置使用本地(local)模式的Memory。

OpenClaw的Memory配置

参考官网上的Memory介绍，我做了如下修改。
1、修改openclaw.json：如下，在~/.openclaw/openclaw.json中，增加/修改如下内容

 "agents": { "defaults": { "model": { "primary": "zai/glm-5" }, "models": { "zai/glm-5": { "alias": "GLM" } }, "workspace": "/home/band/.openclaw/workspace", "compaction": { "mode": "safeguard", "reserveTokensFloor": 20000, "memoryFlush": { "enabled": true, "softThresholdTokens": 4000, "systemPrompt": "Session nearing compaction. Store durable memories now.", "prompt": "Write any lasting notes to memory/YYYY-MM-DD.md; reply with NO_REPLY if nothing to store." } }, "maxConcurrent": 4, "subagents": { "maxConcurrent": 8 }, "memorySearch": { "provider": "local", "local": { "modelPath": "hf:ggml-org/embeddinggemma-300M-GGUF/embeddinggemma-300M-Q8_0.gguf" }, "fallback": "none", "sources": [ "memory", "sessions" ], "experimental": { "sessionMemory": true }, "store": { "vector": { "enabled": true, "extensionPath": "~/.npm-global/lib/node_modules/sqlite-vec/node_modules/sqlite-vec-linux-x64/vec0.so" } } } } }

注意：

modelPath采用官方建议的模型，注意是模型名称，不是本地的目录，我就是在这卡了很久。
extensionPath后文有讲到，修改为本地的目录

Ubuntu24.04安装CUDA和cuDNN

按照官网的教程安装，地址：https://developer.nvidia.com/cuda-downloads

mkdir /opt/nvidia cd /opt/nvidia wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-ubuntu2404.pinsudo mv cuda-ubuntu2404.pin /etc/apt/preferences.d/cuda-repository-pin-600wget https://developer.download.nvidia.com/compute/cuda/13.1.1/local_installers/cuda-repo-ubuntu2404-13-1-local_13.1.1-590.48.01-1_amd64.debsudo dpkg -i cuda-repo-ubuntu2404-13-1-local_13.1.1-590.48.01-1_amd64.debsudo cp /var/cuda-repo-ubuntu2404-13-1-local/cuda-*-keyring.gpg /usr/share/keyrings/sudo apt-get updatesudo apt-get -y install cuda-toolkit-13-1

安装后，还需要设置环境变量

echo 'export PATH=/usr/local/cuda-13.1/bin${PATH:+:${PATH}}' | sudo tee -a /etc/profile.d/cuda.sh echo 'export LD_LIBRARY_PATH=/usr/local/cuda-13.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}' | sudo tee -a /etc/profile.d/cuda.sh source /etc/profile.d/cuda.sh

验证：nvcc --version，提示如下表明已经cuda toolkit安装成功。

安装cuDNN

wget https://developer.download.nvidia.com/compute/cudnn/9.19.0/local_installers/cudnn-local-repo-ubuntu2404-9.19.0_1.0-1_amd64.deb sudo dpkg -i cudnn-local-repo-ubuntu2404-9.19.0_1.0-1_amd64.deb sudo cp /var/cudnn-local-repo-ubuntu2404-9.19.0/cudnn-*-keyring.gpg /usr/share/keyrings/ sudo apt-get update sudo apt-get -y install cudnn

使用如下命令查看安装的目录

# 注意大小写 dpkg -L libcudnn9-cuda-13 dpkg -l |grep cudnn

验证，与前文类似，先安装Anaconda，再安装pytorch，所有工作完成后。执行如下命令：python test_cuda.py

编译llama.cpp

node-llama-cpp 会尝试构建 CUDA / Vulkan / CPU 三种版本，最终 fallback 到 CPU 版成功。为了避免用CPU版本，我先安装调试好CUDA。我估计这一步可以采用官网的指引，Install llama.cpp using brew, nix or winget。
https://github.com/ggml-org/llama.cpp/blob/master/docs/build.md

git clone https://github.com/ggml-org/llama.cpp.git # 前提，要设置好环境变量，DLLAMA_OPENSSL是必要的，后面会有提示 cd llama.cpp cmake -B build -DGGML_CUDA=ON -DLLAMA_OPENSSL=ON cmake --build build --config Release

验证llama.cpp是否已经安装好

验证方案1：

访问： https://huggingface.co/Qwen/Qwen3-0.6B-GGUF/tree/main ，点击Use this model，选择llama.cpp，出现下面的窗口

因为我是再WSL种运行，就选择cli方案：

# Run inference directly in the terminal: ./build/bin/llama-cli -hf Qwen/Qwen3-0.6B-GGUF:Q8_0

如果出现下面的错误，加上-DLLAMA_OPENSSL=ON参数，重新编译llama.cpp。

解决之后又有新的报错。暂时先到这里，没有继续验证，TODO

验证方案2：下载并运行Llama-2 7B模型

# 安装并初始化git-lfs（GIt Large File Storage） $ sudo apt install git-lfs $ git lfs install

这个方案我没有做完。

安装node-llama-cpp

npm install -g node-llama-cpp # 此处官网文档和网上的资料都给了我误导 node-llama-cpp --version # 3.16.1

验证Memory

openclaw gateway restart openclaw memory status --deep

正在下载模型到~/.node-llama-cpp/models，说明已经起作用了。

sqlite-vec unavailable

在openclaw doctor或openclaw memory status --deep，还有个错误。

[memory] sqlite-vec unavailable: /home/band/sqlite-vec.so: cannot open shared object file: No such file or directory

循着网上的信息，找到正主：https://github.com/asg017/sqlite-vec，安装教程在：https://alexgarcia.xyz/sqlite-vec/installation.html，编译教程：https://alexgarcia.xyz/sqlite-vec/compiling.html

# 缺少什么安装什么 sudo apt-get update sudo apt-get install unzip sudo apt install -y libsqlite3-dev git clone https://github.com/asg017/sqlite-vec cd sqlite-vec ./scripts/vendor.sh make loadable

按照官网的编译教程还是有误，就没继续。

我用了一个取巧的办法，

# 先安装，安装的目录在~/.npm-global/lib/node_modules/sqlite-vec/node_modules/sqlite-vec-linux-x64/vec0.so。 # 如果不知道在哪，可以先用whereis node-llama-cpp/pnpm，找到~/.npm-global/bin/，lib在同一个目录 npm install -g sqlite-vec

修改如下配置，重启gateway，再执行openclaw memory status --deep，问题修复

"extensionPath": "~/.npm-global/lib/node_modules/sqlite-vec/node_modules/sqlite-vec-linux-x64/vec0.so"

踩过的坑

安装node-llama-cpp的一些提示

openclaw的文档提示如下：

### [本地嵌入自动下载] - 默认本地嵌入模型：`hf:ggml-org/embeddinggemma-300M-GGUF/embeddinggemma-300M-Q8_0.gguf`（约 0.6 GB）。 - 当 `memorySearch.provider = "local"` 时，`node-llama-cpp` 解析 `modelPath`；如果 GGUF 缺失，它会自动下载到缓存（或 `local.modelCacheDir`，如果已设置），然后加载它。下载在重试时会续传。 - 原生构建要求：运行 `pnpm approve-builds`，选择 `node-llama-cpp`，然后运行 `pnpm rebuild node-llama-cpp`。 - 回退：如果本地设置失败且 `memorySearch.fallback = "openai"`，我们自动切换到远程嵌入（`openai/text-embedding-3-small`，除非被覆盖）并记录原因。

运行openclaw doctor，提示如下

Memory search provider is set to "local" but no local model file was found. Fix (pick one): - Install node-llama-cpp and set a local model path in config - Switch to a remote provider: openclaw config set agents.defaults.memorySearch.provider openai Verify: openclaw memory status --deep

看起来必须要安装node-llama-cpp。于是继续搜寻资料。

cd ~/.openclaw/extensions npm install node-llama-cpp # 此时node-llama-cpp安装到~/.openclaw/extensions/node_modules，没有起作用。 pnpm approve-builds # 提示没有需要编译的:There are no packages awaiting approval npx --no node-llama-cpp inspect gpu # 提示报错

安装node-llama-cpp的前置条件

OpenClaw 依赖 node-llama-cpp，网上说要原生编译安装。需要从源码编译 llama.cpp（大型 C++ AI 库）。所以要先编译llama.cpp，还依赖CUDA和cuDNN。所以正确的安装顺序是：

安装CUDA
安装cuDNN
编译llama.cpp
原生编译安装node-llama-cpp

# https://github.com/withcatai/node-llama-cpp.git sudo apt-get update sudo apt-get install build-essential cmake git libstdc++6 libgomp1 npx node-llama-cpp source download npx node-llama-cpp source build

当我尝试执行npx node-llama-cpp source download，一直报错。
此时我再尝试执行npx --no node-llama-cpp inspect gpu，能正确执行，但是报错如下。让我很意外，怀疑是因为我把llama.cpp已经编译成功的缘故。

Vulkan: Vulkan is detected, but using it failed To resolve errors related to Vulkan, see the Vulkan guide: https://node-llama-cpp.withcat.ai/guide/vulkan

Using `node-llama-cpp` With Vulkan

这个问题是在处理node-llama-cpp时遇到的，目前看没有影响，后面也没处理。

关键词：openclaw, Memory_search, node-llama-cpp, 本地模式，cuda等

马年新春｜AIGC快速生成企业新春营销素材（附Python实操+效果论证）

摘要：马年新春临近，企业营销进入高峰期，新春海报、祝福文案、短视频素材等需求激增，传统人工制作模式存在效率低、成本高、同质化严重等痛点。本文结合2026年AIGC产业发展趋势，聚焦企业新春营销场景，提供基于Python+Stable Diffusion的AIGC素材生成完整实操方案，包含环境搭建、参数调试、效果优化，结合真实行业数据与文献论证方案可行性，帮助企业快速落地AI生成营销素材，兼顾效率与创意，同时规避版权与合规风险，为马年新春营销赋能。本文所有引用内容均标注下划线，确保引用规范且无链接，原创度达标。一、引言：马年新春营销痛点与AIGC的解决方案随着马年新春的临近，企业营销迎来年度关键节点，无论是线下物料（海报、展架）还是线上推广（朋友圈文案、短视频封面），都需要大量贴合新春氛围、融入马年元素的专属素材。据艾瑞咨询发布的《2024年中国AIGC产业研究报告》数据显示，2023年中国AIGC产业整体市场规模已达142亿元人民币，同比增长217.8%，其中营销场景占比超30%，成为AIGC应用最广泛的领域之一下划线[1]。当前企业新春营销素材制作普遍面临三大痛点：一是效

AIGC联动PS黑科技：一张原画秒出Spine 2D骨骼动画拆件级PSD

我们正在冲刺一款二次元风格的横版动作抽卡手游。下周二，发行商要来看最新SSR女角色的“大招动画”实机演示。结果，原定外包团队交上来的拆件PSD文件出了大纰漏——外包不仅把层级合并错了，而且所有被遮挡的身体部位（比如被大剑挡住的胸口、被头发遮住的肩膀）完全没有做“补图”处理！主美咆哮着说：“这怎么绑骨骼？角色一转身或者头发一飘，底下的透明窟窿就全露出来了！周末必须把这套极其复杂的哥特洛丽塔裙装加双马尾角色重新拆件、完美补图，周一早上我要看到她在Spine里生龙活虎地动起来！” 做过2D骨骼动画的兄弟们都懂，立绘拆件和补图，简直就是2D美术管线里的“顶级酷刑”。如果在传统的2D工作流里，你要处理这么一张高精度的二次元角色，过程能把人逼疯。首先，你得在绘画软件里，拿套索工具把头发分为前发、中发、后发、鬓角，把手臂分为大臂、小臂、手掌，把裙子分为前摆、侧摆、后摆……足足拆出上百个图层；这还不算完，最绝望的是“补图”。当你把前面的手臂单独抠出来后，身后的衣服上就会留下一个巨大的空白窟窿。为了让动画运转时没有死角，你必须纯手工、用画笔去脑补并画完那些原本看不见的衣服褶皱、身体结构和光影。

Lingyuxiu MXJ LoRA集成教程：嵌入Stable Diffusion WebUI插件方案

Lingyuxiu MXJ LoRA集成教程：嵌入Stable Diffusion WebUI插件方案 1. 为什么需要这个LoRA引擎？——从“想画出她”到“真的画出来” 你有没有试过在Stable Diffusion里输入“温柔的东方少女，柔光侧脸，细腻皮肤，电影感胶片色调”，结果生成的脸部模糊、光影生硬、发丝粘连，甚至五官比例奇怪？不是模型不行，而是通用底座模型（如SDXL）并不天然懂“Lingyuxiu MXJ”这种高度风格化的审美语言。 Lingyuxiu MXJ不是一张图、一个提示词模板，而是一套可复现、可迭代、可部署的真人人像美学系统：它聚焦于东方女性面部结构的精准刻画（眼距、鼻梁弧度、下颌线过渡）、皮肤质感的物理级模拟（绒毛级细节+亚光漫反射）、以及光影情绪的统一调度（非高光堆砌，而是用软阴影塑造呼吸感）。这套风格无法靠调参或换Lora随便凑出来——它需要被“教懂”，而本项目，就是那个把“

提升开发效率：如何在VsCode中完美配置GitHub Copilot（含settings.json详解）

提升开发效率：VsCode与GitHub Copilot深度集成实战指南在代码编辑器的演进历程中，GitHub Copilot的出现无疑是一次革命性的突破。作为AI驱动的编程助手，它正在改变开发者与代码交互的方式。但很多用户仅仅停留在基础功能的使用层面，未能充分发挥其潜力。本文将带你深入探索如何通过精细配置settings.json文件，让Copilot真正成为你的编码"副驾驶"。 1. 环境准备与基础配置在开始高级配置之前，确保你的开发环境已经做好充分准备。首先需要检查VsCode的版本是否在1.60以上，这是支持Copilot所有功能的最低要求。同时，建议安装最新版本的Git，因为Copilot的部分功能会与版本控制系统深度交互。安装Copilot扩展非常简单： 1. 在VsCode中按下Ctrl+Shift+X(Windows/Linux)或Cmd+Shift+X(Mac)打开扩展面板 2. 搜索"GitHub Copilot" 3. 点击安装按钮安装完成后，你会注意到编辑器右下角出现Copilot的图标。点击它并完成GitHub账号授权是使用服务的前