跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
Shell / BashNode.jsAI

OpenClaw Memory 本地模式配置指南:Ubuntu CUDA cuDNN llama.cpp

综述由AI生成解决 OpenClaw 在 Ubuntu 环境下 Memory 搜索不生效的问题。通过配置 openclaw.json 启用本地模式,安装 CUDA 和 cuDNN 环境,编译支持 CUDA 的 llama.cpp,并安装 node-llama-cpp 以支持本地嵌入模型。同时修复了 sqlite-vec 路径问题,实现了无需 API Key 的本地语义检索功能。

BackendPro发布于 2026/4/6更新于 2026/5/2327 浏览

OpenClaw Memory 本地模式配置

执行 openclaw doctor 命令,提示 Memory search enabled but no embedding provider is configured。这是因为长期记忆检索(memory_search)的 provider 只支持 openai | gemini | local,其中 openai/gemini 需要 API Key。本文介绍如何配置使用本地 (local) 模式的 Memory。

OpenClaw 的 Memory 配置

参考官网 Memory 介绍,修改 ~/.openclaw/openclaw.json,增加/修改如下内容:

"agents": {
  "defaults": {
    "model": { "primary": "zai/glm-5" },
    "models": { "zai/glm-5": { "alias": "GLM" } },
    "workspace": "/home/band/.openclaw/workspace",
    "compaction": {
      "mode": "safeguard",
      "reserveTokensFloor": 20000,
      "memoryFlush": {
         
         
         
         
      
    
     
        
     
       
          
       
          
          
       
         
           
           
        
      
    
  

"enabled"
:
true
,
"softThresholdTokens"
:
4000
,
"systemPrompt"
:
"Session nearing compaction. Store durable memories now."
,
"prompt"
:
"Write any lasting notes to memory/YYYY-MM-DD.md; reply with NO_REPLY if nothing to store."
}
}
,
"maxConcurrent"
:
4
,
"subagents"
:
{
"maxConcurrent"
:
8
}
,
"memorySearch"
:
{
"provider"
:
"local"
,
"local"
:
{
"modelPath"
:
"hf:ggml-org/embeddinggemma-300M-GGUF/embeddinggemma-300M-Q8_0.gguf"
}
,
"fallback"
:
"none"
,
"sources"
:
[
"memory"
,
"sessions"
]
,
"experimental"
:
{
"sessionMemory"
:
true
}
,
"store"
:
{
"vector"
:
{
"enabled"
:
true
,
"extensionPath"
:
"~/.npm-global/lib/node_modules/sqlite-vec/node_modules/sqlite-vec-linux-x64/vec0.so"
}
}
}
}
}

注意:

  • modelPath 采用官方建议的模型名称,不是本地目录。
  • extensionPath 需修改为本地的 sqlite-vec 库路径。

Ubuntu 24.04 安装 CUDA 和 cuDNN

按照 NVIDIA 官网教程安装 CUDA。

mkdir /opt/nvidia
cd /opt/nvidia
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-ubuntu2404.pin
sudo mv cuda-ubuntu2404.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/13.1.1/local_installers/cuda-repo-ubuntu2404-13-1-local_13.1.1-590.48.01-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2404-13-1-local_13.1.1-590.48.01-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2404-13-1-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda-toolkit-13-1

安装后设置环境变量:

echo 'export PATH=/usr/local/cuda-13.1/bin${PATH:+:${PATH}}' | sudo tee -a /etc/profile.d/cuda.sh
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-13.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}' | sudo tee -a /etc/profile.d/cuda.sh
source /etc/profile.d/cuda.sh

验证:nvcc --version。

安装 cuDNN:

wget https://developer.download.nvidia.com/compute/cudnn/9.19.0/local_installers/cudnn-local-repo-ubuntu2404-9.19.0_1.0-1_amd64.deb
sudo dpkg -i cudnn-local-repo-ubuntu2404-9.19.0_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-ubuntu2404-9.19.0/cudnn-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cudnn

查看安装目录:

dpkg -L libcudnn9-cuda-13
dpkg -l | grep cudnn

验证 CUDA 环境(需先安装 Anaconda 和 PyTorch):

python test_cuda.py

编译 llama.cpp

为避免 fallback 到 CPU 版,需先调试好 CUDA。前提是要设置好环境变量,DLLAMA_OPENSSL 是必要的。

git clone https://github.com/ggml-org/llama.cpp.git
cd llama.cpp
cmake -B build -DGGML_CUDA=ON -DLLAMA_OPENSSL=ON
cmake --build build --config Release
验证方案 1

访问 Hugging Face 模型页,选择 llama.cpp 方案,在 WSL 中选择 cli 方案运行:

./build/bin/llama-cli -hf Qwen/Qwen3-0.6B-GGUF:Q8_0

若报错,加上 -DLLAMA_OPENSSL=ON 参数重新编译。

验证方案 2

下载并运行 Llama-2 7B 模型(需安装 git-lfs):

sudo apt install git-lfs
git lfs install

安装 node-llama-cpp

npm install -g node-llama-cpp
node-llama-cpp --version

验证 Memory

openclaw gateway restart
openclaw memory status --deep

正在下载模型到 ~/.node-llama-cpp/models,说明已起作用。

sqlite-vec unavailable

若遇到错误:[memory] sqlite-vec unavailable: ... No such file or directory。

可尝试通过 npm 安装获取动态库:

npm install -g sqlite-vec

找到安装目录(通常在 ~/.npm-global/lib/node_modules/sqlite-vec/...),修改 openclaw.json 中的 extensionPath 指向该 .so 文件,重启 gateway 即可修复。

注意事项

  1. 安装 node-llama-cpp 提示:当 memorySearch.provider = "local" 时,node-llama-cpp 会解析 modelPath。如果 GGUF 缺失,它会自动下载。原生构建要求运行 pnpm approve-builds。
  2. 前置条件:正确的安装顺序为:安装 CUDA -> 安装 cuDNN -> 编译 llama.cpp -> 原生编译安装 node-llama-cpp。
  3. Vulkan 问题:处理 node-llama-cpp 时可能遇到 Vulkan 检测但无法使用的情况,目前看对功能无影响,可忽略。

目录

  1. OpenClaw Memory 本地模式配置
  2. OpenClaw 的 Memory 配置
  3. Ubuntu 24.04 安装 CUDA 和 cuDNN
  4. 编译 llama.cpp
  5. 验证方案 1
  6. 验证方案 2
  7. 安装 node-llama-cpp
  8. 验证 Memory
  9. sqlite-vec unavailable
  10. 注意事项
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 前端是夕阳行业吗?2026 年行业现状与职业发展深度解析
  • Windows 系统 Visual C++ 运行库全生命周期管理方案
  • 使用大模型定制专属 AI 应用指南与场景分析
  • 浏览器缓存机制详解与前端代码更新缓存解决方案
  • 无人机智能巡检系统与大疆云 API 集成设计
  • C++ STL 核心基础:迭代器、auto 与范围循环
  • 零次方机器人发布轮式人形机器人 Zerith-H1 及操作基础模型 Zerith-V0
  • Java 中间件:Dubbo 服务降级(Mock 机制)
  • 金融数据分析常用工具:Python、R 与 SQL 对比
  • Go 语言信用卡号码 Luhn 算法校验实现
  • Neo4j Python SDK 使用手册
  • Mac 系统部署 OpenClaw 本地 AI 自动化框架指南
  • 修复 Microsoft Visual C++ 2022 X86 Minimum Runtime 安装错误
  • Python Web 开发与爬虫方向如何选择
  • 城市热岛效应研究:GLM-4.6V-Flash-WEB 分析红外遥感数据
  • Python 为何在数据分析领域广受欢迎?
  • 基于 STM32 的智能家居环境监测系统设计
  • 算法实战:替换所有问号与提莫攻击详解
  • Qwen3-VL-WEBUI 多模态工具快速生成电商素材方案
  • 二分算法实战:查找有序数组中元素的首尾位置

相关免费在线工具

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online

  • Base64 文件转换器

    将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online

  • Markdown转HTML

    将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online