本地离线部署 AI 大模型：Ollama + OpenClaw + Qwen3.5 实战指南 | 极客日志

Shell / BashAI算法

本地离线部署 AI 大模型：Ollama + OpenClaw + Qwen3.5 实战指南

本地离线部署 AI 大模型利用 Ollama 管理引擎与 Qwen3.5 系列模型，配合 OpenClaw 可视化界面，实现无需 GPU 的低配运行。方案涵盖环境准备、模型拉取及常见问题排查，确保数据隐私安全且完全免费。

NodeJser发布于 2026/3/21更新于 2026/7/726 浏览

本地离线部署 AI 大模型：Ollama + OpenClaw + Qwen3.5 实战指南

随着开源大模型日益成熟，我们完全可以在本地电脑运行 AI，不联网、数据不出域，隐私性极强。本文将带你完成 Ollama + Qwen3.5 + OpenClaw 的本地部署，实现一个属于自己的离线聊天助手，兼顾效果与低配适配。

环境要求

操作系统：Windows 10 / 11
内存：最低 8GB（推荐 16GB）
显卡：无需独立显卡，CPU 即可运行
网络：仅下载模型时需要，运行时可断网

安装步骤

1. 安装 Ollama

Ollama 是核心引擎，支持一键拉取和管理模型。

访问官网下载 Windows 版本并安装。
安装完成后，后台会自动启动服务。
验证安装：在终端输入 ollama --version，显示版本号即成功。

2. 下载并运行模型

根据配置选择模型：

主力模型：Qwen3.5:cloud（对话效果好，推荐）
轻量备选：Qwen3:0.6b（占用约 1GB，适合 8GB 内存）

在终端执行以下命令启动模型（首次运行会自动下载）：

ollama run qwen3.5:cloud

出现 >>> 提示符表示启动成功，可直接输入问题测试。若遇卡顿，可切换至轻量版：

ollama run qwen3:0.6b

3. 配置 OpenClaw 界面

OpenClaw 提供类似 ChatGPT 的可视化交互体验。

从 GitHub 发布页下载并解压 OpenClaw。
打开软件，进入设置页面。
模型选择：根据需求选择 qwen3.5:cloud 或 qwen3:0.6b。
Ollama 地址保持默认：http://localhost:11434。
保存设置后返回主界面即可开始对话。

常见问题排查

模型下载慢：建议避开高峰期，或暂停重连，进度通常不会丢失。
连接失败：检查 Ollama 是否在后台运行（任务栏图标），尝试右键 Restart。确认地址为 http://localhost:11434，无多余字符。
内存不足：关闭浏览器、视频软件等占用内存的程序。若仍卡顿，请切换至 qwen3:0.6b 或更小的参数模型。
列表不显示：重启 OpenClaw 重新加载，或在命令行输入 ollama list 确认模型已拉取。

性能参考

启动速度：Qwen3.5:cloud 约 3～10 秒，Qwen3:0.6b 约 1～3 秒。
内存占用：Qwen3.5:cloud 约 2GB～4GB，Qwen3:0.6b 约 1GB～1.5GB。
适用场景：日常办公、学习、隐私敏感型任务。

通过这套组合，我们实现了免费、离线、可视化的本地 AI 体验，数据完全掌控在自己手中。