随着开源大模型日益成熟,我们完全可以在本地电脑运行 AI,不联网、数据不出域,隐私性极强。本文将带你完成 Ollama + Qwen3.5 + OpenClaw 的本地部署,实现一个属于自己的离线聊天助手,兼顾效果与低配适配。
环境要求
- 操作系统:Windows 10 / 11
- 内存:最低 8GB(推荐 16GB)
- 显卡:无需独立显卡,CPU 即可运行
- 网络:仅下载模型时需要,运行时可断网
安装步骤
1. 安装 Ollama
Ollama 是核心引擎,支持一键拉取和管理模型。
- 访问官网下载 Windows 版本并安装。
- 安装完成后,后台会自动启动服务。
- 验证安装:在终端输入
ollama --version,显示版本号即成功。
2. 下载并运行模型
根据配置选择模型:
- 主力模型:Qwen3.5:cloud(对话效果好,推荐)
- 轻量备选:Qwen3:0.6b(占用约 1GB,适合 8GB 内存)
在终端执行以下命令启动模型(首次运行会自动下载):
ollama run qwen3.5:cloud
出现 >>> 提示符表示启动成功,可直接输入问题测试。若遇卡顿,可切换至轻量版:
ollama run qwen3:0.6b
3. 配置 OpenClaw 界面
OpenClaw 提供类似 ChatGPT 的可视化交互体验。
- 从 GitHub 发布页下载并解压 OpenClaw。
- 打开软件,进入设置页面。
- 模型选择:根据需求选择
qwen3.5:cloud或qwen3:0.6b。 - Ollama 地址保持默认:
http://localhost:11434。 - 保存设置后返回主界面即可开始对话。
常见问题排查
- 模型下载慢:建议避开高峰期,或暂停重连,进度通常不会丢失。
- 连接失败:检查 Ollama 是否在后台运行(任务栏图标),尝试右键 Restart。确认地址为
http://localhost:11434,无多余字符。 - 内存不足:关闭浏览器、视频软件等占用内存的程序。若仍卡顿,请切换至
qwen3:0.6b或更小的参数模型。 - 列表不显示:重启 OpenClaw 重新加载,或在命令行输入
ollama list确认模型已拉取。
性能参考
- 启动速度:Qwen3.5:cloud 约 3~10 秒,Qwen3:0.6b 约 1~3 秒。
- 内存占用:Qwen3.5:cloud 约 2GB~4GB,Qwen3:0.6b 约 1GB~1.5GB。
- 适用场景:日常办公、学习、隐私敏感型任务。
通过这套组合,我们实现了免费、离线、可视化的本地 AI 体验,数据完全掌控在自己手中。


