项目概述
本项目实现本地离线运行阿里通义千问系列大模型(Qwen3.5:cloud 主力模型 + Qwen3:0.6b 轻量备选模型),全程不需要云端 API,不需要高性能显卡,普通电脑即可运行。
核心工具:
- Ollama:本地大模型管理工具,支持一键拉取、运行、管理。
- Qwen3.5:cloud:阿里云开源轻量高性能大语言模型,对话效果强。
- Qwen3:0.6b:超轻量大语言模型,占用内存极低,适合低配电脑。
- OpenClaw:美观的本地 AI 可视化交互界面。
环境准备
- 操作系统:Windows 10 / Windows 11
- 内存:最低 8GB(推荐 16GB)
- 显卡:无需独立显卡,CPU 即可运行
- 网络:仅在下载模型时需要,运行时可完全断网
安装步骤
1. 安装 Ollama
- 访问官网 https://ollama.com/ 下载 Windows 版本。
- 双击安装,一路下一步。
- 安装完成后,Ollama 会自动在后台运行。
验证是否安装成功:打开 CMD 或 PowerShell,输入:
ollama --version
出现版本号即成功。
2. 下载并运行模型
根据电脑配置选择模型。优先推荐 Qwen3.5:cloud,8GB 内存低配电脑推荐 Qwen3:0.6b。
2.1 下载 Qwen3.5:cloud(主力模型)
在命令行输入以下命令:
ollama run qwen3.5:cloud
出现 >>> 表示模型已启动成功。可直接输入问题测试:
你好,介绍一下自己

2.2 下载 Qwen3:0.6b(轻量备选模型)
若电脑内存较低,运行 Qwen3.5:cloud 卡顿,可下载此模型:
ollama run qwen3:0.6b
出现 >>> 表示模型已启动成功。
你好,介绍一下自己

3. 安装 OpenClaw 可视化界面
- 访问 OpenClaw 发布页:https://github.com/sqzw-x/OpenClaw
- 下载最新版本 Windows 安装包并解压。
- 连接 OpenClaw 与本地 Ollama。
- 右上角进入设置。
- 模型选择:主力推荐
qwen3.5:cloud,低配选择qwen3:0.6b。 - Ollama 地址保持默认:
http://localhost:11434 - 保存设置。
回到主界面,即可开始聊天。
效果展示



- 模型启动速度:约 3~10 秒
- 回答速度:流畅,可日常使用
常见问题与解决
- 内存占用:Qwen3.5:cloud 约 2GB~4GB,Qwen3:0.6b 约 1GB~1.5GB
- 启动速度:Qwen3.5:cloud 约 3~10 秒,Qwen3:0.6b 约 1~3 秒
1. 模型下载特别慢
- 暂停下载重新开始,进度不会变。
- 避开网络高峰期下载。
2. OpenClaw 连接失败
- 确保 Ollama 正在后台运行(任务栏右下角查看图标)。
- 重启 Ollama:任务栏右键 Ollama → Restart。
- 检查地址是否为
http://localhost:11434。
3. 电脑卡顿、内存不足
- 关闭其他软件(尤其是浏览器、视频软件、后台下载工具)。
- 切换至超轻量模型:运行
ollama run qwen3:0.6b。 - 或使用更小参数模型:
ollama run qwen3.5:4b。
4. OpenClaw 不显示模型
- 重启 OpenClaw 软件,重新加载模型列表。
- 重新进入设置,选择模型并保存。
- 确认 Ollama 已成功拉取模型(命令行输入
ollama list)。
总结
通过 Ollama + Qwen3.5:cloud + OpenClaw,实现了以下目标:
- 本地离线运行大模型
- 完全免费、无流量限制
- 可视化界面,体验接近在线 AI
- 数据不上传,隐私安全
适合人群:想学习 AI 本地部署的新手、注重隐私不想数据上传的用户、学生及开发者。8GB 内存低配电脑也可适配(选择 Qwen3:0.6b 模型)。


