本地离线部署 AI 大模型:Ollama + OpenClaw + Qwen 系列实战
随着开源大模型的成熟,我们完全可以在本地电脑上运行 AI,不联网、不上传数据,隐私性极强。今天我会带你完成 Ollama + Qwen3.5:cloud(主力)+ Qwen3:0.6b(轻量备选)+ OpenClaw 的本地部署,实现一个属于自己的本地聊天 AI,兼顾效果与低配置适配。
环境准备
- 操作系统:Windows 10 / Windows 11
- 内存:最低 8GB(推荐 16GB 更流畅)
- 显卡:无需独立显卡,CPU 即可运行
- 网络:仅在下载模型时需要,运行时可完全断网
安装与配置步骤
1. 安装 Ollama
Ollama 是运行模型的核心工具,支持一键拉取和管理。
- 访问官网下载 Windows 版本并安装。
- 安装完成后,Ollama 会自动在后台运行。
- 验证安装:打开 CMD 或 PowerShell,输入
ollama --version,出现版本号即成功。
2. 拉取并运行模型
根据电脑配置选择模型。优先推荐 Qwen3.5:cloud(效果更好),8GB 内存低配电脑推荐 Qwen3:0.6b(更流畅)。
主力模型:Qwen3.5:cloud
在命令行输入以下命令,首次运行会自动下载模型,完成后出现 >>> 表示启动成功:
ollama run qwen3.5:cloud
此时可直接输入问题测试,例如:
你好,介绍一下自己
若模型正常回答,说明部署成功。
轻量备选:Qwen3:0.6b
若运行主力模型卡顿,可切换至超轻量模型:
ollama run qwen3:0.6b
同样输入 你好,介绍一下自己 进行测试。出现 >>> 且能正常回答,说明轻量版部署成功。
3. 配置 OpenClaw 可视化界面
OpenClaw 提供类似 ChatGPT 的交互体验,无需敲命令。
- 从 GitHub 发布页下载 Windows 安装包并解压运行。
- 点击右上角进入设置。
- 模型选择:主力推荐
qwen3.5:cloud,低配电脑选择qwen3:0.6b。 - Ollama 地址:保持默认
http://localhost:11434。 - 保存设置后回到主界面即可开始聊天。
效果与性能表现
- 启动速度:约 3~10 秒(Qwen3.5:cloud),1~3 秒(Qwen3:0.6b)
- 内存占用:Qwen3.5:cloud 约 2GB~4GB,Qwen3:0.6b 约 1GB~1.5GB
- :均流畅可日常使用,低配电脑建议选轻量模型


