本地离线部署 AI 大模型：OpenClaw + Ollama + Qwen 实战

前言

随着开源大模型越来越成熟，我们完全可以在自己电脑上本地运行 AI，不联网、不上传数据、免费使用，隐私性极强。

今天这篇文章，我会一步步带你完成：Ollama + Qwen3.5:cloud（主力模型）+ Qwen3:0.6b（轻量备选）+ OpenClaw 的本地部署，实现一个属于自己的本地聊天 AI，兼顾效果与低配置适配。

项目介绍

本项目实现本地离线运行阿里通义千问系列大模型（Qwen3.5:cloud 主力模型 + Qwen3:0.6b 轻量备选模型），全程不需要云端 API，不需要高性能显卡，普通电脑就能跑，可根据自身电脑配置选择对应模型。

用到的工具：

Ollama：最简单的本地大模型管理工具，一键拉取、运行、管理模型
Qwen3.5:cloud：阿里云开源的轻量高性能大语言模型，对话效果强、适配本地部署，作为主力使用
Qwen3:0.6b：阿里云开源的超轻量大语言模型，占用内存极低（1GB 左右），适合 8GB 内存低配电脑，作为备选模型
OpenClaw：美观好用的本地 AI 可视化交互界面
特点：免费、离线、隐私安全、低配置可运行

环境准备

操作系统：Windows 10 / Windows 11
内存：最低 8GB（推荐 16GB 更流畅）
显卡：无需独立显卡，CPU 即可运行
网络：仅在下载模型时需要，运行时可完全断网

详细安装步骤

1. 安装 Ollama

Ollama 是运行模型的核心，安装非常简单。

打开官网：https://ollama.com/
点击 Download 下载 Windows 版本
双击安装，一路下一步
安装完成后，Ollama 会自动在后台运行

验证是否安装成功：

打开 CMD 或 PowerShell，输入：

ollama --version

出现版本号即成功。

2. 使用 Ollama 下载并运行模型（Qwen3.5:cloud + Qwen3:0.6b）

我实际下载了两个模型，可根据自身电脑配置选择运行，优先推荐 Qwen3.5:cloud（效果更好），8GB 内存低配电脑推荐 Qwen3:0.6b（更流畅）。

2.1 下载并运行 Qwen3.5:cloud（主力模型）

继续在命令行输入以下命令，第一次运行会自动下载模型，下载完成后出现 >>> 即启动成功，可直接输入问题测试，适配低配电脑，运行流畅无压力。

ollama run qwen3.5:cloud

出现 >>> 表示模型已启动成功。你可以直接在这里输入问题测试：

你好，介绍一下自己

Ollama 运行界面

模型能正常回答，说明 Qwen3.5:cloud 部署成功。

2.2 下载并运行 Qwen3:0.6b（轻量备选模型）

若电脑内存较低（8GB 及以下），运行 Qwen3.5:cloud 卡顿，可下载 Qwen3:0.6b 超轻量模型，命令行输入：

前言

随着开源大模型越来越成熟，我们完全可以在自己电脑上本地运行 AI，不联网、不上传数据、免费使用，隐私性极强。

项目介绍

用到的工具：

Ollama：最简单的本地大模型管理工具，一键拉取、运行、管理模型
Qwen3.5:cloud：阿里云开源的轻量高性能大语言模型，对话效果强、适配本地部署，作为主力使用
Qwen3:0.6b：阿里云开源的超轻量大语言模型，占用内存极低（1GB 左右），适合 8GB 内存低配电脑，作为备选模型
OpenClaw：美观好用的本地 AI 可视化交互界面
特点：免费、离线、隐私安全、低配置可运行

环境准备

操作系统：Windows 10 / Windows 11
内存：最低 8GB（推荐 16GB 更流畅）
显卡：无需独立显卡，CPU 即可运行
网络：仅在下载模型时需要，运行时可完全断网

详细安装步骤

1. 安装 Ollama

Ollama 是运行模型的核心，安装非常简单。

打开官网：https://ollama.com/
点击 Download 下载 Windows 版本
双击安装，一路下一步
安装完成后，Ollama 会自动在后台运行

验证是否安装成功：

打开 CMD 或 PowerShell，输入：

ollama --version

出现版本号即成功。

2. 使用 Ollama 下载并运行模型（Qwen3.5:cloud + Qwen3:0.6b）

我实际下载了两个模型，可根据自身电脑配置选择运行，优先推荐 Qwen3.5:cloud（效果更好），8GB 内存低配电脑推荐 Qwen3:0.6b（更流畅）。

2.1 下载并运行 Qwen3.5:cloud（主力模型）

继续在命令行输入以下命令，第一次运行会自动下载模型，下载完成后出现 >>> 即启动成功，可直接输入问题测试，适配低配电脑，运行流畅无压力。

ollama run qwen3.5:cloud

出现 >>> 表示模型已启动成功。你可以直接在这里输入问题测试：

你好，介绍一下自己

Ollama 运行界面

模型能正常回答，说明 Qwen3.5:cloud 部署成功。

2.2 下载并运行 Qwen3:0.6b（轻量备选模型）

若电脑内存较低（8GB 及以下），运行 Qwen3.5:cloud 卡顿，可下载 Qwen3:0.6b 超轻量模型，命令行输入：

本地离线部署 AI 大模型：OpenClaw + Ollama + Qwen 实战

前言

项目介绍

环境准备

详细安装步骤

1. 安装 Ollama

2. 使用 Ollama 下载并运行模型（Qwen3.5:cloud + Qwen3:0.6b）

2.1 下载并运行 Qwen3.5:cloud（主力模型）

2.2 下载并运行 Qwen3:0.6b（轻量备选模型）

本地离线部署 AI 大模型：OpenClaw + Ollama + Qwen 实战

前言

项目介绍

环境准备

详细安装步骤

1. 安装 Ollama

2. 使用 Ollama 下载并运行模型（Qwen3.5:cloud + Qwen3:0.6b）

2.1 下载并运行 Qwen3.5:cloud（主力模型）

2.2 下载并运行 Qwen3:0.6b（轻量备选模型）

更多推荐文章

相关免费在线工具

3. 安装 OpenClaw 可视化界面

效果展示

常见问题与解决方法

1. 模型下载特别慢

2. OpenClaw 连接失败 / 连不上 127.0.0.1:11434

3. 电脑卡顿、内存不足

4. OpenClaw 不显示模型（qwen3.5:cloud 或 qwen3:0.6b）

项目总结

更多推荐文章

相关免费在线工具

本地离线部署 AI 大模型：OpenClaw + Ollama + Qwen 实战

前言

项目介绍

环境准备

详细安装步骤

1. 安装 Ollama

2. 使用 Ollama 下载并运行模型（Qwen3.5:cloud + Qwen3:0.6b）

2.1 下载并运行 Qwen3.5:cloud（主力模型）

2.2 下载并运行 Qwen3:0.6b（轻量备选模型）

本地离线部署 AI 大模型：OpenClaw + Ollama + Qwen 实战

前言

项目介绍

环境准备

详细安装步骤

1. 安装 Ollama

2. 使用 Ollama 下载并运行模型（Qwen3.5:cloud + Qwen3:0.6b）

2.1 下载并运行 Qwen3.5:cloud（主力模型）

2.2 下载并运行 Qwen3:0.6b（轻量备选模型）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 安装 OpenClaw 可视化界面

效果展示

常见问题与解决方法

1. 模型下载特别慢

2. OpenClaw 连接失败 / 连不上 127.0.0.1:11434

3. 电脑卡顿、内存不足

4. OpenClaw 不显示模型（qwen3.5:cloud 或 qwen3:0.6b）

项目总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具