本地离线部署AI大模型：OpenClaw + Ollama + Qwen3.5:cloud/Qwen3:0.6b 超详细教程（无需GPU）

Ne0inhk

25 Mar 2026 — 7 min read

前言

随着开源大模型越来越成熟，我们完全可以在自己电脑上本地运行AI，不联网、不上传数据、免费使用，隐私性极强。

今天这篇文章，我会一步步带你完成：Ollama + Qwen3.5:cloud（主力模型）+ Qwen3:0.6b（轻量备选）+ OpenClaw 的本地部署，实现一个属于自己的本地聊天AI，兼顾效果与低配置适配。

一、项目介绍

本项目实现本地离线运行阿里通义千问系列大模型（Qwen3.5:cloud 主力模型 + Qwen3:0.6b 轻量备选模型），全程不需要云端API，不需要高性能显卡，普通电脑就能跑，可根据自身电脑配置选择对应模型。

用到的工具：

Ollama：最简单的本地大模型管理工具，一键拉取、运行、管理模型

Qwen3.5:cloud：阿里云开源的轻量高性能大语言模型，对话效果强、适配本地部署，作为主力使用

Qwen3:0.6b：阿里云开源的超轻量大语言模型，占用内存极低（1GB左右），适合8GB内存低配电脑，作为备选模型

OpenClaw：美观好用的本地AI可视化交互界面

特点：免费、离线、隐私安全、低配置可运行

二、环境准备

操作系统：Windows 10 / Windows 11

内存：最低 8GB（推荐 16GB 更流畅）

无需独立显卡，CPU 即可运行

网络：仅在下载模型时需要，运行时可完全断网

三、详细安装步骤

安装 Ollama

Ollama 是运行模型的核心，安装非常简单。

打开官网：https://ollama.com/
点击 Download 下载 Windows 版本
双击安装，一路下一步
安装完成后，Ollama 会自动在后台运行

验证是否安装成功：

打开 CMD 或 PowerShell，输入：

ollama --version

出现版本号即成功。

使用 Ollama 下载并运行模型（Qwen3.5:cloud + Qwen3:0.6b）

我实际下载了两个模型，可根据自身电脑配置选择运行，优先推荐 Qwen3.5:cloud（效果更好），8GB内存低配电脑推荐 Qwen3:0.6b（更流畅）。

2.1 下载并运行 Qwen3.5:cloud（主力模型）

继续在命令行输入以下命令，
第一次运行会自动下载模型，下载完成后出现 >>> 即启动成功，可直接输入问题测试，适配低配电脑，运行流畅无压力。

ollama run qwen3.5:cloud

出现 >>> 表示模型已启动成功。

你可以直接在这里输入问题测试：

你好，介绍一下自己

模型能正常回答，说明 Qwen3.5:cloud 部署成功。

2.2 下载并运行 Qwen3:0.6b（轻量备选模型）

若电脑内存较低（8GB及以下），运行 Qwen3.5:cloud 卡顿，可下载 Qwen3:0.6b 超轻量模型，命令行输入：

ollama run qwen3:0.6b

出现 >>> 表示模型已启动成功。

你可以直接在这里输入问题测试：
你好，介绍一下自己

模型能正常回答，说明部署成功一半。

安装 OpenClaw 可视化界面

OpenClaw 让你不用敲命令，直接像 ChatGPT 一样聊天。

打开 OpenClaw 发布页：https://github.com/sqzw-x/OpenClaw
找到最新版本下载 Windows 安装包
解压或安装后打开软件
连接 OpenClaw 与本地 Ollama

打开 OpenClaw 后：

右上角进入设置
模型选择：根据自身需求选择，主力推荐 qwen3.5:cloud，低配电脑选择 qwen3:0.6b
Ollama 地址保持默认：

http://localhost:11434

保存设置

回到主界面，即可开始聊天。

四、效果展示

与AI对话的效果截图
任务管理器内存占用展示（打开任务管理器，切换到“性能-内存”页面，同步显示AI运行状态）

示例说明：

OpenClaw 连接成功界面（截图包含设置页面、模型选择（可分别展示 qwen3.5:cloud 和 qwen3:0.6b 选择界面）、地址配置）

模型启动速度：约 3～10 秒

回答速度：流畅，可日常使用

五、常见问题与解决方法（非常重要）

内存占用：Qwen3.5:cloud 约 2GB～4GB，Qwen3:0.6b 约 1GB～1.5GB

模型启动速度：Qwen3.5:cloud 约 3～10 秒，Qwen3:0.6b 约 1～3 秒

回答速度：均流畅可日常使用，Qwen3:0.6b 适配低配电脑，卡顿更少

模型下载特别慢

解决方法：

先暂停下载重新开始，进度不会变

或等待半夜下载（网络高峰期避开）

OpenClaw 连接失败 / 连不上 127.0.0.1:11434

解决方法：

确保 Ollama 正在后台运行（任务栏右下角查看 Ollama 图标）

重启 Ollama：任务栏右键 Ollama → Restart

检查地址是否为：http://localhost:11434（切勿多写/少写字符）

电脑卡顿、内存不足

解决方法：

关闭其他软件（尤其是浏览器、视频软件、后台下载工具）

关闭其他软件（尤其是浏览器、视频软件、后台下载工具），释放内存

解决方法：

切换/运行 Qwen3:0.6b 命令：

切换至超轻量模型：若运行 Qwen3.5:cloud 卡顿，可切换到 Qwen3:0.6b 模型，占用内存极低，适配8GB及以下低配电脑

ollama run qwen3:0.6b

命令：

使用更小参数模型（若 qwen3.5:cloud 卡顿）：qwen3.5:4b

OpenClaw 不显示模型（qwen3.5:cloud 或 qwen3:0.6b）

ollama run qwen3.5:4b

解决方法：

重启 OpenClaw 软件，重新加载模型列表

解决方法：

重新进入 OpenClaw 设置，根据自身需求选择 qwen3.5:cloud 或 qwen3:0.6b 模型并保存

重启 OpenClaw 软件

确认 Ollama 已成功拉取模型（命令行输入 ollama list 可查看已拉取的 qwen3.5:cloud 和 qwen3:0.6b 模型）

确认 Ollama 已成功拉取模型（命令行输入 ollama list 可查看已拉取模型）

六、项目总结

通过 Ollama + Qwen3.5:cloud + OpenClaw，我们轻松实现了：

通过 Ollama + Qwen3.5:cloud（主力）+ Qwen3:0.6b（备选）+ OpenClaw，我们轻松实现了：

本地离线运行大模型

完全免费、无流量限制

可视化界面，使用体验接近在线AI

数据不上传，隐私百分百安全

适合人群：

想学习AI本地部署的新手

想学习AI本地部署的新手

注重隐私、不想数据上传云端

学生、开发者、日常办公使用；8GB内存低配电脑也能轻松适配（选择 Qwen3:0.6b 模型）

注重隐私、不想数据上传云端

学生、开发者、日常办公使用

AI Agent 架构：基础组成模块深度解析

AI Agent 架构：基础组成模块深度解析 📝 本章学习目标：本章是入门认知部分，帮助零基础读者建立对AI Agent的初步认知。通过本章学习，你将全面掌握"AI Agent 架构：基础组成模块深度解析"这一核心主题。一、引言：为什么这个话题如此重要在AI Agent快速发展的今天，AI Agent 架构：基础组成模块深度解析已经成为每个开发者和研究者必须了解的核心知识。无论你是技术背景还是非技术背景，理解这一概念都将帮助你更好地把握AI时代的机遇。 1.1 背景与意义 💡 核心认知：AI Agent正在从"对话工具"进化为"执行引擎"，能够主动完成任务、调用工具、与外部世界交互。这一变革正在深刻改变我们的工作和生活方式。从2023年AutoGPT的横空出世，到如今百花齐放的Agent生态，短短一年多时间，执行式AI已经从概念走向落地。根据最新统计，

AI的提示词专栏：Prompt 编写的日志分析与关键字聚类

AI的提示词专栏：Prompt 编写的日志分析与关键字聚类本文围绕 Prompt 在日志分析与关键字聚类中的应用展开，先阐述该技术的行业价值，指出其可解决海量日志人工处理效率低、格式混乱、关键字关联分析缺失等痛点。接着介绍日志类型、关键字聚类维度等核心概念，随后详细给出日志分析与关键字聚类类 Prompt 的通用编写框架，搭配运维、产品等不同场景的实战示例与技巧解析。还总结了 Prompt 编写的常见误区及避坑指南，提供结合 ELK Stack、Python 等工具的高级实战方案，最后总结核心原则并给出后续学习建议，为读者提供从基础到进阶的完整 Prompt 应用指导。人工智能专栏介绍人工智能学习合集专栏是 AI 学习者的实用工具。它像一个全面的 AI 知识库，把提示词设计、AI 创作、智能绘图等多个细分领域的知识整合起来。无论你是刚接触 AI 的新手，还是有一定基础想提升的人，都能在这里找到合适的内容。从最基础的工具操作方法，到背后深层的技术原理，专栏都有讲解，还搭配了实例教程和实战案例。这些内容能帮助学习者一步步搭建完整的

Spring AI：Java 开发者的AI 应用开发利器

在生成式 AI 席卷行业的今天，Java 开发者常常面临一个尴尬的困境：想给现有 Spring 项目集成 AI 能力，却要被迫学习 Python 生态的 LangChain、LlamaIndex，还要反复适配 OpenAI、通义千问等不同模型的 API 格式——这就像用熟悉的工具拧陌生的螺丝，效率低下且容易出错。而 Spring AI 的出现，彻底改变了这一现状。作为 Spring 生态官方推出的企业级 AI 框架，它将 Spring 一贯的“抽象解耦”“开箱即用”设计哲学延伸到 AI 领域，让 Java 开发者无需切换技术栈，就能用熟悉的 Spring 风格快速构建稳定、可扩展的 AI 应用。本文将从核心认知、

Google Antigravity AI IDE 官方教程文档来了！

1. 简介 Google Antigravity 是 Google 推出的面向 AI 智能体（Agent）全生命周期开发的新一代集成开发环境（IDE）。它将智能体的创建、调试、部署与监控统一于直观的图形界面，显著降低 LLM 应用开发门槛。核心特性： * 🧠 Agent-Centric Design：以“智能体”为第一公民，而非传统文件 * ⚡ 毫秒级热重载：修改 Prompt / 工具链实时生效 * 🔌 多后端兼容：本地模型（Ollama, vLLM）、Google Cloud Vertex AI、第三方 API * 🧪 内置沙盒测试环境与可观测性面板 2. 安装与系统要求前往 → https://antigravity.google/

2.1 下载并运行 Qwen3.5:cloud（主力模型）

2.2 下载并运行 Qwen3:0.6b（轻量备选模型）

Read more

AI Agent 架构：基础组成模块深度解析

AI的提示词专栏：Prompt 编写的日志分析与关键字聚类

Spring AI：Java 开发者的AI 应用开发利器

Google Antigravity AI IDE 官方教程文档来了！