Qwen3.5 系列开源大模型本地部署全流程（ModelScope）

综述由AI生成Qwen3.5 是阿里云通义千问团队发布的新一代开源大模型，支持多模态理解与工具调用。演示了在本地 PC 环境下通过 ModelScope 下载模型、使用 Ollama 运行及 llama.cpp 部署的完整流程。针对无独显场景，提供了 GGUF 量化格式选择建议及命令行操作步骤，验证了资源受限环境下的模型本地化可行性。

黑客帝国发布于 2026/3/26更新于 2026/5/35 浏览

1. Qwen

Qwen3.5 是阿里云通义千问团队发布的新一代开源大模型系列，提供基础智能能力。主要作为基础模型，具备强大的文本生成、复杂推理、多模态理解（如图像、视频）和工具调用等能力。适用于希望直接使用高性能大模型，或将其作为基座进行二次开发的个人、研究者和企业。

可访问魔搭社区：https://www.modelscope.cn/models?name=qwen3.5&page=1&tabKey=task

Qwen3.5 具备以下增强特性：

统一的视觉 - 语言基础：在多模态 token 上进行早期融合训练，在推理、编码、智能体和视觉理解等基准测试中，跨代际表现与 Qwen3 持平，并优于 Qwen3-VL 模型。
高效混合架构：门控 Delta 网络与稀疏混合专家（Mixture-of-Experts）相结合，实现高吞吐推理，同时保持极低延迟和成本开销。
可扩展的强化学习泛化能力：在百万级智能体环境中进行强化学习训练，任务分布逐步复杂化，从而获得强大的现实世界适应能力。
全球语言覆盖：支持扩展至 201 种语言和方言，实现包容性的全球部署，并具备细致入微的文化与区域理解能力。
下一代训练基础设施：相比纯文本训练，多模态训练效率接近 100%，并采用异步强化学习框架，支持大规模智能体脚手架和环境编排。

文章配图

文件名其中 B 代表 billion，即十亿，指的是模型的参数量，例如：2B=参数量为 20 亿；一般来说，参数量越大的模型，其'记忆体'和'计算单元'越多，能够学习到的知识更丰富，处理复杂逻辑推理的能力也越强。参数量也直接决定了运行这个模型所需要的内存（显存）和存储空间。

考虑到本地个人电脑（无独显）硬件配置，此处选择【Qwen3.5-0.8B-GGUF】举例，详情见：https://www.modelscope.cn/models/unsloth/Qwen3.5-0.8B-GGUF/summary

其中【模型介绍】描述基准测试结果关于不同模型间的比较，可自行阅读；

文章配图

点击【下载模型】，建议使用命令行下载，文件默认下载至【C:\Users\Administrator.cache\modelscope\hub\models\unsloth\Qwen3.5-0.8B-GGUF】

文章配图

1. Qwen

可访问魔搭社区：https://www.modelscope.cn/models?name=qwen3.5&page=1&tabKey=task

Qwen3.5 具备以下增强特性：

统一的视觉 - 语言基础：在多模态 token 上进行早期融合训练，在推理、编码、智能体和视觉理解等基准测试中，跨代际表现与 Qwen3 持平，并优于 Qwen3-VL 模型。
高效混合架构：门控 Delta 网络与稀疏混合专家（Mixture-of-Experts）相结合，实现高吞吐推理，同时保持极低延迟和成本开销。
可扩展的强化学习泛化能力：在百万级智能体环境中进行强化学习训练，任务分布逐步复杂化，从而获得强大的现实世界适应能力。
全球语言覆盖：支持扩展至 201 种语言和方言，实现包容性的全球部署，并具备细致入微的文化与区域理解能力。
下一代训练基础设施：相比纯文本训练，多模态训练效率接近 100%，并采用异步强化学习框架，支持大规模智能体脚手架和环境编排。

文章配图

考虑到本地个人电脑（无独显）硬件配置，此处选择【Qwen3.5-0.8B-GGUF】举例，详情见：https://www.modelscope.cn/models/unsloth/Qwen3.5-0.8B-GGUF/summary

其中【模型介绍】描述基准测试结果关于不同模型间的比较，可自行阅读；

文章配图

点击【下载模型】，建议使用命令行下载，文件默认下载至【C:\Users\Administrator.cache\modelscope\hub\models\unsloth\Qwen3.5-0.8B-GGUF】

文章配图