最强开源多模态大模型它来啦——一文详解Qwen3.5核心特性

Ne0inhk

22 Mar 2026 — 9 min read

前言

各位小伙伴新年好！新的一年祝大家龙马精神、阖家幸福、身体健康、事业进步！2025 年 DeepSeek 发布的 DeepSeek-R1 模型震惊全球，此后国内各大厂商充分发挥“能征善战”的拼劲，纷纷选择重大节日推出新品。今年除夕夜，阿里 Qwen 团队再次放出大招——Qwen3.5 模型正式开源，为国产大模型阵营再添一员猛将。

Qwen3.5 是目前全球最强的原生多模态开源大模型，不仅支持图片和视频的多模态输入，在对话、推理、编程、Agent 构建等方面也样样精通。其综合能力已达到 GPT-5.2、Gemini 3.0 Pro 的平均水平，推理能力尤为突出。例如那道曾让无数模型“翻车”的逻辑题——“50 米距离该走路还是开车去洗车”，Qwen3.5 也能轻松作答。

在 Vibe Coding 方面，凭借国内最强开源多模态模型的实力，Qwen3.5 可借助 Remotion Skills 一键生成视频；在 Agentic Coding 方面，其强悍的 Agent 性能即使用户使用最简略的需求描述，它也能自动调用各类工具，完成复杂应用开发。视觉推理能力相较 Qwen3-VL 大幅提升，连“鲨鱼骑马 = 沙琪玛”这种梗图都能精准识别。

更令人惊艳的是，Qwen3.5 能够将视觉与代码能力结合，一步到位将视频内容“转译”为一个可交互的网页。可以说，Qwen3.5 的发布不仅填补了国内多模态开源大模型的空白，也为未来多模态 Agent 的开发奠定了坚实基础。本文笔者将对 Qwen3.5 的核心特性和性能进行详细解读，带大家一探究竟！

一、Qwen3.5-397B-A17B 核心特性

1.1 预训练：能力、效率与通用性的全面升级

Qwen3.5 在预训练阶段从三个维度进行了深度优化：

能力（Power） ：在更大规模的视觉-文本语料上训练，并加强中英文、多语言、STEM 与推理数据的比重，采用更严格的过滤策略。最终，Qwen3.5-397B-A17B 与参数量超过 1T 的 Qwen3-Max-Base 表现相当，实现了跨代持平。
效率（Efficiency） ：基于 Qwen3-Next 架构，引入更高稀疏度的 MoE、Gated DeltaNet + Gated Attention 混合注意力机制，配合稳定性优化与多 token 预测。在 32k/256k 上下文长度下，Qwen3.5-397B-A17B 的解码吞吐量分别达到 Qwen3-Max 的 8.6 倍/19.0 倍，以及 Qwen3-235B-A22B 的 3.5 倍/7.2 倍，性能不变但效率大幅提升。
通用性（Versatility） ：通过早期文本-视觉融合与扩展的视觉/STEM/视频数据，实现了原生多模态能力，在相近规模下显著优于 Qwen3-VL。多语言支持从 119 种增至 201 种语言/方言；词表从 15 万扩展至 25 万，在多数语言上带来了约 10%~60% 的编码/解码效率提升。

1.2 异构基础设施：高效训练与强化学习的系统支撑

Qwen3.5 通过异构基础设施设计，实现了高效的原生多模态训练：

解耦并行策略：针对视觉与语言组件采用不同的并行策略，避免统一方案带来的低效，实现跨模块计算重叠。在混合文本-图像-视频数据上，训练吞吐量相比纯文本基线几乎无损（接近 100%）。
原生 FP8 流水线：对激活、MoE 路由与 GEMM 运算采用低精度 FP8，同时通过运行时监控在敏感层保持 BF16，从而降低约 50% 的激活显存占用，并获得超过 10% 的加速。该设计稳定支持了数万亿 token 的训练扩展。
可扩展异步强化学习框架：为持续释放强化学习的潜力，构建了训推分离的异步强化学习框架，全面覆盖文本、多模态及多轮交互场景。该框架通过动态负载均衡、细粒度故障恢复，以及 FP8 训推、Rollout 路由回放、投机采样、多轮 Rollout 锁定等技术，实现了 3×–5× 的端到端加速，同时显著提升了训练曲线的稳定性和性能上限。框架原生支持百万级规模的智能体工作流与环境交互，为模型泛化能力的增强提供了坚实基础。

二、Qwen3.5-397B-A17B 性能详解

除夕夜开源的 Qwen3.5-397B-A17B 是 Qwen3.5 系列的首款模型。未来，Qwen3.5 还将陆续开源一系列小尺寸模型，同时保留 Qwen3.5-Max 的商业旗舰地位（该模型不会开源）。

2.1 模型架构与部署

参数规模：模型拥有近 4000 亿总参数，采用极致稀疏 MoE 架构，每次推理仅激活 170 亿参数，大幅降低计算开销。
技术创新：引入注意力门控机制（该技术获 2025 年 NeurIPS 最佳论文奖），实现了降本增效。与上一代商业旗舰 Qwen3-Max-Thinking（近 1T 参数）相比，Qwen3.5-397B-A17B 在性能超越的同时，部署显存占用降低 60%，最大推理吞吐量提升至原来的 19 倍。

硬件需求：尽管极致稀疏，但完整运行仍需至少 8 卡 A100（80G）集群；不过 17B 的激活参数使得实际推理效率极高。

2.2 推理模式与上下文

混合推理模型：Qwen3.5 默认进行推理，与 Qwen3 不同的是，它不支持通过 <no_thinking> 前缀取消推理，只能通过修改内置提示词模板（通常位于 tokenizer_config.json 中）切换至 Chat 模式（内置提示词模板通常在大模型tokenizer_config.json文件中, 大家不熟悉的可以看笔者文章大模型训练全流程实战指南基础篇（二）——大模型文件结构解读与原理解析）。
超长上下文：默认上下文长度为 256K，通过配置最多可扩展至 1M，相当于可一次性处理约 2 小时的视频内容。

2.3 性能对比与亮点

全能型表现：Qwen3.5-397B-A17B 是目前国最强的一款全能型开源大模型，对话、编程、视觉识别、视觉理解、Agent 搭建等能力均已追平 GPT-5.2、Gemini 3.0 Pro 和 Claude Opus4.5。在编程专项上，与最新的 GPT-5.3-CodeX、Claude Opus4.6 相比仍有约 10% 的差距，但依然是国内最佳。
原生多模态优势：文本、图像、视频在统一语义空间处理，对图文混排的 PDF 等文档可直接识别与检索，无需传统的多模态 RAG 流程。视觉推理能力极强，有博主实验证明 Qwen3.5 能高精度识别复杂的 Agent 项目架构图，并准确分析功能、关联和内在逻辑，甚至可以借助其强大的编程能力复刻相同架构的 Agent——类似 Claude 的视觉编程魅力，国人终于也能体验到了！

2.4 开源与 API

模型下载：Qwen3.5-397B-A17B 已全面开源，可在魔搭社区（ModelScope）或 Hugging Face 下载模型权重。
API 服务：阿里百炼平台同步上线了模型 API，注意区分两个版本：
- Qwen3.5（开源模型） ：原始开源模型版本。
- Qwen3.5-Plus：开源模型搭配基础工具（如网络搜索）后的通用 Agent，并非纯模型。
定价：API 定价极低，输入百万 tokens 仅 0.8 元，输出百万 tokens 仅 4.8 元，性价比是同性能 Gemini 3.0 Pro 的 1/18，真正“拉满”性价比。

三、总结

Qwen3.5-397B-A17B 的发布，为 2026 年春节的国产大模型赛道打响了头炮。与此同时，万众期待的 DeepSeek-V4 也即将来袭，这个春节可谓“神仙打架”。正是这些公司雄厚的技术积淀，撑起了我国大模型在世界舞台上的领先地位。为国产大模型公司点赞，也祝愿新的一年里，我国大模型产业继续马到成功！

Flutter 组件 base85 的适配鸿蒙Harmony 实战 - 驾驭极致数据编码算法、实现鸿蒙端二进制资源高效序列化与存储压榨方案

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 组件 base85 的适配鸿蒙Harmony 实战 - 驾驭极致数据编码算法、实现鸿蒙端二进制资源高效序列化与存储压榨方案前言在鸿蒙（OpenHarmony）系统的万物互联架构下，数据在不同设备（如手表、传感器与大屏）间的传输效率，直接决定了用户感知的流畅度。为了在有限的带宽和存储空间内实现最大化的信息密度，我们经常需要对二进制数据进行 Base 级编码。虽然 Base64 是工业常态，但由于其 33% 的体积膨胀率，在处理海量指纹特征或高清图标序列化时，依然显得略重。 base85（也称 Ascii85）作为一种更为先进的编码方案，其膨胀率仅为约 25%。适配到鸿蒙平台后，它不仅能显著缩减 JSON 报文的体量，更是我们在极低功耗场景下（如蓝牙快连协议）压榨每一比特传输价值的核心法宝。本文将带你探索鸿蒙端的“极致编码”

Flutter 组件 activity_files 适配鸿蒙 HarmonyOS 实战：文件活动流治理，构建高性能存储沙箱访问与资产全生命周期管理架构

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 组件 activity_files 适配鸿蒙 HarmonyOS 实战：文件活动流治理，构建高性能存储沙箱访问与资产全生命周期管理架构前言在鸿蒙（OpenHarmony）生态迈向全场景分布式协同、涉及海量多媒体资产处理及严苛应用沙箱（Sandbox）隔离的背景下，如何实现一套既能穿透复杂的层级目录、又能实时追踪文件变更活动且具备极高 I/O 吞吐能力的存储治理架构，已成为决定应用性能广度与数据安全深度。在鸿蒙设备这类强调 AOT 极致性能与受限文件权限周期的环境下，如果应用依然采用陈旧的同步文件读取或缺乏活动追踪的直接 I/O，由于由于频繁的磁盘竞争，极易由于由于“主线程阻塞”或“资产状态不同步”导致用户在管理大型媒体库时发生明显的感知性卡顿。我们需要一种能够解耦文件路径、支持异步流式追踪（Activity Tracking）且符合鸿蒙分布式文件系统安全范式的操作框架。 activity_files 为 Flutter 开发者引入了“

Linux高并发服务器实现原理：从多进程到多路IO转接的演进之路

🌟 Linux高并发服务器实现原理：从多进程到多路IO转接的演进之路 🚀 引言：高并发服务器的挑战在互联网应用爆炸式增长的今天，服务器需要同时处理成千上万的客户端连接已成为常态。想象一下，一个电商平台在"双十一"期间，每秒需要处理数十万甚至上百万的请求——这就是高并发服务器的用武之地。本文将带您深入探索Linux环境下高并发服务器的实现原理，从传统的多进程/多线程模型，到现代的多路IO转接机制。 🧩 传统实现方式回顾 1. 多进程模型：分而治之的古老智慧在多进程模型中，每当有新客户端连接时，服务器会fork出一个子进程专门处理该连接。这种"一个客户端一个进程"的方式简单直观，就像为每位顾客配备专属服务员。 // 伪代码示例：多进程模型intmain(){int lfd =socket();// 创建监听套接字bind(lfd);// 绑定端口listen(lfd);// 开始监听while(1){int cfd =accept(lfd);// 接受新连接if(fork()==0){// 创建子进程close(

【鸿蒙心迹】可可图片编辑 HarmonyOS 上架应用分享

可可图片编辑 HarmonyOS 上架应用分享介绍可可图片编辑原名图片编辑大师，因为上架审核的时候，提示与一些已有应用重名，为了避免冲突，需要改名字，所以苦心思考了一分钟，就调整成可可图片编辑。应用应用商店访问链接 https://appgallery.huawei.com/app/detail?id=tupianbmjidashi.qinglanzhuma.huawei&channelId=SHARE 功能展示可可图片编辑提供了图片处理的六大核心功能 * 图片压缩 * 图片裁剪 * 滤镜效果 * 添加水印 * 图片绘画 * 图片拼图其中比较有意思的是也实现了图片的分享功能，这个在开发的时候也是调试了一段时间。开发和上架过程这个APP的开发过程是可以说是有90%是AI完成的，确实也摸索出一些自己的心得，上架过程只被打回一次，后续再提交也就通过了，还是挺顺利。开发时间立项的初衷抱着学习的心态来做产品，是最好验收自己掌握技能与否的方法，

前言