跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI算法

Qwen3.5 核心特性与性能详解:原生多模态开源大模型

综述由AI生成Qwen3.5-397B-A17B 作为原生多模态开源大模型,在预训练效率、异构基础设施及推理性能上实现显著升级。该模型采用极致稀疏 MoE 架构,支持 256K 上下文并扩展至 1M,具备强大的视觉理解与 Agent 构建能力。相比竞品,其在多语言支持、解码吞吐量及部署成本方面表现优异,API 定价极具竞争力,填补了国内多模态开源领域的空白。

ByteFlow发布于 2026/3/29更新于 2026/6/919 浏览
Qwen3.5 核心特性与性能详解:原生多模态开源大模型

背景介绍

2025 年 DeepSeek-R1 模型的发布震惊了全球,随后国内各大厂商纷纷在重大节日推出新品。今年除夕夜,阿里 Qwen 团队正式开源了 Qwen3.5 模型,为国产大模型阵营再添一员猛将。

Qwen3.5 核心特性展示

Qwen3.5 是目前全球最强的原生多模态开源大模型,支持图片和视频的多模态输入,在对话、推理、编程及 Agent 构建等方面表现均衡。其综合能力已达到 GPT-5.2 与 Gemini 3.0 Pro 的平均水平,尤其在推理能力上表现突出。例如面对'50 米距离该走路还是开车去洗车'这类逻辑题,Qwen3.5 也能轻松作答。

Qwen3.5 视觉推理能力

在 Vibe Coding 方面,Qwen3.5 可借助 Remotion Skills 一键生成视频;在 Agentic Coding 方面,即便使用最简略的需求描述,它也能自动调用各类工具完成复杂应用开发。视觉推理能力相较 Qwen3-VL 大幅提升,连'鲨鱼骑马 = 沙琪玛'这种梗图都能精准识别。

Qwen3.5 代码转译能力

更令人关注的是,Qwen3.5 能够将视觉与代码能力结合,一步到位将视频内容转译为可交互的网页。这不仅填补了国内多模态开源大模型的空白,也为未来多模态 Agent 的开发奠定了坚实基础。

Qwen3.5 综合架构

Qwen3.5-397B-A17B 核心特性

预训练:能力、效率与通用性的全面升级

Qwen3.5 在预训练阶段从三个维度进行了深度优化:

  • 能力(Power):在更大规模的视觉 - 文本语料上训练,加强中英文、多语言、STEM 与推理数据的比重,采用更严格的过滤策略。最终,Qwen3.5-397B-A17B 与参数量超过 1T 的 Qwen3-Max-Base 表现相当,实现了跨代持平。
  • 效率(Efficiency):基于 Qwen3-Next 架构,引入更高稀疏度的 MoE、Gated DeltaNet + Gated Attention 混合注意力机制,配合稳定性优化与多 token 预测。在 32k/256k 上下文长度下,Qwen3.5-397B-A17B 的解码吞吐量分别达到 Qwen3-Max 的 8.6 倍/19.0 倍,以及 Qwen3-235B-A22B 的 3.5 倍/7.2 倍,性能不变但效率大幅提升。
  • 通用性(Versatility):通过早期文本 - 视觉融合与扩展的视觉/STEM/视频数据,实现了原生多模态能力,在相近规模下显著优于 Qwen3-VL。多语言支持从 119 种增至 201 种语言/方言;词表从 15 万扩展至 25 万,在多数语言上带来了约 10%~60% 的编码/解码效率提升。

Qwen3.5 预训练优化

异构基础设施:高效训练与强化学习的系统支撑

Qwen3.5 通过异构基础设施设计,实现了高效的原生多模态训练:

  • 解耦并行策略:针对视觉与语言组件采用不同的并行策略,避免统一方案带来的低效,实现跨模块计算重叠。在混合文本 - 图像 - 视频数据上,训练吞吐量相比纯文本基线几乎无损(接近 100%)。
  • 原生 FP8 流水线:对激活、MoE 路由与 GEMM 运算采用低精度 FP8,同时通过运行时监控在敏感层保持 BF16,从而降低约 50% 的激活显存占用,并获得超过 10% 的加速。该设计稳定支持了数万亿 token 的训练扩展。
  • 可扩展异步强化学习框架:为持续释放强化学习的潜力,构建了训推分离的异步强化学习框架,全面覆盖文本、多模态及多轮交互场景。该框架通过动态负载均衡、细粒度故障恢复,以及 FP8 训推、Rollout 路由回放、投机采样、多轮 Rollout 锁定等技术,实现了 3×–5× 的端到端加速,同时显著提升了训练曲线的稳定性和性能上限。框架原生支持百万级规模的智能体工作流与环境交互,为模型泛化能力的增强提供了坚实基础。

Qwen3.5 基础设施

Qwen3.5-397B-A17B 性能详解

除夕夜开源的 Qwen3.5-397B-A17B 是 Qwen3.5 系列的首款模型。未来,Qwen3.5 还将陆续开源一系列小尺寸模型,同时保留 Qwen3.5-Max 的商业旗舰地位(该模型不会开源)。

模型架构与部署

  • 参数规模:模型拥有近 4000 亿总参数,采用极致稀疏 MoE 架构,每次推理仅激活 170 亿参数,大幅降低计算开销。
  • 技术创新:引入注意力门控机制(该技术获 2025 年 NeurIPS 最佳论文奖),实现了降本增效。与上一代商业旗舰 Qwen3-Max-Thinking(近 1T 参数)相比,Qwen3.5-397B-A17B 在性能超越的同时,部署显存占用降低 60%,最大推理吞吐量提升至原来的 19 倍。

硬件需求方面,尽管极致稀疏,但完整运行仍需至少 8 卡 A100(80G)集群;不过 17B 的激活参数使得实际推理效率极高。

Qwen3.5 架构部署

推理模式与上下文

  • 混合推理模型:Qwen3.5 默认进行推理,与 Qwen3 不同的是,它不支持通过 <no_thinking> 前缀取消推理,只能通过修改内置提示词模板(通常位于 tokenizer_config.json 中)切换至 Chat 模式。
  • 超长上下文:默认上下文长度为 256K,通过配置最多可扩展至 1M,相当于可一次性处理约 2 小时的视频内容。

性能对比与亮点

  • 全能型表现:Qwen3.5-397B-A17B 是目前国内最强的一款全能型开源大模型,对话、编程、视觉识别、视觉理解、Agent 搭建等能力均已追平 GPT-5.2、Gemini 3.0 Pro 和 Claude Opus4.5。在编程专项上,与最新的 GPT-5.3-CodeX、Claude Opus4.6 相比仍有约 10% 的差距,但依然是国内最佳。
  • 原生多模态优势:文本、图像、视频在统一语义空间处理,对图文混排的 PDF 等文档可直接识别与检索,无需传统的多模态 RAG 流程。视觉推理能力极强,有博主实验证明 Qwen3.5 能高精度识别复杂的 Agent 项目架构图,并准确分析功能、关联和内在逻辑,甚至可以借助其强大的编程能力复刻相同架构的 Agent——类似 Claude 的视觉编程魅力,国人终于也能体验到了!

Qwen3.5 性能对比

开源与 API

  • 模型下载:Qwen3.5-397B-A17B 已全面开源,可在魔搭社区(ModelScope)或 Hugging Face 下载模型权重。
  • API 服务:阿里百炼平台同步上线了模型 API,注意区分两个版本:
    • Qwen3.5(开源模型):原始开源模型版本。
    • Qwen3.5-Plus:开源模型搭配基础工具(如网络搜索)后的通用 Agent,并非纯模型。
  • 定价:API 定价极低,输入百万 tokens 仅 0.8 元,输出百万 tokens 仅 4.8 元,性价比是同性能 Gemini 3.0 Pro 的 1/18,真正'拉满'性价比。

Qwen3.5 API 定价

总结

Qwen3.5-397B-A17B 的发布,为 2026 年春节的国产大模型赛道打响了头炮。与此同时,万众期待的 DeepSeek-V4 也即将来袭,这个春节可谓'神仙打架'。正是这些公司雄厚的技术积淀,撑起了我国大模型在世界舞台上的领先地位。随着技术的不断迭代,国产大模型产业有望继续取得突破。

目录

  1. 背景介绍
  2. Qwen3.5-397B-A17B 核心特性
  3. 预训练:能力、效率与通用性的全面升级
  4. 异构基础设施:高效训练与强化学习的系统支撑
  5. Qwen3.5-397B-A17B 性能详解
  6. 模型架构与部署
  7. 推理模式与上下文
  8. 性能对比与亮点
  9. 开源与 API
  10. 总结
  • 免费图片AI生成工具免费生成了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 免费图片视频在线生成30秒,将你的创意变成现实开始设计
  • X/Twitter免费视频下载器免登陆无限额度免费视频解析下载了解详情
  • 100+免费在线小游戏爽一把
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 智能电视芯片架构对比:ARM Cortex-A73 与 A55 性能差异
  • Linux 动态库与静态库技术详解
  • 从 Python 到 OpenClaw:本地 AI 助理构建实战路径
  • C++ 算法刷题:气球排列、迷宫搜索与主持人调度
  • 算法实战:替换所有问号与提莫攻击的模拟解法
  • Linux 线程同步与互斥机制详解
  • OPENWEBUI 与传统手工开发电商详情页效率对比
  • FPGA 入门实战:利用 LED 实现 2 选 1 多路选择器
  • LeetCode 179 最大数 贪心算法解析
  • OpenClaw 本地 AI 助手部署与使用指南
  • 攻防世界 Web 题解:SQL 注入、文件上传与命令注入
  • 机器人算法十年演进:从几何计算到具身智能决策
  • 栈数据结构详解与算法应用实例
  • CentOS 7 Docker 安装指南
  • 在 Cursor 中配置和使用 MCP 服务指南
  • C++ 核心特性解析:引用、内联函数与 nullptr
  • Python 临床知识问答与检索系统架构及实现
  • noteDigger 纯前端音频扒谱工具技术解析
  • C++ 基础入门指南
  • Linux 进程概念(下):环境变量与程序地址空间

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online