阿里 Qwen 系列更新
Qwen-Coder-Qoder
阿里 AI 编程工具 Qoder 正式发布强化学习模型 Qwen-Coder-Qoder。该模型基于 Qwen-Coder 基座,结合 Agent 框架与工具,通过自研 ROLL 训练框架进行大规模强化学习,旨在提升端到端编程体验。 在 Qoder Bench 评测中,任务解决率超越 Cursor Composer-1,Windows 系统下终端命令准确率领先幅度达 50%。实际应用中代码留存率提升 3.85%,工具异常率降低 61.5%,Token 消耗下降 14.5%。 核心特性包括遵守软件工程规范、项目全局感知能力、高效并行处理无依赖任务及持续解决复杂问题的韧性。技术实现依赖真实 Agent 沙盒环境学习、软件工程最佳实践奖励信号及对抗机制防止作弊。
Qwen3.5 系列
通义千问团队发布 Qwen3.5 模型家族多个型号,涵盖 Qwen3.5-Flash、Qwen3.5-35B-A3B、Qwen3.5-122B-A10B 和 Qwen3.5-27B。 其中 Qwen3.5-397B-A17B 为首款原生多模态模型,总参数 3970 亿,激活参数 170 亿,采用线性注意力与稀疏混合专家架构,支持思考与快速两种模式。语言与方言支持增至 201 种,解码吞吐量最高提升 19 倍,原生支持超 26 万 token 上下文。 Qwen3.5-35B-A3B 性能超越前代 Qwen3-235B-A22B,融合线性注意力与标准注意力提升效率。Qwen3.5-122B-A10B 与 Qwen3.5-27B 专注 Agent 场景复杂推理与规划。所有模型权重已在 Hugging Face 和 ModelScope 发布。
智谱与阶跃星辰
GLM-OCR 与 GLM-5
智谱发布轻量级专业 OCR 模型 GLM-OCR,参数规模 0.9B,基于 GLM-V 编码器 - 解码器架构,OmniDocBench V1.5 评测登顶。支持中、英、法等多种语言通用文本识别,可直接解析 HTML 或输出 JSON。 智谱上线并开源 GLM-5,定位为面向复杂系统工程和长程 Agentic 任务的基座模型。参数规模从 GLM-4.5 的 355B 提升至 744B(激活 40B),预训练数据增加至 28.5T tokens。集成 DeepSeek Sparse Attention,上下文长度 200K,最大输出 128K。在 SWE-bench-Verified 中获得 77.8 分,BrowseComp 等基准取得开源模型最佳表现。
Step 3.5 Flash
阶跃星辰发布新一代开源基座模型 Step 3.5 Flash,专为 Agent 场景设计。采用 196B 总参数(激活 11B)的稀疏 MoE 架构,支持 256K 上下文,利用 MTP-3 技术在单请求代码任务中实现最高 350 TPS 推理速度。 具备 Think-and-Act 协同机制,支持大规模工具编排,能通过单 Agent 循环生成万字研究报告。已完成对华为昇腾等六大国产 AI 芯片适配,支持在 Apple M4 Max 等高端个人硬件上私有部署。
字节跳动与快手
Seedance 2.0
字节跳动发布视频创作模型 Seedance 2.0,采用多模态音视频联合架构,支持文字、图片、音频、视频四种输入。可混合输入 9 张图片、3 段视频、3 段音频及指令。模型具备视频编辑与延长功能,支持 15 秒高质量多镜头音视频输出及双声道立体声音频。在运动稳定性、指令遵循、画面美感及多模态参考理解方面表现突出。
可灵 3.0
快手可灵正式发布 3.0 版本产品套件,包含视频 3.0、图片 3.0 及其对应的 Omni 增强版。核心升级包括视频生成时长延长至 15 秒、强化主体一致性、支持原生 2K/4K 图像输出。智能分镜功能可深度理解剧本,自动调度景别与机位以生成电影感叙事。
BitDance
字节跳动研究团队发布开源离散自回归多模态模型 BitDance,参数量 14B,专为视觉生成优化。支持每步并行预测最多 64 个视觉 Token,推理速度比标准 AR 模型快 30 倍以上。提供 BitDance-14B-64x 和 BitDance-14B-16x 两个版本。
蚂蚁集团与腾讯
Ming-flash-omni 2.0 与 Ling-2.5-1T
蚂蚁集团发布全模态大模型 Ming-flash-omni 2.0,基于 Ling-2.0 架构(100B-A6B MoE),聚焦专家级多模态认知、统一声学合成与高动态图像处理。基准测试在 HallusionBench、MMvet、ChartQA 等多指标超越 Gemini 2.5 Pro。 蚂蚁百灵发布旗舰级即时模型 Ling-2.5-1T,总参数 1T,激活参数 630 亿,预训练语料扩展至 29T tokens,采用混合线性注意力架构,支持最长 1M token 上下文。引入正确性加过程冗余复合奖励机制,推理能力接近前沿思考模型水平。
HY-1.8B-2Bit
腾讯混元推出面向消费级硬件的 HY-1.8B-2Bit 模型,基于产业级 2Bit 端侧量化技术。等效参数量为 0.3B,内存占用 600MB,文件大小仅 300MB。在真实端侧设备上,生成速度相较原始精度模型提升 2 至 3 倍,完整保留全思维链推理能力及 Dual-CoT 策略。

