2026 年 2 月 AIGC 行业模型发布与前沿资讯汇总
本月 AI 领域更新密集,各大厂商在编程智能体、多模态生成及基础架构优化上均有显著动作。以下按技术方向梳理核心动态。
编程与智能体工具
阿里 Qwen 系列
- Qwen-Coder-Qoder: 专为 Qoder 平台打造的强化学习模型,基于 ROLL 框架训练。在 Qoder Bench 评测中任务解决率超越 Cursor Composer-1,Windows 终端命令准确率领先 50%。代码留存率提升 3.85%,Token 消耗下降 14.5%。
- Qwen3-Coder-Next: 800 亿参数混合注意力 MoE 模型,激活 30 亿。SWE-Bench Verified 得分 70.6%,优于 DeepSeek-V3.2 和 GLM-4.7。
- Qwen3.5 系列: 发布 Qwen3.5-397B-A17B 等多款模型。原生支持超 26 万 token 上下文,API 版本支持 1M 上下文。解码吞吐量最高提升 19 倍。
- SWE-Universe: 与浙大合作构建的自动化软件工程训练环境框架,已构建 80 万个可执行环境,助力 Qwen3-Max-Thinking 在 SWE-Bench Verified 达到 75.3%。
其他编程与 Agent 模型
- 智谱 GLM-5: 开源基座模型,参数扩至 744B(激活 40B),预训练数据 28.5T tokens。集成 DeepSeek Sparse Attention,SWE-bench-Verified 获 77.8 分,开源 SOTA。
- 阶跃星辰 Step 3.5 Flash: 196B 总参数(激活 11B)MoE 模型,支持 256K 上下文。开启 Parallel Thinking 后数学推理表现领先,适配华为昇腾等六大国产芯片。
- MiniMax M2.5: 正式开源,230B 总参数(激活 10B)。支持 SGLang、vLLM 部署。
- DeepSeek 新模型: 上线 1M 上下文窗口新模型,响应速度提升,知识库截止 2025 年 5 月。传闻总参数约 200B。
- Cursor Cloud Agents: 推出新版云端虚拟机智能体,可直接控制计算机,内部 PR 合并超 30% 由 Agent 创建。
- BOSS 直聘 Nanbeige4.1-3B: 3B 参数模型,LiveCodeBench-Pro 表现显著,支持 256k 上下文处理深度搜索。
- 京东 JoyAI-LLM-Flash: 480 亿参数 MoE 模型,激活 30 亿。HumanEval 得分 96.34%,SWE-bench Verified 得分 60.60%。
- OpenRouter Pony Alpha: 上线 stealth 模型,支持 coding 与 reasoning,提供 200K tokens 上下文。
视觉与视频生成
视频与图像模型
- 字节 Seedance 2.0: 支持图文音视频四模态输入,生成长度 4-15 秒。攻克物理规律合理性难题,人脸与服装一致性显著提升。
- 快手可灵 3.0: 视频时长延长至 15 秒,支持原生 2K/4K 输出。全能音画功能支持多语种口型匹配。
- 千问 Qwen-Image-2.0: 统一图像生成与编辑模型,支持 2K 分辨率与 1k token 指令。文字渲染能力增强,AI Arena 盲测文生图排名第三。
- Google Nano Banana 2: 融合 Pro 智能与 Flash 速度,位列 Image Arena 榜首。支持实时网络搜索优化,成本较 Pro 版降 50%。
- 高德 FantasyWorld: 开源几何一致世界模型,单次前向传播生成视频与 3D 场景信息,已被 ICLR 2026 收录。
- 小红书 FireRed 系列: 开源 FireRed-Image-Edit-1.0 图像编辑模型及 FireRedASR2S 语音识别系统,性能达 SOTA。
- xAI Grok Imagine 1.0: 实现静态到高清视频跨越,最长 10 秒,720p 分辨率。

