2026 年 2 月 AIGC 行业模型发布与前沿资讯汇总

本月 AI 领域更新密集，各大厂商在编程智能体、多模态生成及基础架构优化上均有显著动作。以下按技术方向梳理核心动态。

阿里 Qwen 系列

Qwen-Coder-Qoder: 专为 Qoder 平台打造的强化学习模型，基于 ROLL 框架训练。在 Qoder Bench 评测中任务解决率超越 Cursor Composer-1，Windows 终端命令准确率领先 50%。代码留存率提升 3.85%，Token 消耗下降 14.5%。
Qwen3-Coder-Next: 800 亿参数混合注意力 MoE 模型，激活 30 亿。SWE-Bench Verified 得分 70.6%，优于 DeepSeek-V3.2 和 GLM-4.7。
Qwen3.5 系列: 发布 Qwen3.5-397B-A17B 等多款模型。原生支持超 26 万 token 上下文，API 版本支持 1M 上下文。解码吞吐量最高提升 19 倍。
SWE-Universe: 与浙大合作构建的自动化软件工程训练环境框架，已构建 80 万个可执行环境，助力 Qwen3-Max-Thinking 在 SWE-Bench Verified 达到 75.3%。

其他编程与 Agent 模型

智谱 GLM-5: 开源基座模型，参数扩至 744B（激活 40B），预训练数据 28.5T tokens。集成 DeepSeek Sparse Attention，SWE-bench-Verified 获 77.8 分，开源 SOTA。
阶跃星辰 Step 3.5 Flash: 196B 总参数（激活 11B）MoE 模型，支持 256K 上下文。开启 Parallel Thinking 后数学推理表现领先，适配华为昇腾等六大国产芯片。
MiniMax M2.5: 正式开源，230B 总参数（激活 10B）。支持 SGLang、vLLM 部署。
DeepSeek 新模型: 上线 1M 上下文窗口新模型，响应速度提升，知识库截止 2025 年 5 月。传闻总参数约 200B。
Cursor Cloud Agents: 推出新版云端虚拟机智能体，可直接控制计算机，内部 PR 合并超 30% 由 Agent 创建。
BOSS 直聘 Nanbeige4.1-3B: 3B 参数模型，LiveCodeBench-Pro 表现显著，支持 256k 上下文处理深度搜索。
京东 JoyAI-LLM-Flash: 480 亿参数 MoE 模型，激活 30 亿。HumanEval 得分 96.34%，SWE-bench Verified 得分 60.60%。
OpenRouter Pony Alpha: 上线 stealth 模型，支持 coding 与 reasoning，提供 200K tokens 上下文。

视频与图像模型

字节 Seedance 2.0: 支持图文音视频四模态输入，生成长度 4-15 秒。攻克物理规律合理性难题，人脸与服装一致性显著提升。
快手可灵 3.0: 视频时长延长至 15 秒，支持原生 2K/4K 输出。全能音画功能支持多语种口型匹配。
千问 Qwen-Image-2.0: 统一图像生成与编辑模型，支持 2K 分辨率与 1k token 指令。文字渲染能力增强，AI Arena 盲测文生图排名第三。
Google Nano Banana 2: 融合 Pro 智能与 Flash 速度，位列 Image Arena 榜首。支持实时网络搜索优化，成本较 Pro 版降 50%。
高德 FantasyWorld: 开源几何一致世界模型，单次前向传播生成视频与 3D 场景信息，已被 ICLR 2026 收录。
小红书 FireRed 系列: 开源 FireRed-Image-Edit-1.0 图像编辑模型及 FireRedASR2S 语音识别系统，性能达 SOTA。
xAI Grok Imagine 1.0: 实现静态到高清视频跨越，最长 10 秒，720p 分辨率。

更多推荐文章