2026 年 2 月 AIGC 行业模型发布及前沿资讯汇总

2026 年 2 月 AIGC 领域密集发布多款开源与闭源模型。阿里推出 Qwen3.5 系列及编程模型，智谱发布 GLM-5 基座，阶跃星辰开源 Step 3.5 Flash。字节跳动更新 Seedance 2.0 视频生成模型，快手可灵升级至 3.0。蚂蚁集团发布 Ming-flash-omni 2.0 全模态模型及 Ring-2.5-1T 推理模型。OpenAI 更新 GPT-5.2 系列提速，Google DeepMind 发布 Lyria 3 音乐模型。此外还有 MiniCPM-o 4.5、Voxtral Mini 4B 实时语音等模型上线，涵盖代码、视觉、音频及具身智能方向，推动多模态与 Agent 技术发展。

HadoopMan发布于 2026/3/24更新于 2026/7/2541 浏览

阿里 Qwen 系列更新

Qwen-Coder-Qoder

阿里 AI 编程工具 Qoder 正式发布强化学习模型 Qwen-Coder-Qoder。该模型基于 Qwen-Coder 基座，结合 Agent 框架与工具，通过自研 ROLL 训练框架进行大规模强化学习，旨在提升端到端编程体验。在 Qoder Bench 评测中，任务解决率超越 Cursor Composer-1，Windows 系统下终端命令准确率领先幅度达 50%。实际应用中代码留存率提升 3.85%，工具异常率降低 61.5%，Token 消耗下降 14.5%。核心特性包括遵守软件工程规范、项目全局感知能力、高效并行处理无依赖任务及持续解决复杂问题的韧性。技术实现依赖真实 Agent 沙盒环境学习、软件工程最佳实践奖励信号及对抗机制防止作弊。

Qwen3.5 系列

通义千问团队发布 Qwen3.5 模型家族多个型号，涵盖 Qwen3.5-Flash、Qwen3.5-35B-A3B、Qwen3.5-122B-A10B 和 Qwen3.5-27B。其中 Qwen3.5-397B-A17B 为首款原生多模态模型，总参数 3970 亿，激活参数 170 亿，采用线性注意力与稀疏混合专家架构，支持思考与快速两种模式。语言与方言支持增至 201 种，解码吞吐量最高提升 19 倍，原生支持超 26 万 token 上下文。 Qwen3.5-35B-A3B 性能超越前代 Qwen3-235B-A22B，融合线性注意力与标准注意力提升效率。Qwen3.5-122B-A10B 与 Qwen3.5-27B 专注 Agent 场景复杂推理与规划。所有模型权重已在 Hugging Face 和 ModelScope 发布。

智谱与阶跃星辰

GLM-OCR 与 GLM-5

智谱发布轻量级专业 OCR 模型 GLM-OCR，参数规模 0.9B，基于 GLM-V 编码器 - 解码器架构，OmniDocBench V1.5 评测登顶。支持中、英、法等多种语言通用文本识别，可直接解析 HTML 或输出 JSON。智谱上线并开源 GLM-5，定位为面向复杂系统工程和长程 Agentic 任务的基座模型。参数规模从 GLM-4.5 的 355B 提升至 744B（激活 40B），预训练数据增加至 28.5T tokens。集成 DeepSeek Sparse Attention，上下文长度 200K，最大输出 128K。在 SWE-bench-Verified 中获得 77.8 分，BrowseComp 等基准取得开源模型最佳表现。

Step 3.5 Flash

阶跃星辰发布新一代开源基座模型 Step 3.5 Flash，专为 Agent 场景设计。采用 196B 总参数（激活 11B）的稀疏 MoE 架构，支持 256K 上下文，利用 MTP-3 技术在单请求代码任务中实现最高 350 TPS 推理速度。具备 Think-and-Act 协同机制，支持大规模工具编排，能通过单 Agent 循环生成万字研究报告。已完成对华为昇腾等六大国产 AI 芯片适配，支持在 Apple M4 Max 等高端个人硬件上私有部署。

字节跳动与快手

Seedance 2.0

字节跳动发布视频创作模型 Seedance 2.0，采用多模态音视频联合架构，支持文字、图片、音频、视频四种输入。可混合输入 9 张图片、3 段视频、3 段音频及指令。模型具备视频编辑与延长功能，支持 15 秒高质量多镜头音视频输出及双声道立体声音频。在运动稳定性、指令遵循、画面美感及多模态参考理解方面表现突出。

可灵 3.0

快手可灵正式发布 3.0 版本产品套件，包含视频 3.0、图片 3.0 及其对应的 Omni 增强版。核心升级包括视频生成时长延长至 15 秒、强化主体一致性、支持原生 2K/4K 图像输出。智能分镜功能可深度理解剧本，自动调度景别与机位以生成电影感叙事。

BitDance

字节跳动研究团队发布开源离散自回归多模态模型 BitDance，参数量 14B，专为视觉生成优化。支持每步并行预测最多 64 个视觉 Token，推理速度比标准 AR 模型快 30 倍以上。提供 BitDance-14B-64x 和 BitDance-14B-16x 两个版本。

蚂蚁集团与腾讯

Ming-flash-omni 2.0 与 Ling-2.5-1T

蚂蚁集团发布全模态大模型 Ming-flash-omni 2.0，基于 Ling-2.0 架构（100B-A6B MoE），聚焦专家级多模态认知、统一声学合成与高动态图像处理。基准测试在 HallusionBench、MMvet、ChartQA 等多指标超越 Gemini 2.5 Pro。蚂蚁百灵发布旗舰级即时模型 Ling-2.5-1T，总参数 1T，激活参数 630 亿，预训练语料扩展至 29T tokens，采用混合线性注意力架构，支持最长 1M token 上下文。引入正确性加过程冗余复合奖励机制，推理能力接近前沿思考模型水平。

HY-1.8B-2Bit

腾讯混元推出面向消费级硬件的 HY-1.8B-2Bit 模型，基于产业级 2Bit 端侧量化技术。等效参数量为 0.3B，内存占用 600MB，文件大小仅 300MB。在真实端侧设备上，生成速度相较原始精度模型提升 2 至 3 倍，完整保留全思维链推理能力及 Dual-CoT 策略。

2026 年 2 月 AIGC 行业模型发布及前沿资讯汇总

阿里 Qwen 系列更新

Qwen-Coder-Qoder

Qwen3.5 系列

智谱与阶跃星辰

GLM-OCR 与 GLM-5

Step 3.5 Flash

字节跳动与快手

Seedance 2.0

可灵 3.0

BitDance

蚂蚁集团与腾讯

Ming-flash-omni 2.0 与 Ling-2.5-1T

HY-1.8B-2Bit

2026 年 2 月 AIGC 行业模型发布及前沿资讯汇总

阿里 Qwen 系列更新

Qwen-Coder-Qoder

Qwen3.5 系列

智谱与阶跃星辰

GLM-OCR 与 GLM-5

Step 3.5 Flash

字节跳动与快手

Seedance 2.0

可灵 3.0

BitDance

蚂蚁集团与腾讯

Ming-flash-omni 2.0 与 Ling-2.5-1T

HY-1.8B-2Bit

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

LongCat-Flash-Lite

OpenAI 与 Google

GPT-5.2 与 GPT-5.3-Codex-Spark

Lyria 3 与 Nano Banana 2

其他重要发布

MiniCPM-o 4.5

Voxtral Mini 4B Realtime

Thinker

SimpleSeg

ConceptMoE

ACE-Step 1.5

SERA-14B

Intern-S1-Pro

MOSI-TTS 家族

LLaDA2.1

Nanbeige4.1-3B

SoulX-Singer

Z Code

MiniMax-M2.5

Ring-2.5-1T

JoyAI-LLM-Flash

Tiny Aya

Cursor Cloud Agents

FantasyWorld

FireRed 系列

Ovis2.6-30B-A3B

INTELLECT-3.1

MiMo-V2-Flash-0204

HPC-Ops

OpenViking

EB-JEPA

Waymo World Model

SWE-Universe

Qwen-Image-2.0

DeepSeek 新模型

BOSS 直聘 Netege4.1-3B

讯飞星火 X2

OpenRouter Pony Alpha

豆包大模型 2.0

京东 JoyAI-LLM-Flash

阿里千问 Qwen3.5-397B-A17B

蚂蚁百灵 Ling-2.5-1T

蚂蚁集团 Ming-omni-tts

Cohere Labs Tiny Aya

字节跳动 BitDance

Google DeepMind Lyria 3

Prime Intellect INTELLECT-3.1

阿里千问 Qwen3.5 系列

Cursor Cloud Agents