跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI算法

2026 年 2 月 AIGC 行业模型发布及前沿资讯

2026 年 2 月 AIGC 领域密集发布多款新模型,涵盖编程、视觉、语音及具身智能方向。阿里推出 Qwen-Coder-Qoder 及 Qwen3.5 系列,智谱发布 GLM-OCR 与 GLM-5,蚂蚁集团开源 Ring-2.5-1T 与 Ming-omni-tts。字节跳动发布 Seedance 2.0 视频模型及 BitDance 多模态模型,美团推出 LongCat-Flash-Lite。OpenAI 更新 GPT-5.2 系列,Google DeepMind 发布 Lyria 3 音乐模型。众多厂商聚焦长上下文、端侧量化及 Agent 能力提升,开源生态持续活跃。

Kubernet发布于 2026/4/6更新于 2026/5/2335 浏览

1. 阿里 Qoder 发布 Qwen-Coder-Qoder

阿里 AI 编程工具 Qoder 正式发布专为自身平台打造的强化学习模型 Qwen-Coder-Qoder。该模型基于 Qwen-Coder 基座,紧密结合其 Agent 框架与工具,通过自研的 ROLL 训练框架进行大规模强化学习,旨在提升端到端的编程体验。

在面向真实软件工程任务的 Qoder Bench 评测中,该模型的任务解决率已超越 Cursor Composer-1,尤其在 Windows 系统下,其终端命令准确率领先幅度达到 50%。在实际线上应用中,该模型已将代码留存率提升了 3.85%,工具异常率降低了 61.5%,Token 消耗下降了 14.5%。

Qwen-Coder-Qoder 的设计遵循资深开发者思维模式,核心特性包括:严格遵守软件工程规范、具备项目全局感知能力、可高效并行处理无依赖任务,以及持续解决复杂问题的韧性。其研发基于'模型即 Agent'的智能进化体系,技术实现依赖三大要素:在真实 Agent 沙盒环境中学习、引入软件工程最佳实践作为奖励信号并通过'Rewarder - Attacker'对抗机制防止模型作弊,以及利用 ROLL 框架实现数千卡集群上 10 倍以上的训练吞吐提升。

目前,Qwen-Coder-Qoder 已在产品中正式上线。

https://qoder.com/blog/qwen-coder-qoder

2. Kimi 与南大发布 SimpleSeg 赋能模型像素感知

Kimi Team 联合南京大学发布 SimpleSeg,通过将图像分割任务重构为序列生成问题,赋予多模态大语言模型(MLLM)原生像素级感知能力。该方法使模型直接在语言空间内预测物体边界的坐标点序列,采用 SFT 监督微调与基于 IoU 奖励的强化学习两阶段训练提升轮廓精度。

官方表示,SimpleSeg 在标准 MLLM 架构下无需任何专用模块,性能在多个分割基准测试中达到或超越复杂专用算法。其具备简单性、任务通用性及可解释输出三大核心优势,目前已基于 Kimi-VL 和 Qwen2.5-VL 实现模型应用。

https://simpleseg.github.io/

3. 字节研究团队发布 ConceptMoE 提升 AI 推理

ByteDance 研究团队发布 ConceptMoE 架构,通过可学习的自适应块化技术,将大语言模型处理从 Token 级别提升至概念级别。该架构利用可学习的 Chunk 模块识别最优边界,动态合并语义相似的 Token 序列为统一概念表示,实现隐式计算分配,对可预测序列进行压缩,对复杂 Token 则保留精细化计算,从而在不改变模型参数与计算量的前提下显著提升性能。

https://github.com/ZihaoHuang-notabot/ConceptMoE

https://arxiv.org/abs/2601.21420

4. 阶跃星辰发布并开源模型 Step 3.5 Flash

阶跃星辰发布新一代开源基座模型 Step 3.5 Flash,专为 Agent 场景设计。该模型采用 196B 总参数(激活 11B)的稀疏 MoE 架构,支持 256K 上下文,并利用 MTP-3 技术在单请求代码任务中实现最高 350 TPS 的推理速度。

在性能上,该模型在数学推理、代码和智能体任务上逼近顶级闭源模型。官方数据显示,开启 Parallel Thinking 后,其在 AIME、IMOAnswerBench 等数学竞赛和 BrowseComp 等智能体基准测试中表现领先,代码能力则逼近 Gemini 3.0 Pro。

核心能力方面,模型具备

目录

  1. 1. 阿里 Qoder 发布 Qwen-Coder-Qoder
  2. 2. Kimi 与南大发布 SimpleSeg 赋能模型像素感知
  3. 3. 字节研究团队发布 ConceptMoE 提升 AI 推理
  4. 4. 阶跃星辰发布并开源模型 Step 3.5 Flash
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • C++ 虚函数与纯虚函数:多态机制的深度解析
  • C++ Boost 搜索引擎数据清洗与解析实现详解
  • YOLOv26 在 RK3588 上的 RKNN ONNX 部署实践(C++)
  • Git Cherry-Pick 命令详解:精准挑选提交与冲突处理
  • Python 日志轮转避坑指南:4 个常见错误与正确配置方式
  • OpenClaw 开源 AI 智能体框架:技术架构、生态与部署实战
  • 智面玄赏联合创始人李男:人工智能赋能招聘行业——从效率革新到平台经济重构|2025极新AIGC峰会演讲实录
  • AI 产品经理职业发展路径与核心技术能力解析
  • Java 基础 (1) —— Spring Web MVC 入门
  • 链表分割算法实现:以给定值 x 为基准
  • Java 并发核心:AQS 是什么及其工作原理
  • 数据分析全流程实战:Python与MySQL数据处理及可视化对比
  • 本地离线部署 AI 大模型:Ollama + OpenClaw + Qwen3.5 实战指南
  • GPT-4 微调 API 安全漏洞分析:绕过防护与滥用风险
  • 从零开始使用 IsaacLab 训练自己的机器人行走
  • Python 中 del 语句与垃圾回收机制深度解析
  • C++ 函数重载:核心规则、底层机制与实战
  • Python 网络爬虫技术入门与实战指南
  • C++ 原子操作 compare_exchange_weak 详解
  • TurboDiffusion 视频压缩:H.264 编码体积优化技巧

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online