引言
2 月 13 日,百灵大模型发布并开源了首个混合线性架构的万亿参数思考模型 Ring-2.5-1T。本文体验了 Ling Studio 这一核心产品,深入挖掘其在实际开发场景中的应用潜力。

Ling Studio: https://ling.tbox.cn/chat
GitHub 开源仓库:https://github.com/inclusionAI
HuggingFace 开源仓库:https://huggingface.co/inclusionAI
万亿级混合线性注意力架构(Ling 2.5)
在通用智能体(General Agent)逐步成为基础模型主要形态的背景下,深度推理能力与超长上下文建模能力已成为新一代大模型的核心指标。为应对这一挑战,Ling 2.5 在 Ling 2.0 架构之上,引入了一套面向万亿参数规模的混合线性注意力(Hybrid Linear Attention)体系。
该体系通过增量式结构迁移,将原有的 GQA(Grouped Query Attention)模块升级为由 Multi-head Linear Attention(MLA)与 Lightning Linear Attention 按 1:7 比例混合组成的新型注意力骨干,从而在保持表达能力的同时,显著提升长序列推理的系统效率。

具体而言,基于既有的 Ring-Flash-Linear-2.0 技术路线,架构中部分 GQA 层被直接替换为 Lightning Linear Attention,用于承担高吞吐解码路径,在长视野推理与多轮思考场景中显著降低时间复杂度与显存访问成本。
与此同时,其余 GQA 层则被近似映射为 MLA 结构,以进一步压缩 KV Cache 并减少跨步注意力计算的开销。针对线性注意力在表达能力上的天然约束,Ling 2.5 在 MLA 中引入了 QK Norm(Query–Kernel 归一化)与 Partial RoPE(部分旋转位置编码)等关键机制,以增强长程依赖建模能力和位置信息保持能力。
通过上述混合线性注意力策略,Ling 2.5 在万亿级参数规模下,实现了推理效率、上下文扩展性与表达能力的协同优化,为面向通用智能体的长视野推理场景奠定了可扩展的系统基础。
一、开箱体验:快速上手 Ling Studio
1.1 进入 Ling Studio
Ling Studio 是百灵大模型推出的 AI 助手平台,集成了最新的 Ring-2.5-1T 模型。访问 Ling Studio 官网后,用户可以快速注册并进入主界面。最新的 Ling 大模型也已同步上架到 Tbox 主对话框,用户可以在熟悉的 Tbox 环境中直接调用 Ling 的强大能力。


















