阶跃星辰正式亮相:推出千亿与万亿参数模型及两款应用
国内基础大模型创业公司阶跃星辰(StepFun)正式来到台前。该公司由微软前全球副总裁姜大昕创办,在成立一年后低调发布了面向 C 端的两款应用以及新一代大模型技术。
两款 C 端产品全面开放使用
阶跃星辰直接带来了 2 款面向 C 端市场的应用,均全面开放使用:
- 跃问:定位为个人效率助手,支持聊天、联网检索、文件处理及多模态理解。
- 冒泡鸭:AI 开放世界平台,提供海量智能体,主打休闲娱乐与剧情互动。
跃问功能实测
作为效率工具,跃问展现了较强的综合能力:
- 基本问答:能够进行多维度对比分析,如对比不同大模型的架构、安全性等,并支持以图表形式呈现结果。
- 联网与信息检索:知识库信息截止至 2023 年,后续信息通过实时搜索获取。例如能准确检索到马斯克脑机接口公司的最新进展。
- 文件处理:支持上传字幕文件总结长视频内容,或解析 arXiv 论文链接提取核心内容。
- 数据处理:利用代码解释器能力解决图片转表格、净增长率计算等复杂逻辑推理任务。
- 多模态能力:支持解读表情包、识别复杂图表中的 Logo 并分类,阅读清晰度优于部分同类竞品。
冒泡鸭体验
冒泡鸭拥有 App 版和 Web 版,平台上载有由多模态大模型驱动的智能对话体。用户可以探索有趣的剧情互动游戏,也可以基于官方文档上手创建自定义智能体。其对话流畅度与沉浸感较强,适合娱乐场景。
'铁人四项'攀登万亿参数模型
两款 C 端产品的背后,是阶跃星辰已成熟训练的两款千亿参数大模型,统称为 Step 系列:
- Step-1:千亿参数语言大模型,综合性能超过 GPT-3.5。
- Step-1V:千亿参数多模态大模型,可精准描述和理解图像中的文字、数据、图表等信息,并能理解视频内容。在上海人工智能实验室'司南'评测中位列第一,性能比肩 GPT-4V。
Step-2:万亿参数 MoE 预览
在国内初创公司首次交出万亿参数模型答卷的节点上,阶跃星辰展示了万亿参数 MoE 语言大模型 Step-2 的预览版。该模型于去年 12 月启动训练,目前处于稳定阶段。
姜大昕表示,团队坚信 Scaling Law,追求多模理解和生成的统一。Step 系列大模型将为这一目标奠定坚实基础。
技术挑战与解决方案
攀登 Scaling Law 被视为一个'铁人四项'般的超级工程,涉及算力、系统、数据、算法四个维度:
- 算力:通过自建机房 + 租用算力积极储备。训练万亿模型需要等效 A800 万卡单一集群,进行高效稳定的训练。
- 系统:核心成员实践过单集群万卡以上的系统建设与管理,训练千亿模型的 MFU(有效算力输出)达 57%。
- 数据:数据团队核心骨干出身必应搜索引擎,曾支持全球 100 多种语言,建立了强大的数据处理和知识图谱流水线,确保十万亿 tokens 的高质量数据供给。
- 算法:团队不仅能驾驭各种架构,包括万亿参数的 MoE 架构,而且对大模型的认知及发展路线有深刻洞察。
MoE(混合专家模型)架构通过动态激活部分参数来平衡计算成本与模型能力,是通往更大规模模型的关键路径之一。Scaling Law 指出模型性能随参数量、数据量和计算量增加而提升,但需满足特定条件才能有效扩展。阶跃星辰提出的四要素正是为了保障这一规律的有效性。
核心团队背景
面对铁人四项和多模态融合之路,阶跃星辰组建了一支 150 多人的队伍。
- 姜大昕(CEO/算法负责人):获纽约州立大学计算机科学博士,曾任微软亚洲互联网工程院首席科学家,负责必应搜索技术研发。2011 年转入微软 STCA,2023 年升任微软副总裁。离开微软是因为希望从被动调用 API 转向主动掌控模型算法迭代。
- 焦斌星(数据负责人):中科大和 MSRA 联合培养博士,微软必应引擎核心搜索团队前负责人,擅长数据挖掘和 NLP 算法优化索引和搜索质量。


