UC 伯克利开源 450 美元训练成本 32B 推理模型 Sky-T1
引言:推理模型的成本革命
450 美元的价格,乍一听起来不算「小数目」。但如果,这是一个 32B(320 亿参数)推理模型的全部训练成本呢?
是的,当时间来到 2025 年,推理模型正变得越来越容易开发,且成本迅速降低到我们此前无法想象的程度。近日,加州大学伯克利分校天空计算实验室的研究团队 NovaSky 发布了 Sky-T1-32B-Preview。有趣的是,团队表示:「Sky-T1-32B-Preview 的训练成本不到 450 美元,这表明可以经济、高效地复制高级推理能力。」

项目主页:https://novasky-ai.github.io/posts/sky-t1/
开源地址:https://huggingface.co/NovaSky-AI/Sky-T1-32B-Preview
据官方信息,这款推理模型在多个关键基准测试中与 OpenAI o1 的早期版本相媲美。

重点是,Sky-T1 似乎是第一个真正开源的推理模型,因为团队发布了训练数据集以及必要的训练代码,任何人都可以从头开始复制。
大家惊呼:「数据、代码和模型权重,多么惊人的贡献。」

不久前,训练一个具有同等性能的模型的价格往往高达数百万美元。合成训练数据或由其他模型生成的训练数据,让成本实现了大幅降低。
此前,一家 AI 公司 Writer 发布的 Palmyra X 004 几乎完全基于合成数据进行训练,开发成本仅为 70 万美元。
想象一下,以后我们可以在 Nvidia Project Digits AI 超级计算机上运行此程序,该超级计算机售价 3000 美元(对于超级计算机来说很便宜),可以运行多达 2000 亿个参数的模型。而不久的将来,不到 1 万亿个参数的模型将由个人在本地运行。
2025 年的大模型技术演进正在加速,这感受确实很强烈。
模型概述
擅长推理的 o1 和 Gemini 2.0 flash thinking 等模型通过产生长长的内部思维链(Chain of Thought),解决了复杂的任务,并取得了其他方面的进步。然而,技术细节和模型权重却无法获取,这对学术界和开源社区的参与构成了障碍。
为此,在数学领域出现了一些训练开放权重推理模型的显著成果,如 Still-2 和 Journey。与此同时,加州大学伯克利分校的 NovaSky 团队一直在探索各种技术,以发展基础模型和指令调整模型的推理能力。
在 Sky-T1-32B-Preview 这项工作中,团队不仅在数学方面取得了有竞争力的推理性能,而且在同一模型的编码方面也取得了有竞争力的推理性能。






