李沐:大模型发展趋势与创业感悟
本文整理了李沐关于大模型趋势的演讲内容。文章首先分析了算力层面的带宽、内存瓶颈及成本趋势,指出内存将制约模型上限。其次探讨了模型演进,包括语言模型参数规模主流区间、语音模型的低延迟优势、图像视频生成的现状及多模态整合方向。接着讨论了应用落地,区分了白领与蓝领工作的自动化难度,并指出杀手级应用尚在探索。最后分享了创业感悟,强调后训练是关键技术环节,数据决定模型上限,评估至关重要,且算力成本结构决定了自建与租用的选择策略。整体观点认为大模型技术仍需长期积累,物理世界交互尚需时日。


