深度解析 LayerNorm 与 RMSNorm:大模型为何转向 RMSNorm | 极客日志