LLaMA 与 GPT-4 为何青睐 RMSNorm?轻量级归一化三大优势解析 | 极客日志