LLM 常见归一化方法解析:LayerNorm、RMSNorm 与 DeepNorm | 极客日志