现代大模型架构:组注意力机制(GQA)和 RMSNorm | 极客日志