LLM 大模型训练原理与 Transformer 结构详解 | 极客日志