大模型的基石:Transformer 架构深度解析 | 极客日志