AI 大模型核心原理与实践:注意力机制、Transformer 架构与 BERT/GPT 对比 | 极客日志