大模型基本技术:架构、训练与推理优化详解 | 极客日志