大模型训练技术架构、并行策略与优化方案详解 | 极客日志