大模型训练方法详解:数据、流水线与张量并行 | 极客日志