Diffusion Transformer (DiT):从图像生成到机器人动作预测的架构演进 | 极客日志