Diffusion Transformer (DiT) 详解:用 ViT 替代 U-Net 实现扩散模型,应用于视频生成与机器人控制 | 极客日志