可扩展多任务视觉基础模型 LaVin-DiT:融合时空 VAE 与 DiT | 极客日志