Stability.ai 发布 Stable Video，免费文生视频工具上线

尽管 Sora 引发了广泛关注，但其公开使用的时间表仍受限于算力等因素。相比之下，Stability.ai 最新发布的 Stable Video 则直接提供了访问入口。这是一个 AI 视频生成平台，允许用户通过文本或图像输入，将创意转化为视频片段。作为正式公布的免费工具，其生成效果令人印象深刻。

Stable Video 底层采用 Stable Video Diffusion 1.1 模型。该模型在原本用于 2D 图像生成的潜在扩散模型基础上增加了时间层，并使用小型高品质影片数据集进行训练。Stability AI 将训练过程定义为三个阶段：

首先是图像预训练阶段，调整大模型底模参数以适配 2D 文生图任务。接着是视频预训练阶段，基于大规模视频集进行训练，由于缺乏自动质量审核模型，引入了人工过滤规则以确保数据质量。最后是高质量视频微调阶段，进一步提升分辨率和生成质量，整体借鉴了图像 diffusion model 的训练模式。

使用方式主要分为两类：