尽管 Sora 引发了广泛关注,但其公开使用的时间表仍受限于算力等因素。相比之下,Stability.ai 最新发布的 Stable Video 则直接提供了访问入口。这是一个 AI 视频生成平台,允许用户通过文本或图像输入,将创意转化为视频片段。作为正式公布的免费工具,其生成效果令人印象深刻。
Stable Video 底层采用 Stable Video Diffusion 1.1 模型。该模型在原本用于 2D 图像生成的潜在扩散模型基础上增加了时间层,并使用小型高品质影片数据集进行训练。Stability AI 将训练过程定义为三个阶段:
首先是图像预训练阶段,调整大模型底模参数以适配 2D 文生图任务。接着是视频预训练阶段,基于大规模视频集进行训练,由于缺乏自动质量审核模型,引入了人工过滤规则以确保数据质量。最后是高质量视频微调阶段,进一步提升分辨率和生成质量,整体借鉴了图像 diffusion model 的训练模式。
使用方式主要分为两类:
-
文生视频:输入构思好的 Prompt 文本即可生成目标视频。

-
图生视频:上传准备好的图片即可生成动态视频。

关于资源配额,平台每天提供 150 免费积分,平均可生成 15 段视频。若积分不足,支持自行充值。例如 10 美金兑换 500 积分,或 50 美金兑换 3000 积分,后者性价比更高,理论上能生成 200 至 300 个视频片段。

以下是部分生成效果的展示:


