字节推出的 AI 视频模型 Seedance 2.0 近期受到广泛关注,用户可制作电影级追逐戏、广告大片运镜及古装剧等作品。此次更新显著降低了 AI 视频生成的门槛,核心优势在于解决了创作者的控制难题。
用图片、视频、音频、文字自由组合
以前做 AI 视频,输入基本只有文字描述或一张首帧图,表达能力有限。现在 Seedance 2.0 变成了一个真正能听懂想法的多模态视频创作平台。你可以同时上传图片、视频、音频、文字,告诉它每个素材分别干嘛用,然后生成一段完整的视频。

Seedance 2.0 功能参数
最核心的变化是多模态输入。以前的工具主要支持文字和首帧图,Seedance 2.0 将输入扩展到了四种模态:
- 图片:最多上传 9 张,可指定角色长相、场景风格、服装细节、商品外观或分镜脚本图。
- 视频:最多上传 3 个(总时长不超过 15 秒),可参考运镜方式、动作节奏、转场特效。
- 音频:支持 MP3 上传,最多 3 个(总时长不超过 15 秒),可指定背景音乐、音效风格或旁白音色。
- 文字:自然语言描述,写清楚画面、动作、节奏需求。
这四种输入可自由组合,混合上传文件总上限是 12 个。生成的视频时长最长 15 秒,可自由选择 4 到 15 秒,且自带音效和配乐。
| 参数 | 说明 |
| 图片输入 | 最多 9 张 |
| 视频输入 | 最多 3 个,总时长不超过 15 秒 |
| 音频输入 | 支持 MP3,最多 3 个,总时长不超过 15 秒 |
| 文字输入 | 自然语言描述(中英文都行) |
| 生成时长 | 4-15 秒,自由选择 |
| 声音输出 | 自带音效和配乐 |
| 文件总上限 | 所有素材加起来最多 12 个文件 |
建议优先上传对画面或节奏影响最大的素材。

操作方式详解
第一步:选对入口
打开即梦,找到 Seedance 2.0,有两个入口:
- 首尾帧入口:只上传首帧图 + 文字描述时用这个。
- 全能参考入口:需要多模态组合(图片 + 视频 + 音频 + 文字)时用这个。
原则:素材只有一张图加文字走首尾帧;素材超过一张图,或者有视频、音频参与,走全能参考。大部分情况下选择全能参考即可。

第二步:上传素材
点击上传按钮,从本地选文件。图片、视频、音频都可以直接拖进去。上传成功后,所有素材会出现在输入框区域,鼠标悬停可以预览内容。






