Seedance 2.0 核心能力
Seedance 2.0 的发布标志着 AI 视频生成技术的重要突破。相比以往仅支持文字描述或单张首帧图的生成方式,它引入了真正的多模态控制能力。创作者现在可以像导演一样,通过组合图片、视频、音频和文字来精确指挥画面风格、运镜节奏与剧情走向。
输入模态说明
模型支持四种输入方式的自由组合,总文件数上限为 12 个:
- 图片:最多 9 张。用于指定角色长相、场景风格、服装细节或分镜脚本。
- 视频:最多 3 个(总时长不超过 15 秒)。作为参考样片,提供运镜方式、动作节奏及转场特效。
- 音频:支持 MP3,最多 3 个(总时长不超过 15 秒)。可指定背景音乐、音效风格或旁白音色。
- 文字:自然语言描述。清晰表达画面内容、动作逻辑与节奏要求。
生成的视频时长可在 4 到 15 秒之间自由选择,并自带音效和配乐。
| 参数 | 说明 |
| 图片输入 | 最多 9 张 |
| 视频输入 | 最多 3 个,总时长不超过 15 秒 |
| 音频输入 | 支持 MP3,最多 3 个,总时长不超过 15 秒 |
| 文字输入 | 自然语言描述(中英文都行) |
| 生成时长 | 4-15 秒,自由选择 |
| 声音输出 | 自带音效和配乐 |
| 文件总上限 | 所有素材加起来最多 12 个文件 |
提示:素材并非越多越好。建议优先上传对画面风格和节奏影响最大的核心素材,合理分配数量以获得最佳效果。

操作流程详解
1. 选择入口模式
在平台中找到 Seedance 2.0 功能后,通常有两个入口可选:
- 首尾帧入口:仅适用于上传一张首帧图加文字描述的场景。
- 全能参考入口:推荐大多数情况使用。支持图片、视频、音频、文字的多模态组合,能发挥模型最大能力。
原则很简单:如果素材只有一张图加文字,走首尾帧;如果有视频、音频参与或多张图片,务必选择全能参考。

2. 上传与管理素材
点击上传按钮,将本地图片、视频、音频拖入输入框。上传成功后,鼠标悬停可预览素材内容。注意系统限制,所有素材总和不能超过 12 个文件。







