Seedance 2.0 的核心突破在于将 AI 视频生成从单纯的'文生视频'升级为真正的多模态创作平台。它允许创作者通过图片、视频、音频和文字的组合,精准控制画面的风格、动作节奏与音效,大幅降低了专业级视频制作的门槛。
核心能力概览
输入端支持四种模态的自由组合:
- 图片:最多 9 张,用于指定角色长相、场景风格或分镜脚本。
- 视频:最多 3 个(总时长≤15 秒),作为运镜、动作或转场的参考样片。
- 音频:支持 MP3,最多 3 个(总时长≤15 秒),可指定背景音乐、音效或旁白音色。
- 文字:自然语言描述剧情与画面要求。
文件总上限为 12 个,生成视频时长可在 4 到 15 秒间选择,并自带音效配乐。这意味着你可以像导演一样指挥 AI:用图片定风格,用视频定动作,用音频定节奏。

参数配置表
| 参数 | 说明 |
|---|---|
| 图片输入 | 最多 9 张 |
| 视频输入 | 最多 3 个,总时长不超过 15 秒 |
| 音频输入 | 支持 MP3,最多 3 个,总时长不超过 15 秒 |
| 文字输入 | 自然语言描述(中英文都行) |
| 生成时长 | 4-15 秒,自由选择 |
| 声音输出 | 自带音效和配乐 |
| 文件总上限 | 所有素材加起来最多 12 个文件 |
建议优先上传对画面风格和节奏影响最大的素材,避免堆砌无效文件。

操作流程详解
入口选择 在工具界面中通常有两个入口:'首尾帧入口'适用于仅上传一张图加文字的场景;'全能参考入口'则支持多模态组合。对于大多数复杂创作,直接选择全能参考模式能发挥模型最大能力。

素材上传 点击上传按钮,支持拖拽本地文件。图片、视频、音频均可直接放入。上传后鼠标悬停可预览内容。注意总共只能传 12 个文件,需合理分配数量。







