Seedance 2.0 近期引发了广泛关注,其核心突破在于将 AI 视频生成从单纯的文本描述升级为多模态控制。它不再只是一个'文生视频'工具,而是变成了一个能听懂你想法的多模态视频创作平台。你可以同时输入图片、视频、音频和文字,告诉模型每个素材分别做什么用,然后让它帮你生成一段完整的视频。
核心能力:多模态输入与输出
以前的视频生成工具,输入基本就两种:文字描述,或者一张首帧图。你想控制镜头怎么动、角色做什么表情、背景音乐什么节奏,基本只能靠提示词硬写。
Seedance 2.0 直接把输入扩展到了四种模态,可以自由组合:
- 图片:最多上传 9 张,可以指定角色长相、场景风格、服装细节、商品外观,甚至分镜脚本图都行。
- 视频:最多上传 3 个(总时长不超过 15 秒),可以让模型参考里面的运镜方式、动作节奏、转场特效,相当于给模型一个'样片'。
- 音频:支持 MP3 上传,最多 3 个(总时长不超过 15 秒),可以指定背景音乐、音效风格、甚至参考某个视频里的旁白音色。
- 文字:自然语言描述,写清楚你想要什么画面、什么动作、什么节奏就行。
混合上传的文件总上限是 12 个。生成的视频时长最长 15 秒,可以自由选择 4 到 15 秒,而且自带音效和配乐。
简单来说,你终于可以像一个真正的导演一样去'指挥'AI 了:用图片定风格,用视频定动作,用音频定节奏,用文字定剧情。
| 参数 | 说明 |
| 图片输入 | 最多 9 张 |
| 视频输入 | 最多 3 个,总时长不超过 15 秒 |
| 音频输入 | 支持 MP3,最多 3 个,总时长不超过 15 秒 |
| 文字输入 | 自然语言描述(中英文都行) |
| 生成时长 | 4-15 秒,自由选择 |
| 声音输出 | 自带音效和配乐 |
| 文件总上限 | 所有素材加起来最多 12 个文件 |
小建议:素材不是越多越好。优先上传对画面或节奏影响最大的素材,合理分配数量。

操作流程详解
入口选择
打开即梦,找到 Seedance 2.0,你会看到两个入口:
- 首尾帧入口:只上传首帧图 + 文字描述时用这个
- 全能参考入口:需要多模态组合(图片 + 视频 + 音频 + 文字)时用这个
怎么选?记住一个原则:素材只有一张图加文字,走首尾帧;素材超过一张图,或者有视频、音频参与,走全能参考。大部分情况下选择全能参考即可,它支持各种参考输入,能让 Seedance 2.0 发挥最大能力。

素材上传
点击上传按钮,从本地选文件。图片、视频、音频都可以直接拖进去。上传成功后,所有素材会出现在输入框区域,鼠标悬停可以预览内容。
小建议:上传前想好哪些素材最关键。总共只能传 12 个文件,优先上传对画面风格和节奏影响最大的素材。







