Seedance 2.0 多模态 AI 视频创作操作指南 | 极客日志

编程语言AI

Seedance 2.0 多模态 AI 视频创作操作指南

综述由AI生成Seedance 2.0 是一款支持图片、视频、音频和文字多模态输入的 AI 视频生成工具。它允许用户通过组合多种素材并指定用途（如首帧、运镜参考、配乐等）来精准控制视频内容。档详细说明了从入口选择、素材上传、指令编写到生成的完整操作流程及注意事项，帮助用户掌握多模态视频创作技巧。

氛围发布于 2026/4/5更新于 2026/5/2119 浏览

Seedance 2.0 多模态 AI 视频创作操作指南

Seedance 2.0 多模态 AI 视频创作操作指南

Seedance 2.0 是一款支持图片、视频、音频和文字多模态输入的 AI 视频生成工具，通过组合多种素材并指定用途来精准控制视频内容。

核心功能概述

以前的视频生成工具输入基本只有文字描述或一张首帧图。Seedance 2.0 将输入扩展到了四种模态：

图片：最多上传 9 张，可指定角色长相、场景风格、服装细节等。
视频：最多上传 3 个（总时长不超过 15 秒），参考运镜方式、动作节奏、转场特效。
音频：支持 MP3 上传，最多 3 个（总时长不超过 15 秒），指定背景音乐、音效风格或旁白音色。
文字：自然语言描述画面、动作、节奏。

这四种输入可自由组合，混合上传文件总上限是 12 个。生成的视频时长最长 15 秒，可选择 4 到 15 秒，自带音效和配乐。

核心参数一览

参数	说明
图片输入	最多 9 张
视频输入	最多 3 个，总时长不超过 15 秒
音频输入	支持 MP3，最多 3 个，总时长不超过 15 秒
文字输入	自然语言描述（中英文都行）
生成时长	4-15 秒，自由选择
声音输出	自带音效和配乐
文件总上限	所有素材加起来最多 12 个文件

提示：素材不是越多越好。优先上传对画面或节奏影响最大的素材，合理分配数量。

操作方式详解

第一步：选对入口

访问 Seedance 2.0 界面，你会看到两个入口：

首尾帧入口：只上传首帧图 + 文字描述时使用。
全能参考入口：需要多模态组合（图片 + 视频 + 音频 + 文字）时使用。

选择原则：素材只有一张图加文字，走首尾帧；素材超过一张图，或者有视频、音频参与，走全能参考。大部分情况下选择全能参考即可。

文章配图

第二步：上传你的素材

点击上传按钮，从本地选文件。图片、视频、音频都可以直接拖进去。上传成功后，所有素材会出现在输入框区域，鼠标悬停可以预览内容。

文章配图