跳到主要内容

极客日志面向AI+效率的开发者社区

首页博客 GitHub 精选镜像 AI 生图工具 UI配色美学隐私政策关于联系

搜索内容 / 工具 / 仓库 / 镜像...⌘K 搜索

Seedance 2.0 多模态 AI 视频创作操作手册 | 极客日志

编程语言AI算法

Seedance 2.0 多模态 AI 视频创作操作手册

Seedance 2.0 是一款支持多模态输入的 AI 视频生成工具，允许用户上传图片、视频、音频及文字描述，通过@引用机制精确控制画面风格、动作节奏与配乐。教程详细介绍了从选择全能参考入口、上传素材、分配任务到编写提示词及生成的完整操作流程，帮助用户实现电影级视频创作。

邪神洛基发布于 2026/4/6更新于 2026/7/2458 浏览

Seedance 2.0 多模态 AI 视频创作操作手册

字节推出的 AI 视频模型 Seedance 2.0 近期受到广泛关注，用户可制作电影级追逐戏、广告大片运镜及古装剧等作品。此次更新显著降低了 AI 视频生成的门槛，核心优势在于解决了创作者的控制难题。

用图片、视频、音频、文字自由组合

以前做 AI 视频，输入基本只有文字描述或一张首帧图，表达能力有限。现在 Seedance 2.0 变成了一个真正能听懂想法的多模态视频创作平台。你可以同时上传图片、视频、音频、文字，告诉它每个素材分别干嘛用，然后生成一段完整的视频。

文章配图

Seedance 2.0 功能参数

最核心的变化是多模态输入。以前的工具主要支持文字和首帧图，Seedance 2.0 将输入扩展到了四种模态：

图片：最多上传 9 张，可指定角色长相、场景风格、服装细节、商品外观或分镜脚本图。
视频：最多上传 3 个（总时长不超过 15 秒），可参考运镜方式、动作节奏、转场特效。
音频：支持 MP3 上传，最多 3 个（总时长不超过 15 秒），可指定背景音乐、音效风格或旁白音色。
文字：自然语言描述，写清楚画面、动作、节奏需求。

这四种输入可自由组合，混合上传文件总上限是 12 个。生成的视频时长最长 15 秒，可自由选择 4 到 15 秒，且自带音效和配乐。

参数	说明
图片输入	最多 9 张
视频输入	最多 3 个，总时长不超过 15 秒
音频输入	支持 MP3，最多 3 个，总时长不超过 15 秒
文字输入	自然语言描述（中英文都行）
生成时长	4-15 秒，自由选择
声音输出	自带音效和配乐
文件总上限	所有素材加起来最多 12 个文件

建议优先上传对画面或节奏影响最大的素材。

文章配图

操作方式详解

第一步：选对入口

打开即梦，找到 Seedance 2.0，有两个入口：

首尾帧入口：只上传首帧图 + 文字描述时用这个。
全能参考入口：需要多模态组合（图片 + 视频 + 音频 + 文字）时用这个。

原则：素材只有一张图加文字走首尾帧；素材超过一张图，或者有视频、音频参与，走全能参考。大部分情况下选择全能参考即可。

文章配图

第二步：上传素材

点击上传按钮，从本地选文件。图片、视频、音频都可以直接拖进去。上传成功后，所有素材会出现在输入框区域，鼠标悬停可以预览内容。

文章配图

第三步：用"@"给每个素材分配任务

这是最核心的操作。上传完素材后，需要在提示词里通过 @素材名 来告诉模型每个素材具体干什么用。模型不会自己猜，必须说清楚。

示例：

@图片 1 作为首帧
@视频 1 参考镜头语言
@音频 1 用于配乐

唤起方法：

在输入框里直接打一个"@"字符，会自动弹出已上传素材的列表，点击引用。
点击输入框旁边参数工具栏的"@"按钮。

正确写法示例：

指定首帧和参考：@图片 1 作为首帧，参考 @视频 1 的镜头语言，@音频 1 用于配乐
指定角色形象：@图片 1 的女生作为主角，@图片 2 的男生作为配角
指定运镜参考：完全参考 @视频 1 的所有运镜效果和转场
指定场景参考：左边场景参考 @图片 3，右边场景参考 @图片 4
指定动作参考：@图片 1 的人物参考 @视频 1 中的舞蹈动作
指定音色参考：旁白的音色参考 @视频 1

注意：素材多的时候，反复检查每个@引用有没有对上号。鼠标放在@的素材上，悬停可以预览素材，避免插入错误。

文章配图

第四步：写好提示词

@分配完任务后，用自然语言描述想要的画面和动作。

技巧一：按时间线分段写。如果视频里有多个画面或剧情转折，建议按秒数分段描述。例如： 0-3 秒画面：男主手里举起一个篮球，抬头望向镜头，说"我只是想喝杯酒，该不会要穿越了吧……" 4-8 秒画面：镜头突然剧烈晃动，场景切换成古宅的雨夜，一个穿着古装的女主冷冽地望向镜头方向。 9-13 秒画面：镜头切到一个穿着明代服饰的人物……

技巧二：明确说"参考"还是"编辑"。"参考 @视频 1 的运镜"意思是借鉴镜头运动方式；"将 @视频 1 中的女生换成戏曲花旦"意思是在原视频基础上修改。

技巧三：镜头语言写具体。推、拉、摇、移、跟拍、环绕、俯拍、仰拍、希区柯克变焦、鱼眼镜头等专业术语模型都能识别。不懂术语可用大白话描述，如"镜头从背后慢慢转到正面"。

技巧四：连续动作加过渡描述。如果想让角色做一系列连贯动作，记得写上过渡关系，比如"角色从跳跃直接过渡到翻滚，保持动作连贯流畅"，避免画面出现不自然的跳切。

文章配图

第五步：选择生成时长，点击生成

在 4 到 15 秒之间选一个需要的时长。

文章配图

注意：如果是做视频延长（比如把一段已有视频往后接 5 秒），这里选的时长是"新增部分"的时长，不是总时长。

然后点生成，等结果就好。不满意可以多生成几次，AI 本身有随机性，同样的输入每次结果都会有差异，挑最满意的那条。

总结

Seedance 2.0 改变了 AI 视频创作的交互方式。通过多模态输入和@引用机制，创作者能够精准地告诉 AI"我要什么"，而不是写完提示词后听天由命。虽然还在持续进化中，有些极端复杂的场景可能还不够完美，但目前已是一个真正能用在实际创作中的生产力工具。

目录

用图片、视频、音频、文字自由组合
Seedance 2.0 功能参数
操作方式详解
第一步：选对入口
第二步：上传素材
第三步：用"@"给每个素材分配任务
第四步：写好提示词
第五步：选择生成时长，点击生成
总结

免费图片AI生成工具免费生成了解详情

Magick API 一键接入全球大模型注册送1000万token查看
免费图片视频在线生成30秒，将你的创意变成现实开始设计
X/Twitter免费视频下载器免登陆无限额度免费视频解析下载了解详情
100+免费在线小游戏爽一把

极客日志微信公众号二维码

微信扫一扫，关注极客日志

微信公众号「极客日志V2」，在微信中扫描左侧二维码关注。展示文案：极客日志V2 zeeklog

更多推荐文章

图数据结构详解：存储结构、遍历与核心算法
DeepSeek 各版本详解与优缺点对比分析
MacOS 基于 Docker 安装 OpenClaw 并配置飞书机器人
C++ 多线程同步：互斥锁 mutex 实战指南
Spring Cloud Gateway 微服务统一入口与核心配置
GitHub Copilot 上下文工程实战指南与 7 个核心技巧
阿里开源 PageAgent：让 AI 住进网页，用自然语言操控界面
Visual Studio 使用 GitHub Copilot 与 IntelliCode 辅助编码
PX4 无人机仿真实战：Offboard 模式下的精准定点控制
前端 Base64 格式文件上传详解：原理、实现与最佳实践
基于 Vue 3 构建企业级 Web Components 组件库
KrLongAI 旗博士本地部署 AI 数字人口播自动化工程实践
LeetCode 142：链表环的起点检测
基于 Python 与 AI 的智能害虫识别系统实战
无需部署服务器：内网穿透实现本地服务对外演示实战
Easy Rules 规则可视化实战：5 步构建 Web 编辑界面
Windows 下载、安装并运行 MinIO 服务及访问 WebUI 界面
10 款辅助学术写作的 AI 降重工具介绍
2026最强外贸工具：Megick
C++红黑树实现：从插入修正到平衡验证

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online