Seedance 2.0 保姆级实操教程：从入门到「AI导演」模式

优质文章学习记录

27 Feb 2026 — 9 min read

Seedance 2.0 保姆级实操教程：从入门到「AI导演」模式

Seedance 2.0 是字节跳动最新出品的多模态 AI 视频生成工具，堪称目前最强的 AI 视频生成模型之一。它支持同时输入图片、视频、音频、文字四种素材，能够生成最长 15 秒的高质量视频，并自带音效和配乐。你可以把它理解为一个听得懂自然语言的 AI 导演助手：你负责想象，它负责实现。

一、核心参数速查表（建议收藏）

在开始之前，先了解一下 Seedance 2.0 的「能力边界」，有助于你更精确地控制生成结果。

参数	规格/限制	说明
视频长度	最长 15 秒	支持 4s、8s、12s、15s 等档位
输入模态	图/文/视/音	全模态混合输入
文件上限	12 个	包含图片、视频和音频的总和
图片上限	最多 9 张	可指定角色、风格等
视频上限	最多 3 段	可参考运镜、动作
音频上限	最多 3 段	可匹配节奏、氛围
分辨率	最高 1080P	默认为 720P，可 upscale 到 2K
特有功能	「@」指令	精确控制每个素材的用途

💡 注意：虽然支持最多 12 个文件，但建议优先上传对画面和节奏影响最大的核心素材，避免信息过载导致 AI 混淆。少即是多。

二、使用入口一览

Seedance 2.0 在不同平台有不同入口，可根据需求选择：

入口	特点	适用人群
即梦网页版	功能最全，参数最细	专业创作者、电脑端用户
豆包 App	免费额度最多，手机最快	日常创作、移动端用户
小云雀	移动端友好，支持直接粘贴抖音链接	短视频创作者
火山方舟	API 调用，适合开发者	批量生产、自动化

三、两种模式，怎么选？

即梦 AI 中的 Seedance 2.0 提供了两个入口，分别对应不同的创作需求：

1️⃣ 首尾帧模式（新手入门）

评价：最简单的起步方式，适合新手第一次尝试，快速体验「图生视频」
用法：上传图片 → 写 Prompt → 生成
适用场景：你只有一张首帧图（或尾帧图）+ 文字提示词
适合：练手、验证创意、单镜头测试

2️⃣ 全能参考模式（⭐ 进阶推荐）

评价：这是 Seedance 2.0 的核心玩法，能解锁全部导演能力，实现复杂的镜头调度和角色一致性
用法：上传多种素材 → 用 @素材名 指定每个素材的用途 → 写 Prompt → 生成
适用场景：需要混合输入图片 + 视频 + 音频 + 文字，追求精确控制
适合：角色一致性、运镜复刻、音乐卡点、广告片等

四、「@」语法：Seedance 2.0 的灵魂操作

在全能参考模式下，你需要用 @ 符号告诉模型每个素材的具体用途。这是整个 2.0 交互的精髓。

怎么用？

方法一：在输入框直接打 @，会自动弹出已上传的素材列表，点选即可
方法二：点击工具栏的 @ 按钮，选择素材插入到输入框中

示例用法

@图片1 为角色外貌，参考 @视频1 的跟拍运镜，配合 @音频1 节奏

五、新手快速上手三步走

如果你是第一次使用，建议按这个路径进阶：

Step 1（练手）：试玩「首尾帧」模式

准备一张好看的图 + 一句简单描述，体验基础的图生视频

Step 2（进阶）：试玩「全能参考」模式

加一段参考视频，用 @ 语法指令「参考这个视频的动作」，体验神奇的动作复刻

Step 3（大师）：挑战「全模态组合」

图 + 视频 + 音频一起上，像导演一样用 @ 分配角色、动作和 BGM，掌控全场

六、六大实战案例（直接抄作业）

下面整理了 6 个最常用的实战场景，Prompt 可以直接套用微调：

🎯 案例 1：基础图生视频

场景：让一张静态的人物图动起来，并演绎特定剧情

Prompt：

画里面的人物心虚的表情，眼睛左右看了看探出画框，快速的将手伸出画框拿起可乐喝了一口，然后露出一脸满足的表情…画面最下方出现艺术感字幕和旁白：「宜口可乐，不可不尝！」

🎯 案例 2：角色一致性 + 双人互动

场景：保持两个角色的样貌，生成一段有剧情的对手戏素材：2 张人物参考图

Prompt：

这两张图片是一段悬崖对手戏的两个女主，请围绕两个女主，生成一段流畅的红衣女子东方不败与黑衣女刺客二人对手戏的画面…仅生成打斗音效和环境的音效，不要配背景音乐…

🎯 案例 3：动作复刻（图 + 参考视频）

场景：想让自己的角色跳出特定的舞蹈，但不想自己调动作素材：1 张角色图 + 1 段舞蹈视频

Prompt：

@图片1 的女星作为主体，运镜方式参考 @视频1 进行有节奏的推拉摇移，女星的动作也参考 @视频1 中女子的舞蹈动作，在舞台上活力十足地表演。

🎯 案例 4：全模态组合（图+视+音）

场景：最复杂的导演模式，指定角色、参考动作、匹配 BGM 素材：1 张图 + 1 段视频 + 1 段音频

Prompt：

参考 @视频1 的人物动作和运镜手法，生成 @图片1 中黑衣人物在竹林将飞刀掷出的视频…起始帧的视角景别严格参照 @视频1…仅生成打斗音效和环境音效，并加入背景音乐 @音频1。

🎯 案例 5：视频无限延长

场景：觉得生成的视频太短，想接着刚才的结尾继续拍素材：1 段已有视频

Prompt：

将 @视频1 延长15秒。1-5秒：光影透过百叶窗… 6-10秒：一粒咖啡豆轻轻飘落… 11-15秒：英文渐显字幕…

💡 注意：生成时长应设置为你要新增的时长

🎯 案例 6：视频局部编辑

场景：只改发型或背景，不动其他画面素材：1 段视频 + 1 张元素图

Prompt：

将 @视频1 女人发型变成红色长发，@图片1 中的大白鲨缓缓浮出半个脑袋，在她身后。

七、Seedance 2.0 十大核心能力升级

基于官方文档与实测，这 10 点升级是 2.0 版本的杀手锏：

音乐卡点：能自动根据音频节奏对齐画面动作（AMV 神器）
视频编辑：支持换人、增删片段、调整节奏
一镜到底：长镜头连贯性增强，不易断裂
音效升级：自带的音效和配乐质量显著提高，更贴合画面
平滑延长：告别生硬拼接，延长部分自然衔接
剧情补全：不仅是生成画面，还能充当「AI 编剧」补全剧情
创意模板/特效：能识别广告片、电影的节奏并复刻
精准运镜复刻：直接「抄」参考视频的运镜，无需学专业术语
一致性飞跃：人脸不崩、商品不换、文字不乱
基础画质大幅提升：物理规律更合理，光影更自然

八、参数设置建议

不同平台参数可能略有差异，以下是通用起步值：

场景	比例	分辨率	时长	建议
社媒竖屏剧情	9:16	720p	5-8s	先保运动稳定，再升清晰度
产品广告	16:9	1080p	8-12s	先锁产品外观一致，再做镜头运动
人物特写	3:4 或 1:1	720p/1080p	5-8s	强约束脸部一致与肤色自然
预告片镜头	21:9 或 16:9	1080p	8-12s	强调镜头轨迹与光影层次

九、迭代闭环（真正决定出片率）

把每次迭代当成实验，不要一口气改 5 个变量。推荐 4 轮：

声音轮：只改音频风格与强度
质感轮：只改光线、材质、色调
运动轮：只改动作与镜头运动
构图轮：只看主体、背景、比例是否正确

每轮保留最佳版本并记录「改了什么 → 结果如何」，你会很快形成自己的提示词资产库。

十、常见问题 FAQ

Q：没有音频素材怎么办？ A：可以直接参考视频里的声音，或者让模型自动生成，不需要强制上传。

Q：12 个文件上限怎么分配？ A：少即是多。建议 3-5 张关键图 + 1-2 个参考视频 + 1 个音频，留出计算余量，效果往往更好。

Q：如何从「描述者」切换到「导演」思维？ A：不再视频做完再配音 → 改为「动作与 @Audio1 节奏同步」；不再硬写复杂运镜 → 改为「参考 @视频1 的镜头轨迹」；不再死磕文字描外观 → 改为「主体是 @图片1 中的对象」。

Q：角色漂移怎么办？ A：先删风格参考，保留身份参考重跑；增加身份描述，减少风格干扰。

参考资料

即梦 AI（Dreamina）：https://dreamina.capcut.com/
ByteDance Seed 官方页：https://seed.bytedance.com/
详细提示词技巧见同目录下 Seedance提示词技巧.md

安装启动使用 Neo4j的超详细教程

最近在做一个基于知识图谱的智能生成项目。需要用到Neo4j图数据库。写这篇文章记录一下Neo4j的安装及其使用。一.Neo4j的安装 1.首先安装JDK，配环境变量。（参照网上教程，很多） Neo4j是基于Java的图形数据库，运行Neo4j需要启动JVM进程，因此必须安装JAVA SE的JDK。从Oracle官方网站下载 Java SE JDK。我使用的版本是JDK1.8 2.官网上安装neo4j。官方网址：https://neo4j.com/deployment-center/ 在官网上下载对应版本。Neo4j应用程序有如下主要的目录结构： bin目录：用于存储Neo4j的可执行程序； conf目录：用于控制Neo4j启动的配置文件； data目录：用于存储核心数据库文件； plugins目录：用于存储Neo4j的插件； 3.配置环境变量创建主目录环境变量NEO4J_HOME，并把主目录设置为变量值。复制具体的neo4j文件地址作为变量值。配置文档存储在conf目录下，Neo4j通过配置文件neo4j.conf控制服务器的工作。默认情况下，不需

企业微信群机器人Webhook配置全攻略：从创建到发送消息的完整流程

企业微信群机器人Webhook配置全攻略：从创建到发送消息的完整流程在数字化办公日益普及的今天，企业微信作为国内领先的企业级通讯工具，其群机器人功能为团队协作带来了极大的便利。本文将手把手教你如何从零开始配置企业微信群机器人Webhook，实现自动化消息推送，提升团队沟通效率。 1. 准备工作与环境配置在开始创建机器人之前，需要确保满足以下基本条件： * 企业微信账号：拥有有效的企业微信管理员或成员账号 * 群聊条件：至少包含3名成员的群聊（这是创建机器人的最低人数要求） * 网络环境：能够正常访问企业微信服务器提示：如果是企业管理员，建议先在"企业微信管理后台"确认机器人功能是否已对企业开放。某些企业可能出于安全考虑会限制此功能。 2. 创建群机器人 2.1 添加机器人到群聊 1. 打开企业微信客户端，进入目标群聊 2. 点击右上角的群菜单按钮（通常显示为"..."或"⋮"） 3. 选择"添加群机器人"选项 4.

Flowise物联网融合：与智能家居设备联动的应用设想

Flowise物联网融合：与智能家居设备联动的应用设想 1. Flowise：让AI工作流变得像搭积木一样简单 Flowise 是一个真正把“AI平民化”落地的工具。它不像传统开发那样需要写几十行 LangChain 代码、配置向量库、调试提示词模板，而是把所有这些能力打包成一个个可拖拽的节点——就像小时候玩乐高，你不需要懂塑料怎么合成，只要知道哪块该拼在哪，就能搭出一座城堡。它诞生于2023年，短短一年就收获了45.6k GitHub Stars，MIT协议开源，意味着你可以放心把它用在公司内部系统里，甚至嵌入到客户交付的产品中，完全不用担心授权问题。最打动人的不是它的技术多炫酷，而是它真的“不挑人”：产品经理能搭出知识库问答机器人，运营同学能配出自动抓取竞品文案的Agent，连刚学Python两周的实习生，也能在5分钟内跑通一个本地大模型的RAG流程。它的核心逻辑很朴素：把LangChain里那些抽象概念——比如LLM调用、文档切分、向量检索、工具调用——变成画布上看得见、摸得着的方块。你拖一个“Ollama LLM”节点，再拖一个“Chroma Vector

OpenClaw配置Bot接入飞书机器人+Kimi2.5

上一篇文章写了Ubuntu_24.04下安装OpenClaw的过程，这篇文档记录一下接入飞书机器+Kimi2.5。准备工作飞书创建飞书机器人访问飞书开放平台：https://open.feishu.cn/app，点击创建应用：填写应用名称和描述后就直接创建：复制App ID 和 App Secret 创建成功后，在“凭证与基础信息”中找到 App ID 和 App Secret，把这2个信息复制记录下来，后面需要配置到openclaw中配置权限点击【权限管理】→【开通权限】或使用【批量导入/导出权限】，选择导入，输入以下内容，如下图点击【下一步，确认新增权限】即可开通所需要的权限。配置事件与回调说明：这一步的配置需要先讲AppId和AppSecret配置到openclaw成功之后再设置订阅方式，