Seedance 2.0 完整操作手册：AI 视频创作进入人人都是导演时代

Ne0inhk

15 Mar 2026 — 10 min read

这两天，字节的AI视频模型Seedance 2.0 彻底出圈了

到处都是 Seedance 2.0 的生成AI作品

有人用它做出了电影级的追逐戏，有人用它复刻了广告大片的运镜，还有人拿它做古装穿越剧和各种武打动作片，画面精致到让人分不清是AI生成的还是真人拍的。

不夸张地说，Seedance 2.0 这波更新，直接把AI视频生成的门槛踩到了地板上。

为什么这么火？因为它解决了一个所有创作者都头疼的问题：以前AI视频只能"生成"，现在终于能"控制"了。

用图片、视频、音频、文字自由组合，人人都能当导演

我们都知道，以前做 AI 视频，你只能打字描述想要什么画面，或者最多放一张图当起始帧。说实话，这种方式表达能力太有限了——你脑子里想的是电影级别的镜头感，打出来的却只是干巴巴的一段话。

现在不一样了。

它不再只是一个"文生视频"工具了，而是变成了一个真正能听懂你想法的多模态视频创作平台。你可以同时丢给它图片、视频、音频、文字，告诉它每个素材分别干嘛用，然后它帮你把这些东西揉在一起，生成一段完整的视频。

听起来有点抽象？没关系，下面我把所有功能和玩法拆开了讲。

先搞清楚：Seedance 2.0 到底能干嘛？

最核心的变化就一个词：多模态。

以前的视频生成工具，输入基本就两种：文字描述，或者一张首帧图。你想控制镜头怎么动、角色做什么表情、背景音乐什么节奏，基本只能靠提示词硬写，写得好不好全凭经验。

Seedance 2.0 直接把输入扩展到了四种模态：

图片：最多上传 9 张，可以指定角色长相、场景风格、服装细节、商品外观，甚至分镜脚本图都行。

视频：最多上传 3 个（总时长不超过 15 秒），可以让模型参考里面的运镜方式、动作节奏、转场特效，相当于给模型一个"样片"。

音频：支持 MP3 上传，最多 3 个（总时长不超过 15 秒），可以指定背景音乐、音效风格、甚至参考某个视频里的旁白音色。

文字：自然语言描述，写清楚你想要什么画面、什么动作、什么节奏就行。

这四种输入可以自由组合，混合上传的文件总上限是 12 个。生成的视频时长最长 15 秒，可以自由选择 4 到 15 秒，而且自带音效和配乐。

简单来说，你终于可以像一个真正的导演一样去"指挥"AI了：用图片定风格，用视频定动作，用音频定节奏，用文字定剧情。

核心参数一览

先看看 Seedance 2.0 能接受什么输入、能输出什么：

参数	说明
图片输入	最多 9 张
视频输入	最多 3 个，总时长不超过 15 秒
音频输入	支持 MP3，最多 3 个，总时长不超过 15 秒
文字输入	自然语言描述（中英文都行）
生成时长	4-15 秒，自由选择
声音输出	自带音效和配乐
文件总上限	所有素材加起来最多 12 个文件

小建议：素材不是越多越好。优先上传对画面或节奏影响最大的素材，合理分配数量。

怎么用？操作方式详解

第一步：选对入口

打开即梦，找到 Seedance 2.0，你会看到两个入口：

首尾帧入口：只上传首帧图 + 文字描述时用这个
全能参考入口：需要多模态组合（图片 + 视频 + 音频 + 文字）时用这个

怎么选？记住一个原则：素材只有一张图加文字，走首尾帧；素材超过一张图，或者有视频、音频参与，走全能参考。

大部分情况下选择全能参考即可，它支持各种参考输入，也就是最新的 seedance 2.0能发挥最大能力的方式。

第二步：上传你的素材

点击上传按钮，从本地选文件。图片、视频、音频都可以直接拖进去。上传成功后，所有素材会出现在输入框区域，鼠标悬停可以预览内容。

小建议：上传前想好哪些素材最关键。总共只能传 12 个文件，优先上传对画面风格和节奏影响最大的素材。

第三步：用"@"给每个素材分配任务（最关键）

这一步是 Seedance 2.0 最核心的操作，也是很多新手容易忽略的地方。

上传完素材后，你需要在提示词里通过 @素材名来告诉模型，每个素材具体干什么用。模型不会自己猜，你不说清楚，它就可能乱用。

比如：

@图片1 作为首帧
@视频1 参考镜头语言
@音频1 用于配乐

怎么唤起@：

方法一：在输入框里直接打一个"@"字符，会自动弹出已上传素材的列表，点击你要引用的素材，它就落入输入框了。

方法二：点击输入框旁边参数工具栏的"@"按钮，同样会弹出素材列表。

@的正确写法示例：

指定首帧和参考：@图片1 作为首帧，参考 @视频1 的镜头语言，@音频1 用于配乐

指定角色形象：@图片1 的女生作为主角，@图片2 的男生作为配角

指定运镜参考：完全参考 @视频1 的所有运镜效果和转场

指定场景参考：左边场景参考 @图片3，右边场景参考 @图片4

指定动作参考：@图片1 的人物参考 @视频1 中的舞蹈动作

指定音色参考：旁白的音色参考 @视频1

踩坑提醒：素材多的时候，一定反复检查每个@引用有没有对上号。把图片当成视频引用，或者把角色A的图标成角色B，模型生成出来就会很混乱。

鼠标放在你@的素材上，悬停可以预览素材，避免插入错误

第四步：写好你的提示词

@分配完任务后，剩下的就是用自然语言描述你想要的画面和动作。

写提示词的四个技巧：

技巧一：按时间线分段写。如果视频里有多个画面或剧情转折，建议按秒数分段描述。

比如：

0-3秒画面：男主手里举起一个篮球，抬头望向镜头，说"我只是想喝杯酒，该不会要穿越了吧……"

4-8秒画面：镜头突然剧烈晃动，场景切换成古宅的雨夜，一个穿着古装的女主冷冽地望向镜头方向。

9-13秒画面：镜头切到一个穿着明代服饰的人物……

这样写模型能更准确地把握每段画面的节奏和内容。

技巧二：明确说"参考"还是"编辑"。这两个概念不一样。"参考 @视频1 的运镜"意思是借鉴它的镜头运动方式来生成新内容；"将 @视频1 中的女生换成戏曲花旦"意思是在原视频基础上做修改。写清楚，模型才能正确响应。

技巧三：镜头语言写具体。不用怕写多，模型现在的理解能力很强。推、拉、摇、移、跟拍、环绕、俯拍、仰拍、一镜到底、希区柯克变焦、鱼眼镜头……这些专业术语它都认识。不懂术语也没关系，用大白话描述也行，比如"镜头从背后慢慢转到正面"。

技巧四：连续动作加过渡描述。如果你想让角色做一系列连贯动作，记得写上过渡关系，比如"角色从跳跃直接过渡到翻滚，保持动作连贯流畅"，避免画面出现不自然的跳切。

第五步：选择生成时长，点击生成

在 4 到 15 秒之间选一个你需要的时长。

注意：如果你是在做视频延长（比如把一段已有视频往后接 5 秒），那这里选的时长是"新增部分"的时长，不是总时长。想延长 5 秒就选 5 秒。

然后点生成，等结果就好。不满意可以多生成几次，AI本身有随机性，同样的输入每次结果都会有差异，挑最满意的那条。

写在最后

Seedance 2.0 刷屏不是没有道理的。它不只是画质变好了、动作更流畅了，更关键的是它改变了AI视频创作的交互方式。

通过多模态输入和@引用机制，创作者第一次能够精准地告诉AI"我要什么"，而不是写完提示词然后听天由命。

当然它还在持续进化中，有些极端复杂的场景可能还不够完美。但从目前的能力来看，它已经是一个真正能用在实际创作中的生产力工具了。

建议大家先收藏这篇指南，然后打开即梦动手试试。看别人的作品刷屏不过瘾，自己上手才是真的爽！

立即体验 Seedance 2.0 ！

以上基于 Seedance 2.0 官方使用手册整理

全网都在刷的 AI Skills 怎么用？别死磕 Claude Code，OpenCode 才是国内首选！

最近，“Skills”在AI圈子里太火了！大家都在用它给 AI 加各种“buff”，让它自动写代码、做表格等等但很多小伙伴看着 GitHub 上那些 Skills 兴奋不已，真到了本地想玩一把时，使用Claude code有很多不便的地方之前就有很多小伙伴问我OpenCode，整好借着Skills，来聊聊OpenCode的安装部署和使用很简单，不管你是想用图形界面还是命令行，这篇保姆级教程都能让你轻松上手！咱们这就开始，带你入门OpenCode玩转 Skills！目录： 1. 1. ✅ 如何下载安装OpenCode 2. 2. ✅ 如何安装和配置Skills 3. 3. ✅ 环境变量的设置方法 4. 4. ✅ 常用指令和操作技巧 5. 5. ✅ 遇到问题如何解决 6. 6. ✅ 如何创建自己的Skills 一、下载安装，超级简单下载地址： https:

Flutter 三方库 mediapipe_core 的鸿蒙化适配指南 - 实现高性能的端侧 AI 推理库集成、支持多维视觉任务与手势/表情识别实战

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 mediapipe_core 的鸿蒙化适配指南 - 实现高性能的端侧 AI 推理库集成、支持多维视觉任务与手势/表情识别实战前言在进行 Flutter for OpenHarmony 的智能化应用开发时，集成强大的机器学习（ML）能力是打造差异化体验的关键。mediapipe_core 是谷歌 MediaPipe 框架在 Dart 侧的核心封装库。它能让你在鸿蒙真机上实现极其流畅的人脸检测、手势追踪以及实时姿态估计。本文将深入探讨如何在鸿蒙系统下构建低功耗、高响应的端侧 AI 推理链路。一、原原理性解析 / 概念介绍 1.1 基础原理 mediapipe_core 作为 MediaPipe 的“神经中枢”

半小时用OpenClaw搭一套AI量化系统：开源三件套实测分享

作者：老余捞鱼原创不易，转载请标明出处及原作者。写在前面的话：见过太多人想用量化，却被各种复杂的代码和环境配置劝退。无论你是刚开始接触数据科学的学生，还是想提升自己投资工具箱的实践者，今天就把我用最近很火的OpenClaw如何搭建AI量化系统的过程完整分享给你。自从有了OpenClaw后，说实话，个人搭建一套量化系统没你想的那么难。半小时，三行代码，不花钱。一、先说效果：我一次跑通的回测先别急着看代码，咱们看看效果。用这套方案跑了一趟回测，最终跑出来的结果是 59%。当然，这是回测数据，不代表实盘收益，但足以说明这套开源工具链的潜力。你可能要问我这个收益是怎么算的。说白了就是：系统基于历史数据，按照你设定的策略规则模拟交易，最后算出来的年化结果。核心观点：回测收益 ≠ 实盘收益，但回测能帮你验证策略逻辑是否靠谱。二、开源三件套：数据 + 框架 + AI 这套方案的精髓在于开源三件套的组合搭配。用个表格梳理清楚：组件作用开源地址数据源选股基础数据供给长桥 SDK / AKshar

AI Agent 面试八股文100问：大模型智能体高频考点全解析（附分类指南和简历模板）

AI Agent 面试八股文100问：大模型智能体高频考点全解析（附分类指南和简历模板）如果你对学成归来的简历没有概念，可以看看以下的模板先，毕竟先看清眼前的路，比奔跑更重要：最终的AI Agent简历模板，点我跳转！适用人群：LLM Agent、RAG、AutoGPT、LangChain、Function Calling 等方向的求职者与开发者随着大模型技术的飞速演进，AI Agent（智能体）已成为工业界和学术界共同关注的焦点。无论是 AutoGPT、LangChain 还是 LlamaIndex，背后都离不开对 Agent 架构、推理机制、工具调用等核心能力的深入理解。本文系统整理了 AI Agent 方向的 100 道高频面试问题，覆盖基础概念、架构设计、推理决策、工具调用、记忆管理、评估方法、安全对齐、