基于 Openclaw 与 Seed2.0 Skills 的 AI 漫剧生成方案
近期在探索 Openclaw 框架时,集成了多个实用技能,包括自动写作、配图及封面生成等。为进一步丰富应用场景,开发了基于字节 Seed2.0 的 AI 漫剧视频生成技能包。
技能概览
该技能包包含以下子技能:
- seedance-video:文生视频、图生视频,seedance 1.5 Pro 版本自带音频生成。
- manga-style-video:支持 8 种漫画风格一键切换,如日式治愈系、吉卜力、国风水墨、美式卡通等。
- manga-drama:核心漫剧生成器,输入主角图即可自动编排分镜短剧。
- volcengine-video-understanding:基于 doubao-seed-2.0-code 能力的火山视频理解,用于生成后的效果分析。
从写脚本到出视频再到验收,实现全流程自动化。例如直接调用 manga-drama 技能生成视频,通过控制提示词可生成精致的动漫风格视频。

动漫风格视频,一名长发高中少女漫步在盛开的樱花树下。粉色的花瓣在微风中缓缓飘落。明媚的春季阳光洒下,产生柔和的镜头光晕效果。侧向跟踪镜头,怀旧氛围,高画质,控制在 20M 以内,并以视频文件预览的方式直接发给我

可以使用一张图片,直接生成漫剧分镜视频,生成脚本到主角再到分镜视频,manga-drama 都能一次性完成。

生成的分镜视频合成了下是这样的:

工作流程
第一步:剧本逻辑编排
由后端配置的大模型负责生成分镜逻辑、编排场景顺序。例如制作「少年仗剑走天涯」国风漫剧,模型会自动拆分为开场独白、拔剑出鞘、对决场景等幕次,并附带详细的画面描述和镜头指令。

第二步:主角设定 + 风格选择
脚本确认后,调用图像生成 skill 来生成主角形象,支持 Google API 及第三方 API。同时选择预设风格,无需自行调参。

第三步:漫剧生成
将主角图传入 manga-drama Skill,内置 5 种分镜类型(主角登场、动作场景、情感表达、互动场景、结尾定格),自动安排构图、镜头角度及光影氛围。

第四步:效果验收
视频生成后,通过 volcengine-video-understanding 进行内容分析。评估情感表达到位与否、场景衔接是否顺畅,相当于自带 AI 质检员。

技术选型
整个流程中需要调用多个 Skills 并理解视频内容,doubao-seed-2.0-code 模型在多模态感知、长视频理解及对 Skills 的应用上表现优异。其 Agent 和 VLM 能力能够支持长达 2 小时的视频理解及剪辑混剪。
总结
Openclaw 的可玩性较高,建议搭载自定义 Skills 技能包,而非依赖公共基线。将个人方法论、模板沉淀为可版本化资产更为推荐。待 Seedance 2.0 API 正式开放后,画面一致性与角色连贯性预计会有进一步提升。


