跳到主要内容

极客日志面向AI+效率的开发者社区

首页博客 GitHub 精选镜像 AI 生图工具 UI配色美学隐私政策关于联系

搜索内容 / 工具 / 仓库 / 镜像...⌘K 搜索

Coze 工作流与 AI 视频自动化制作 | 极客日志

编程语言SaaSAI

Coze 工作流与 AI 视频自动化制作

介绍 Coze 工作流的基础概念及在 AI 视频自动化制作中的应用。Coze 提供可视化低代码编排工具，通过拖拽节点串联大模型、插件和逻辑。教程以 AI 视频制作为例，详细解析了从素材生成到自动化剪辑的全流程。包括启动输入、剧本生成、画面拆分、图像生成（含容错）、运镜脚本生成、数据聚合，以及时间线预处理、素材结构化、草稿创建与保存等关键步骤。文末提示了 Token 消耗及升级建议。

未来可期发布于 2026/4/6更新于 2026/7/1958 浏览

Coze 工作流与 AI 视频自动化制作

Coze 工作流是字节跳动 Coze 平台的可视化、低代码 AI 流程编排工具，核心是用拖拽节点的方式，把大模型、插件、代码、判断逻辑等能力串成完整任务链，快速构建复杂 AI 应用。

文章配图

一、基础准备：注册并登录扣子官网

进入扣子官网。

文章配图

点击资源库然后创建工作流。

文章配图

二、主要操作

我们使用工作流的主要流程是：开始节点 -> 功能节点 -> 调用 AI 大模型 -> 辅助功能节点 -> 结束节点。

文章配图

文章配图

这里需要注意任何的工作流都需要有开始节点和结束节点，之后你所配置的工作流可以当作本地的插件部署到你的智能体当中。

三、案例解析：AI 视频制作工作流

文章配图

文章配图

例如上图当中的 AI 视频制作，主要分为两大步：图片以及素材生成；自动化剪辑制作。

1. 素材生成

文章配图

1. 启动与输入

节点：开始
操作：接收初始输入 lishirenwu（任务名称 / 主题），作为整个流程的起始数据源。

2. 生成故事剧本

节点：1. 根据名字做剧本
输入：来自「开始」节点的 input
操作：调用大模型（豆包・1.5・Pro・32k），基于输入主题生成完整故事剧本，输出：
- title：剧本标题
- content：剧本正文内容

3. 拆分画面描述

节点：2. 根据剧本做每个经历的画面描述
输入：上一步生成的剧本 input（包含 title 和 content）
操作：调用大模型（豆包・1.5・Pro・32k），将剧本拆分为逐镜头 / 场景的画面描述，输出 output（结构化画面描述列表）。

4. 生成画面底图（主流程）

节点：3. 批处理：根据画面画面做图
输入：上一步的画面描述 input
操作：对每个画面描述批量执行图像生成：
1. 调用文生图模型生成对应画面的基础图像
2. 输出 output（包含图像数据与状态信息）

5. 生成视频运镜脚本

并行分支 A：4. 批处理：做运镜 + 即梦 / 豆包 / 海螺做视频所需运镜
- 输入：来自「画面描述」的 prompt 和 content
- 操作：
  1. 先由大模型生成每个画面对应的运镜脚本（如推镜、拉镜、转场等）
  2. 输出可直接用于视频生成工具（即梦 / 豆包 / 海螺）的运镜指令 output
- 作用：为后续视频合成提供镜头运动逻辑

6. 图像生成与容错处理

并行分支 B：批处理体（图像生成与重试）
1. 图像生成：
  - 输入：画面描述 input
  - 调用文生图模型（Seedream 4.0）生成图像，输出 data（图像数据）和 msg（状态信息）
2. 结果判断：
  - 选择器：判断图像生成结果 data 是否为空（Empty）
  - 如果为空：进入「修改提示词」节点
    - 输入：失败的 input
    - 调用大模型优化 / 重写画面提示词，输出新的 output
    - 进入「重新做图」节点，再次调用 Seedream 4.0 生成图像
  - 如果不为空：直接进入「变量聚合」节点

7. 数据聚合与输出

节点：变量聚合
输入：
- 来自「图像生成 / 重新做图」的 image（最终图像数据）和 data
- 来自「运镜脚本」的 data（运镜指令）
操作：将图像资源、运镜指令、剧本信息等聚合为结构化数据集 Group1，作为最终输出，可用于后续视频合成工具。

2. 自动化剪辑

文章配图

1. 时间线预处理

节点：6. 做时间线
输入：input（原始剧本 / 画面数据）
操作：调用大模型（豆包・1.5・Pro・32k），生成视频总时长 totalDuration 和分段时间轴 segments，为后续素材对齐提供时间基准。

2. 素材信息结构化处理

节点：video_infos: 视频素材
- 输入：timelines（时间轴）、video_urls（视频链接）、height、width
- 输出：结构化视频素材信息 infos
节点：caption_infos: 标题 / caption_infos: 字幕
- 输入：seats（文本内容）、timelines（时间轴）、font_size
- 输出：结构化标题 / 字幕信息 infos
节点：str_to_list: 笑声 mp3 / 五百年 mp3
- 输入：obj（音频字符串）
- 输出：列表化音频路径 infos
节点：audio_timelines: 笑声时间线
- 输入：links（音频链接）、timelines（时间轴）
- 输出：带时间戳的笑声音频时间轴 infos
节点：audio_infos: 合成发声 / 合成五百年
- 输入：mp3_urls（音频链接）、timelines（时间轴）、audio_effect（音频效果）
- 输出：结构化合成音频信息 infos

3. 视频草稿创建

节点：create_draft
输入：height、rt_user_id、width
操作：创建一个空白视频草稿，输出 draft_url（草稿链接）和 rt_user_id。

4. 素材添加到草稿

节点：add_videos
- 输入：draft_url、video_infos（视频素材）、alpha
- 操作：将所有视频素材按时间轴插入草稿，输出更新后的 draft_url、segment_ids、track_id
节点：add_captions / add_captions_1
- 输入：captions（字幕 / 标题）、draft_url、alignment
- 操作：分别添加标题和字幕到对应时间片段，输出 segment_ids、segment_infos
节点：add_audios / add_audios_1
- 输入：audio_infos（合成音频 / 笑声 / 背景音乐）、draft_url
- 操作：将多轨道音频（人声、音效、BGM）插入草稿，输出 audio_ids、更新后的 draft_url、track_id

5. 草稿保存与结束

节点：save_draft
- 输入：draft_url、rt_user_id
- 操作：保存最终合成好的视频草稿，输出 draft_url 和 message（状态信息）
节点：结束
- 操作：流程终止，返回变量 output（草稿链接与状态）

四、注意事项

使用 Coze 搭建或者测试工作流都会消耗 Token，Coze 平台登陆注册会赠送一些，如有更多的要求可以升级进阶版。

文章配图

目录

一、基础准备：注册并登录扣子官网
二、主要操作
三、案例解析：AI 视频制作工作流
1. 素材生成
1. 启动与输入
2. 生成故事剧本
3. 拆分画面描述
4. 生成画面底图（主流程）
5. 生成视频运镜脚本
6. 图像生成与容错处理
7. 数据聚合与输出
2. 自动化剪辑
1. 时间线预处理
2. 素材信息结构化处理
3. 视频草稿创建
4. 素材添加到草稿
5. 草稿保存与结束
四、注意事项

免费图片AI生成工具免费生成了解详情

Magick API 一键接入全球大模型注册送1000万token查看
免费图片视频在线生成30秒，将你的创意变成现实开始设计
X/Twitter免费视频下载器免登陆无限额度免费视频解析下载了解详情
100+免费在线小游戏爽一把

极客日志微信公众号二维码

微信扫一扫，关注极客日志

微信公众号「极客日志V2」，在微信中扫描左侧二维码关注。展示文案：极客日志V2 zeeklog

更多推荐文章

数据结构：堆、堆排序与 TOP-K 问题详解
DeepSeek 深度使用指南：提示词技巧与本地知识库搭建
基于 PHP 与 Vue 的在线小说阅读平台设计与实现
医疗送药机器人三重链式编程技术解析：空间拓扑、动态决策与容错控制
网络安全系统学习路线：从基础到进阶的完整指南
Erupt 低代码框架基于 Java 注解的企业级应用开发方案
AI 自动化测试：接口测试全流程实现方法
MATLAB 实现基于强制导向函数法（PFA）的无人机三维路径规划
基于 ROS 的黑线循迹与激光跟随双模态视觉导航系统实战
C++ 搜索引擎通用工具类实现：文件读取与分词集成
旋转位置编码 RoPE：从 2D 到 nD 的扩展与外推机制解析
Spring Boot 4.0 虚拟线程时代：WebFlux 与 WebMVC 选型指南
C++ string 类刷题实战：常用字符串处理技巧
Vitis 实现 AI 模型 FPGA 部署实战教程
OpenClaw 本地极简部署与 QQ 机器人接入教程
Python 爬虫零基础入门：系统路线与工程化实战
C++ 函数重载：规则、实现与实战案例
Android WebView 版本升级方案详解
从 try-catch 回调到链式调用：一种更优雅的 async/await 错误处理方案
网络安全入门教程：从零开始掌握基础技术与工具

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online