【AIGC工作流】解构AI短剧生产管线：从手动调用DeepSeek+MJ，到Agent一站式自动化的演进

优质文章学习记录

08 Apr 2026 — 5 min read

作为一名在代码堆里摸爬滚打多年的老程序员，我对AIGC技术的落地一直保持着敏锐的观察。从最初的GPT-3 API调用，到Stable Diffusion本地部署，再到现在的视频生成模型，技术迭代的速度令人咋舌。

但在实际的AI短剧（AI Video）落地过程中，由于工具链的极度分散，导致生产效率极其低下。本文将从工作流（Workflow）重构的角度，复盘我如何将短剧生产周期从30天压缩至1天的技术路径，并分享一个我近期深度使用的Agent化平台——有戏AI。

一、痛点：传统AIGC“烟囱式”架构的效率瓶颈

在早期制作我的《重生之玄界》（全网播放量1亿+）系列时，采用的是典型的分步式微服务架构思路，每一个环节都是独立且割裂的：

NLP层：调用 DeepSeek / GPT-4 生成分镜脚本（Prompt Engineering 耗时极长）。
图像层：将脚本转化为绘图Prompt，扔进 Midjourney 或 SD。这里最大的技术难点是角色一致性（Character Consistency），往往需要训练LoRA或反复垫图。
视频层：将图片导入即梦（Dreamina）或 Sora 体系生成视频片段。
后期层：手动拖入剪映，进行音视频对齐。

缺点显而易见： 上下文Context丢失严重，数据流转需要大量人工介入（Human-in-the-loop），API调用成本高昂。这种“手动挡”模式，一个月产出一部剧已是极限。

二、破局：Agent 编排与一站式工作流

最近半年，我开始测试有戏AI。从技术视角看，它不再是一个简单的工具，而是一个面向AI短剧的垂直Agent编排系统。

它在后端打通了从 LLM（剧本理解）到 T2I（文生图）再到 I2V（图生视频）的全链路接口。其核心价值在于解决了两个工程问题：

自动化编排：它将“剧本->分镜->视频”封装为一个Atomic Operation（原子操作）。用户输入文本，系统自动拆解分镜，保持Seed一致性。
工程化交付：这是最打动开发者的功能。它支持结构化导出到剪映。

三、核心技术亮点与成本分析

作为内测用户，深度使用半年后，整理了以下几个关键维度的评测：

1. 互操作性（Interoperability）

这是很多竞品忽略的地方。有戏AI支持将生成的短剧直接导出为剪映草稿协议（包含分轨数据）。

传统模式：导出一个死板的MP4文件，后期无法修改字幕层级或BGM轨道。
有戏模式：导出的是工程文件（Project File），保留了音视频轨道、特效层的独立性。这对于追求精细化剪辑的创作者来说，是生产力的质变。

2. 算力成本与Unit Economics（单位经济模型）

算了一笔账，如果通过官方API分别调用各个大模型，生成一部3分钟短剧的Token和算力成本不菲。
但在该平台上，目前的定价策略约为市场价的50%，甚至比即梦、可灵AI的官方渠道还低30%。推测平台可能采用了大客户集采（Volume Licensing）或自建了部分推理优化层。

3. 性能表现

吞吐量：推理模式下，约10分钟可渲染一部短剧。
并发瓶颈：实测在白天高峰期（QPS较高时），前端加载会出现Latency增加的情况，说明后端的自动扩缩容策略还有优化空间。

四、一个值得利用的“机制溢出”

在进行平台逻辑测试时，我发现其用户激励系统存在一个逻辑上的Loophole（或者说是由于缺乏上限阈值导致的Feature）。

目前的激励机制是：邀请与被邀请双方互获算力。
正常逻辑下，这类激励会有Cap（上限）。但我目前账户已累积数万算力，远超普通用户所需的量级，且系统未做回滚。此前我曾向Dev团队提交过工单反馈此逻辑，但似乎由于优先级问题（Priority Low），该机制至今未修补。

对于开发者或高频使用者来说，这实际上是一个零成本积累推理资源的窗口期。

五、总结

AI短剧正在从“尝鲜”走向“工业化”。对于技术人来说，选择一个能够支持全流程自动化且后期工程兼容性好的平台，是实现降本增效的关键。

如果你也想体验这种 Agent 化的视频生产流，或者单纯想利用当下的机制红利囤积一波算力，可以尝试一下。

附：平台 vs Coze工作流对比入口，及关联资源
（利用目前的激励机制，建议先注册囤算力，待需要时直接调用）

平台名称：有戏AI
适用场景：AI短剧全流程、分镜自动化、剪映工程导出
ZEEKLOG专属测试通道：
https://youxi.fullpeace.net/login?code=mEqE
内测/激励Code：mEqE
(注：通过此Code注册，新用户获赠200算力，目前实测叠加无上限)
平台名称：Coze工作流
应用场景：手搓的自动化Agent，作为对比大家可以搜索“小胖短剧”

AI大模型深度分析后总结的OpenClaw大龙虾系统架构概览

更多OpenClaw技术文章请阅读原文本页面内容基于以下源文件生成： * docs/concepts/architecture.md 系统架构总览 Openclaw 采用中心化网关架构，所有消息表面（WhatsApp、Telegram、Slack 等）均由单一长生命周期的 Gateway 守护进程统一管理。控制平面客户端（macOS 应用、CLI、Web UI）与执行节点（macOS/iOS/Android/Headless）均通过 WebSocket 协议接入该网关，实现指令下发、状态同步与事件上报。核心架构图外部消息服务 Gateway 核心服务执行节点控制平面客户端 WebSocket WebSocket WebSocket WebSocket role: node WebSocket role: node WebSocket role:

AI 开发必用的4个skills组合，用来流畅掌控AI开发流程，灵活控制AI（opencode skills）

skills 一种技能增强器。 skills 可以理解为升级版的提示词，它的文件记录了某个skill（技能）的元信息，就是描述这个skills的名称等信息，另外它的文件中还记录了skills的技能实现步骤。以下4个skills在AI项目开发中，我认为必不可缺一。这4个skills的引入，可更为方便我们去介入AI，控制AI，给AI制定边界。我会用一个音乐机器人项目开发来介绍这4个skills，如何介入AI开发流程，如何行云流水的控制AI。指令式控制AI 开发流程的主控调度器：有4个SIKLLS 在我的项目中.opencode目录中存在4个skills， 4个skills技能结合和.opencode目录同级的AGNETS.md文档，AGNETS.md是主控配置文件，是AI 开发流程的主控调度器，负责协调三个专业技能包（毒蛇产品经理、UI设计师、全栈开发工程师、ui-ux-pro-max） ui-ux-pro-max技能包，我120%的推荐，减少了不少UI配色的塑料感，可在文末看我此次，用技能包开发的UI界面，做一个效果对比。 skills技能指令：我

【保姆级教程】AI图生图+视频生成完整工作流（附提示词+参数表）

【保姆级教程】AI图生图+视频生成完整工作流（附提示词+参数表）目录 * 一、前言 * 二、环境搭建与工具选择 * 三、第一步：生成高质量基础图片（图生图） * 3.1 模型选择 * 3.2 提示词编写 * 3.3 参数设置参考 * 四、第二步：图生视频核心操作 * 4.1 AnimateDiff插件安装与配置 * 4.2 运动参数详解 * 4.3 生成视频与后处理 * 五、实战案例与提示词解析 * 六、常见问题与解决方案（避坑指南） * 七、资源下载 * 八、结语一、前言最近AI视频生成技术火得一塌糊涂，从Runway Gen-2到Stable Diffusion的AnimateDiff插件，

Qlib——AI 导向量化投资平台：2026 年最新简单入门

Qlib 是微软开源的 AI 导向量化投资平台（AI-oriented quantitative investment platform），旨在用 AI 技术赋能量化研究，从探索想法到生产落地全流程支持。目前最新活跃版本基于 GitHub microsoft/qlib 主仓库，它不是一个简单的回测框架，而是试图把机器学习（尤其是监督学习、市场动态建模、强化学习）无缝融入量化全链路。一句话总结： Qlib = Quant + ML 的“一站式”工具箱，让你可以用 Python 快速实验 Alpha 挖掘、特征工程、模型训练、回测、组合优化、风险建模，甚至现在还集成了 RD-Agent 来自动化部分 R&D 过程。核心定位与设计理念 Qlib 的目标是“

一、 痛点：传统AIGC“烟囱式”架构的效率瓶颈

二、 破局：Agent 编排与一站式工作流

三、 核心技术亮点与成本分析