背景
视频创作门槛高,脚本、素材、剪辑、配音、字幕每一步都耗费大量精力。对于个人创作者或小团队,保持高频更新几乎不可能。视频自动化生成是内容创作者绕不开的命题。
本文介绍如何利用 Remotion 框架结合 AI 与 n8n 工作流,搭建一套真正意义上的「一键生成视频」流水线。
现有方案的局限性
在找到 Remotion 之前,调研了市面上主流的视频自动化方案,最常见的是基于剪映的 API 或第三方封装项目。
第一,强依赖客户端。 最终渲染往往还是要打开剪映客户端来完成,无法做到真正的无人值守全自动化。
第二,云渲染要收费。 如果想绕开客户端,就得用剪映的云渲染服务,这意味着额外的成本,而且在自动化工作流里引入了一个不可控的外部依赖。
第三,AI 介入程度有限。 这类方案本质上还是「程序控制剪辑软件」,AI 只能在内容生成环节发挥作用,视频的渲染和合成环节 AI 插不上手。
有没有一种方式,能让整个视频生成过程完全代码化?如果视频本身就是代码写出来的,那 AI 不就可以直接参与到视频制作的每一个环节了吗?
带着这个问题去搜,找到了 Remotion。
Remotion 框架解析
官方 GitHub 地址:https://github.com/remotion-dev/remotion
官方模板展示:https://www.remotion.dev/templates
Remotion 是一个基于 React 的视频编程框架。 它的核心理念非常简单也非常革命性:视频就是代码,代码就是视频。
在 Remotion 的世界里,你不需要打开任何视频编辑软件。你写的每一个 React 组件,就是视频里的一个画面元素。你控制组件的状态和动画,就是在控制视频的时间轴。最终,Remotion 会用无头浏览器(Headless Chrome)逐帧渲染你的 React 组件,然后用 FFmpeg 把这些帧合成为 MP4 视频文件。
整个过程,完全在服务器端完成,不需要任何 GUI,不需要任何客户端软件。
这意味着什么?这意味着你可以把视频生成这件事,变成一个普通的 API 调用。你的服务器收到一个请求,跑一段代码,输出一个 MP4 文件。就这么简单。
Remotion 能做什么样的视频?
可能很多人第一反应是:用代码写视频,效果会不会很简陋?
完全不是。去 Remotion 的模板页面 看一眼就知道了。官方提供了大量开箱即用的模板,涵盖:
- 字幕视频:自动根据音频生成逐字高亮字幕,适合 Podcast、访谈类内容
- 数据可视化视频:动态图表、数据大屏,适合年度总结、数据报告
- 社交媒体短视频:竖版短视频模板,适合抖音、Instagram Reels
- 产品展示视频:带动画效果的产品介绍,适合 SaaS 产品、App 推广
- 新闻播报风格:带滚动字幕和背景的新闻播报模板
- GitHub 贡献图动画:把 GitHub 的绿格子变成动态视频,极客风十足
这些模板都是开源的,你可以直接拿来用,也可以在此基础上二次开发。
Remotion 的技术架构
简单了解一下 Remotion 的工作原理,有助于后续理解整个自动化方案的设计思路。
你的 React 代码 ↓ Remotion 渲染引擎(Headless Chrome) ↓ 逐帧截图(PNG 序列) ↓ FFmpeg 合成 ↓ MP4 / WebM / GIF 输出
Remotion 的核心 API 主要有这几个:

