免费开源的AI短剧工具介绍--马上短剧

免费开源的AI短剧工具介绍--马上短剧

马上短剧生成系统,只需一个主题词,自动生成剧本、自动生成分镜、自动生成图片、自动生成视频,需要多少集,自由设定,实现角色、环境、声音的一致性。

这是个开源且免费的短剧生产力工具!非常英语出品

开源地址:https://github.com/frank36512/horseplay

单文件打包exe下载地址:https://pan.quark.cn/s/becdf8427ee9

使用python开发,只需要打包源码成为exe文件就可以直接运行,不需要下载依赖,也不需要任何运行库。可以直接下载打包好的exe文件,就可以用,甚至无需安装、无需注册。

📖 简介

马上短剧生成系统 (Horseplay) 是一款旨在革新短剧创作流程的综合性工具。通过集成最先进的 AI 模型(涵盖剧本创作、角色设计、图像生成、视频合成及语音合成),工具致力于赋能创作者,以极高的效率生产高质量的内容。

无论您是独立创作者还是制作团队,本工具都能帮助您保持角色一致性、生成动态的视觉叙事,并实现音画的完美同步。

免费开源的马上短剧生成系统生成的短视频


✨ 核心功能

📝 智能剧本管理

支持输出主题词生成短剧剧本,也支持输出小说或文章、段子改编成短剧,这个功能很赞。

  • AI 辅助写作: 利用强大的大语言模型(OpenAI, DeepSeek)生成剧本、对话和场景描述,自动生成分镜。
  • 格式标准化: 自动将剧本格式化为行业标准的剧本格式。
  • 分集管理:想生成几集就生成几集,只需要你输入一个数字。

🎨 双一致性系统(角色一致性和环境一致性)

  • 档案管理: 定义详细的角色特征、外貌和背景故事。
  • 参考图管理: 上传并管理参考图像,确保生成媒体中的视觉一致性。
  • 不仅实现角色一致性,也实现了环境一致性,让你不再抽卡,节省大量费用。

🎥 AI 视频生成

  • 多模型支持: 集成顶尖视频生成模型,如 Google VeoSoraRunway, 和 Stable Video Diffusion
  • 文/图生视频: 直接根据剧本描述或分镜图像生成视频。

🗣️ 音频合成

  • TTS 集成: 支持 ElevenLabsOpenAI TTS, 和 Edge TTS,生成逼真的角色语音。
  • 音效生成: 自动生成符合场景氛围的背景音乐和音效。
  • 自动配音:这个通过调用AI接口,根据自动生成高质量、富有感情的对话或旁白。
  • 声音一致性:通过内置参数调优,实现声音一致性。

🎬 可视化分镜

  • 场景可视化: 使用 DALL-E 3 或 Stable Diffusion 将剧本场景转化为可视化分镜。
  • 镜头规划: 在视频生成前规划摄像机角度和运镜。
  • 分镜参数个性化:内置多种分镜参数,简单方便,提升视频可控性。

🛠️ 技术栈

  • 语言: Python 3.10+
  • GUI 框架: PyQt6 (现代且响应迅速的界面)
  • AI 模型与 API:
    • LLM: OpenAI GPT-4, DeepSeek
    • 图像: DALL-E 3, Stable Diffusion
    • 视频: Google Veo, OpenAI Sora, Runway Gen-2/3
    • 音频: OpenAI TTS, ElevenLabs
  • 媒体处理: FFmpeg, OpenCV, Pydub
  • 数据管理: 基于 JSON 的项目结构

📂 项目结构

e:\play_tool\ ├── src/ # 源代码 │ ├── ui/ # 用户界面 (PyQt6) │ ├── core/ # 核心业务逻辑 (剧本, 角色) │ ├── ai_engine/ # AI 引擎接口 (LLM, 图像, 视频, 音频) │ └── database/ # 数据持久化 ├── resources/ # 资源与配置 │ ├── config/ # 配置文件 │ ├── projects/ # 用户项目 (Git 忽略) │ └── scenes/ # 场景资源 ├── .venv/ # 虚拟环境 ├── requirements.txt # 依赖列表 └── main.py # 启动入口 

🚀 快速开始

前置要求

  • Python 3.10+: 确保安装了 Python 3.10 或以上版本。
  • FFmpeg: 必须安装 FFmpeg 并添加到系统 PATH 环境变量中。

安装步骤

  1. 克隆仓库:git clone https://github.com/frank36512/horseplay.git cd horseplay
  2. 创建虚拟环境:# Windows python -m venv .venv .venv\Scripts\activate # Linux/macOS python3 -m venv .venv source .venv/bin/activate
  3. 安装依赖:pip install -r requirements.txt

配置指南

  1. 设置配置文件: 复制示例配置文件以创建本地配置。# Windows copy resources\config\config.example.json resources\config\config.json # Linux/macOS cp resources/config/config.example.json resources/config/config.json
  2. 添加 API 密钥: 打开 resources/config/config.json 并填入您计划使用的服务(OpenAI, ElevenLabs, Google 等)的 API 密钥。

运行应用

使用以下命令启动应用程序:

python src/main.py


🗺️ 开发进度

  •  第一阶段:基础建设 - 基础 UI、项目管理、剧本编辑器。
  •  第二阶段:AI 核心 - 深度集成 LLM 用于剧本创作,以及图像生成用于分镜。
  •  第三阶段:视频合成 - 从分镜生成连贯视频片段的流水线。
  •  第四阶段:音频与同步 - 口型同步技术(Wav2Lip)和自动混音。
  •  第五阶段:打磨 - 导出通用视频格式,时间轴编辑功能。

 开源地址:https://github.com/frank36512/horseplay

单文件打包exe下载地址:https://pan.quark.cn/s/becdf8427ee9

Read more

国产AI双雄对决:智谱GLM-5与MiniMax M2.5

国产AI双雄对决:智谱GLM-5与MiniMax M2.5

导读:2026年2月,中国AI领域迎来里程碑时刻——智谱GLM-5与MiniMax M2.5两大开源旗舰模型几乎同期发布。它们都瞄准了"Agentic Engineering"这一前沿方向,却在技术路线和能力侧重上形成了鲜明对比。本文将从技术架构、核心能力、实际案例等多个维度,为你深度解析这两款国产大模型的优劣与适用场景。 一、模型概览与核心定位 1.1 智谱GLM-5:开源Agent任务的王者 发布时间:2026年2月11日 开源协议:MIT License 总参数量:744B(激活参数40B) 训练数据:28.5万亿tokens 上下文窗口:200K GLM-5是智谱AI推出的最新一代大模型,定位是"当下顶尖的Coding模型"。在全球权威榜单Artificial Analysis上,GLM-5位列全球第四、开源第一。 核心突破: * Agentic Engineering能力:不仅能写代码,更能处理复杂系统工程与长程Agent任务

【证书】2025上海市人工智能训练师—高级/三级考试介绍与复习(SJTU版)

【证书】2025上海市人工智能训练师—高级/三级考试介绍与复习(SJTU版) 文章目录 * 1、考试介绍 * 2、考试复习 * 2.1 理论知识 * 2.2 实践知识 1、考试介绍 职业定义1 * 标准名称:人工智能训练师 * 国家职业编号:4-04-05-05 * 职业内容:使用智能训练软件, 在人工智能产品实际使用过程中进行数据库管理、 算法参数设置、 人机交互设计、 性能测试跟踪及其他辅助作业的人员。 职业技能等级 * 本职业共设 5 个等级,分别为: 五级/初级工、四级/中级工、(约对标初级职称) 三级/高级工、(约对标中级职称) 二级/技师、一级/高级技师 (约对标高级职称) 人工智能训练师(上海市) * 项目鉴定单位为:

【保姆级教程】告别命令行!ClawX:首款 OpenClaw 可视化桌面客户端,零门槛玩转 AI 智能体!

【保姆级教程】告别命令行!ClawX:首款 OpenClaw 可视化桌面客户端,零门槛玩转 AI 智能体!

目录 1、为什么选择 ClawX?(核心亮点) 🎯 零配置门槛 (Zero Configuration) 💬 现代化的聊天体验 ⏰ 可视化的自动化任务 (Cron Automation) 🧩 技能插件市场 (Skill System) 2、技术揭秘:它是如何工作的? 3、快速上手指南 4、注册并获取高性能 API 5、在 ClawX 中接入 API 6、验证连接与初次体验 🚀 结语:这只是冰山一角 在这个“万物皆可 Agent”的时代,我们见证了 OpenClaw 这样优秀的开源项目如何重新定义了 AI 任务编排。它强大、灵活,能帮我们串联起各种复杂的 AI 工作流。 但是,你是否也曾有过这样的困扰? * 想要体验最新的 AI

关于 Codex 和字节跳动(Trae)在 AI 实践中的技术分享

以下是关于 Codex 和字节跳动(Trae)在 AI 实践中的技术分享 Codex 实践分享 Codex 是 OpenAI 基于 GPT-3 微调的代码生成模型,主要用于代码补全和自然语言转代码任务。 核心能力 * 支持多种编程语言(Python、JavaScript、Go 等),尤其擅长 Python。 * 能够根据自然语言描述生成完整代码片段,例如“写一个快速排序函数”。 * 集成在 GitHub Copilot 中,成为开发者辅助工具。 优化方向 * 通过海量开源代码(如 GitHub 数据)进行预训练,增强代码理解能力。 * 采用人类反馈强化学习(RLHF)优化生成结果的准确性和可读性。 挑战 * 生成代码可能存在安全漏洞或依赖过时库,需人工审核。 * 对复杂业务逻辑的理解有限,需结合领域知识调整。 字节跳动 Trae 实践分享