基于 GLM 4.7 与 Flutter 开发 AI 漫剧 APP 实战
项目背景
目前市面上多数 AI 漫剧平台仅支持 PC Web 端操作,缺乏移动端随时创作的工具。本项目旨在开发一款可在手机端创建漫剧的 APP,命名为'漫导'。
该应用能根据一句话灵感创建剧本、角色、场景,自动生成分镜图片和分镜视频,最后合成完整的漫剧视频。

核心功能包括:
- 一句话生成剧本
- 角色三视图生成(解决人物一致性)
- 场景分镜规划
- 分镜视频合成
技术选型
工具与模型
- CLI 编程助手: Claude Code
- 核心模型: 智谱 GLM 4.7
- 前端框架: Flutter (Dart)
- 架构模式: ReAct (Reasoning + Acting)
选择 GLM 4.7 主要基于其高性价比及在 AI Coding 任务中的表现。相比其他模型,其在代码生成准确度上表现优异,且成本可控。
架构设计
采用 ReAct 模式实现简单的 Reason-Act 循环,避免硬编码逻辑。
用户输入 -> GLM-4.7(规划层): 思考并输出工具调用指令 -> App(执行层): 解析指令调用 API -> App(反馈层): 将结果喂回 GLM-4.7 -> GLM-4.7(规划层): 下一步指令
开发历程
1. 初始化与提示词
首先编写提示词告知目标,并提供相关接口文档路径。
提示词:现在帮我编写一个安卓软件,用途是制作 AI 漫剧,和用户对话的方式来了解用户想制作什么样子的漫剧,对话大模型使用的是 glm 4.7,相关的接口文档都保存在这个目录下面 director_ai/docs/图像生成 API 接口文档.md director_ai/docs/视频处理全集.md
2. 架构规划
为 GLM 4.7 规划核心技术栈,防止跑偏。
提示词:核心技术栈推荐 为了最快速度出原型(MVP)且适配安卓:
开发工具 (IDE/Agent): Claude Code (基于 CLI 的全能编程助手)。
前端框架: Flutter (Dart)。
理由:Claude 对 Flutter 代码生成的准确度极高,且 Flutter 开发安卓应用速度快、UI 效果好,能够轻松处理异步网络请求(API 调用)。
核心大脑:GLM-4.7 (通过 API 调用)。
理由:负责理解用户意图,拆解步骤,输出 JSON 格式的指令。
多模态接口:tu-zi.com (提供 Gemini 绘图 + Veo 视频接口)。
3. 基础搭建与调试
基础搭建过程自动化,约十分钟完成从零到一的 APP 雏形。
界面支持 AI 聊天及相机图片上传,UI 简洁可用,包含对话记录功能。





