OpenMAIC 技术深度解析：基于多智能体的沉浸式 AI 课堂 | 极客日志

TypeScriptNode.jsPPT制作AI大前端算法

OpenMAIC 技术深度解析：基于多智能体的沉浸式 AI 课堂

OpenMAIC 是基于多智能体编排的沉浸式 AI 课堂系统，支持一键生成互动课程。通过两阶段 Pipeline 规划大纲并生成场景，利用 LangGraph 协调教师与学生智能体进行实时交互。系统涵盖幻灯片、测验、模拟及项目式学习四种场景，支持白板绘图、语音合成及 PPTX/HTML 导出。集成 OpenClaw 实现从消息应用直接生成课堂，采用 Next.js 全栈架构，兼容多种 LLM 模型，适用于教育、培训及知识分享场景。

人间失格发布于 2026/4/9更新于 2026/5/2812 浏览

OpenMAIC 技术深度解析：基于多智能体的沉浸式 AI 课堂

一、引言

在线教育经历了从 MOOC 到 AI 驱动的演进，但仍缺乏真正的互动性和个性化体验。OpenMAIC（Open Multi-Agent Interactive Classroom）由清华大学 MAIC 实验室开发，通过多智能体编排技术，将任何主题或文档转化为沉浸式、可互动的 AI 课堂体验。

二、项目概述

2.1 核心理念

OpenMAIC 旨在实现'一键生成沉浸式多智能体学习体验'，突破传统在线教育的局限：

特性	传统在线教育	OpenMAIC
交互模式	被动观看视频	多智能体实时互动
内容路径	固定内容	动态生成
课堂体验	单向输出	实时反馈与讨论

核心特性：

一键生成：输入主题或上传材料，AI 自动构建完整课堂
多智能体协同：AI 教师 + AI 同学共同授课与讨论
丰富场景类型：幻灯片、测验、互动模拟、项目式学习
白板与语音：智能体可实时绘图、讲解公式、语音输出
多格式导出：可编辑 PPTX 或交互式 HTML
OpenClaw 集成：从 Feishu、Slack 等 20+ 消息应用直接生成课堂

2.2 技术栈

技术层	技术选型	说明
前端框架	Next.js	React 全栈框架，App Router
UI 库	shadcn/ui + Radix	高质量 React 组件库
状态管理	Zustand	轻量级状态管理
语言	TypeScript	类型安全
样式	Tailwind CSS	实用优先的 CSS 框架
智能体编排	LangGraph	多智能体状态机
LLM 抽象	自定义 Provider 层	支持 OpenAI、Anthropic、Gemini 等
语音合成	多 TTS 提供商	可定制语音
幻灯片生成	pptxgenjs 定制版	PowerPoint 生成

三、核心架构设计

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

OpenMAIC/
├── app/                     # Next.js App Router
│   ├── api/                 # 服务端 API 路由（18 个端点）
│   │   ├── generate/        # 场景生成 Pipeline
│   │   ├── generate-classroom/ # 异步课堂任务提交
│   │   ├── chat/            # 多智能体讨论（SSE 流式）
│   │   └── pbl/             # 项目式学习端点
│   ├── classroom/[id]/      # 课堂播放页面
│   └── page.tsx             # 首页（生成输入）
│   ├── lib/                 # 核心业务逻辑
│   │   ├── generation/      # 两阶段课程生成 Pipeline
│   │   ├── orchestration/   # LangGraph 多智能体编排
│   │   ├── playback/        # 播放状态机
│   │   ├── action/          # 动作执行引擎
│   │   ├── ai/              # LLM Provider 抽象
│   │   ├── store/           # Zustand 状态存储
│   │   └── types/           # TypeScript 类型定义
│   ├── components/          # React UI 组件
│   │   ├── slide-renderer/  # Canvas 幻灯片渲染器
│   │   ├── scene-renderers/ # 测验、互动、PBL 渲染器
│   │   └── whiteboard/      # SVG 白板绘图
│   ├── skills/              # OpenClaw 技能
│   └── openmaic/            # 引导式设置和生成 SOP
├── packages/                # 工作区包
├── pptxgenjs/               # 定制 PowerPoint 生成
└── mathml2omml/             # MathML → Office Math 转换

class TwoStageGenerationPipeline:
    """ 两阶段课程生成 Pipeline """
    def __init__(self):
        self.llm_provider = LLMProvider()
        self.content_generator = ContentGenerator()

    def generate_lesson(self, topic, materials=None):
        """ 生成完整课程 """
        # 阶段 1: 大纲生成
        outline = self.generate_outline(topic, materials)
        # 结构化课程大纲，包含学习目标、章节、要点
        
        # 阶段 2: 场景内容生成
        scenes = []
        for item in outline.items:
            scene = self.generate_scene(item)
            # 根据类型生成：幻灯片/测验/互动/PBL
            scenes.append(scene)
        return {'outline': outline, 'scenes': scenes}

    def generate_outline(self, topic, materials):
        """ 生成课程大纲 """
        prompt = f"""
        分析主题：{topic}
        参考材料：{materials}
        生成结构化课程大纲，包含：
         - 学习目标（3-5 个）
         - 章节划分（4-6 章）
         - 每章要点（2-4 个）
         - 建议场景类型（slide/quiz/interactive/pbl）
        """
        return self.llm_provider.generate(prompt)

    def generate_scene(self, outline_item):
        """ 生成场景内容 """
        scene_type = outline_item.get('scene_type', 'slide')
        if scene_type == 'slide':
            return self.generate_slide(outline_item)
        elif scene_type == 'quiz':
            return self.generate_quiz(outline_item)
        elif scene_type == 'interactive':
            return self.generate_interactive(outline_item)
        elif scene_type == 'pbl':
            return self.generate_pbl(outline_item)

from langgraph.graph import StateGraph

class MultiAgentOrchestrator:
    """ 基于 LangGraph 的多智能体编排器 """
    def __init__(self):
        self.graph = self.build_director_graph()

    def build_director_graph(self):
        """ 构建导演图 """
        graph = StateGraph(AgentState)
        # 添加节点
        graph.add_node("teacher_agent", self.teacher_agent)
        graph.add_node("student_agent_1", self.student_agent)
        graph.add_node("student_agent_2", self.student_agent)
        graph.add_node("discussion_coordinator", self.coordinator)
        
        # 定义边
        graph.add_edge("teacher_agent", "student_agent_1")
        graph.add_edge("student_agent_1", "student_agent_2")
        graph.add_edge("student_agent_2", "discussion_coordinator")
        graph.add_edge("discussion_coordinator", END)
        return graph.compile()

    def teacher_agent(self, state: AgentState):
        """ AI 教师智能体 """
        # 角色设定：专业、引导性
        system_prompt = """
        你是一位经验丰富的教师，负责：
         - 讲授核心概念
         - 回答学生问题
         - 引导讨论方向
         - 在白板上绘图说明
        """
        action = self.decide_action(state)
        # 生成动作：speech/whiteboard/slide/highlight
        return {'agent': 'teacher', 'action': action, 'content': self.generate_content(state.context)}

    def student_agent(self, state: AgentState):
        """ AI 学生智能体（不同人设） """
        # 角色 1：好问型学生
        # 角色 2：实践型学生
        # 可以有更多人设...
        return {'agent': f'student_{state.student_id}', 'action': 'question', 'content': self.generate_question(state.context)}

智能体角色	功能	行为特点
AI 教师	核心讲解	专业、引导、白板绘图
AI 同学 1	提问互动	好问型，主动发起讨论
AI 同学 2	补充观点	实践型，分享经验
协调器	流程控制	管理讨论节奏，切换主题

// 播放状态机
enum PlaybackState {
  Idle = 'idle',
  Playing = 'playing',
  Live = 'live'
}

class PlaybackEngine {
  private state: PlaybackState;
  private currentScene: Scene;
  private agents: Agent[];

  async playScene(scene: Scene) {
    this.state = PlaybackState.Playing;
    this.currentScene = scene;
    // 遍历场景中的动作序列
    for (const action of scene.actions) {
      await this.executeAction(action);
      // 检查用户互动
      if (this.hasUserInteraction()) {
        this.state = PlaybackState.Live;
        await this.handleInteraction();
        this.state = PlaybackState.Playing;
      }
    }
    this.state = PlaybackState.Idle;
  }

  private async executeAction(action: Action) {
    // 28+ 动作类型执行
    switch (action.type) {
      case 'speech':
        await this.tts.speak(action.content);
        break;
      case 'whiteboard_draw':
        await this.whiteboard.draw(action.content);
        break;
      case 'slide_highlight':
        await this.slideRenderer.highlight(action.target);
        break;
      case 'laser_pointer':
        await this.slideRenderer.laserPointer(action.position);
        break;
      // ... 更多动作类型
    }
  }

  private async handleInteraction() {
    // 实时用户互动处理
    const userMessage = await this.waitForUserMessage();
    // 通过 LangGraph 路由给合适的智能体
    const response = await this.orchestrator.route(userMessage, this.currentContext);
    await this.executeAction(response.action);
  }
}

class ActionEngine {
  // 28+ 动作类型
  private actionHandlers: Map<ActionType, ActionHandler>;

  constructor() {
    this.actionHandlers = new Map([
      ['speech', new SpeechActionHandler()],
      ['whiteboard_draw', new WhiteboardDrawHandler()],
      ['whiteboard_text', new WhiteboardTextHandler()],
      ['whiteboard_shape', new WhiteboardShapeHandler()],
      ['whiteboard_chart', new WhiteboardChartHandler()],
      ['slide_show', new SlideShowHandler()],
      ['slide_highlight', new SlideHighlightHandler()],
      ['laser_pointer', new LaserPointerHandler()],
      ['spotlight', new SpotlightHandler()],
      // ... 更多动作类型
    ]);
  }

  async execute(action: Action): Promise<void> {
    const handler = this.actionHandlers.get(action.type);
    if (!handler) {
      throw new Error(`Unknown action type: ${action.type}`);
    }
    await handler.execute(action);
  }
}

interface LLMProvider {
  name: string;
  generate(prompt: string, options?: GenerateOptions): Promise<string>;
  stream(prompt: string): AsyncIterable<string>;
}

class ProviderManager {
  private providers: Map<string, LLMProvider>;

  constructor() {
    this.providers = new Map([
      ['openai', new OpenAIProvider()],
      ['anthropic', new AnthropicProvider()],
      ['google', new GeminiProvider()],
      ['deepseek', new DeepSeekProvider()],
      // 支持任何 OpenAI 兼容 API
    ]);
  }

  getProvider(name?: string): LLMProvider {
    const providerName = name || this.getDefaultProvider();
    const provider = this.providers.get(providerName);
    if (!provider) {
      throw new Error(`Provider not found: ${providerName}`);
    }
    return provider;
  }

  private getDefaultProvider(): string {
    // 推荐：Gemini 3 Flash（质量与速度平衡）
    // 最高质量：Gemini 3.1 Pro
    return 'google';
  }
}

class SlideSceneGenerator {
  async generate(outlineItem: OutlineItem): Promise<SlideScene> {
    const content = await this.llm.generate(`
      为以下主题生成幻灯片内容：${outlineItem.title}
      包含：
       - 标题（简洁有力）
       - 要点列表（3-5 个）
       - 配图描述（用于图像生成）
       - 动作序列（演讲者台词、高亮效果）
    `);
    return {
      type: 'slide',
      content: this.parseContent(content),
      actions: this.generateActions(content),
      metadata: {
        duration: this.estimateDuration(content),
        difficulty: outlineItem.difficulty
      }
    };
  }
}

class QuizSceneGenerator {
  async generate(outlineItem: OutlineItem): Promise<QuizScene> {
    const quiz = await this.llm.generate(`
      为以下主题生成测验：${outlineItem.title}
      要求：
       - 3-5 道题
       - 混合题型（单选/多选/简答）
       - 包含正确答案和解析
       - 难度适中
    `);
    return {
      type: 'quiz',
      questions: this.parseQuiz(quiz),
      grading: 'auto', // AI 自动评分
      feedback: true // 提供反馈
    };
  }
}

class InteractiveSceneGenerator {
  async generate(outlineItem: OutlineItem): Promise<InteractiveScene> {
    const html = await this.llm.generate(`
      为以下主题生成 HTML 互动模拟：${outlineItem.title}
      要求：
       - 使用原生 HTML/CSS/JavaScript
       - 可视化展示概念
       - 支持用户交互
       - 代码简洁可维护
    `);
    return {
      type: 'interactive',
      html: html,
      sandboxed: true // 沙箱环境运行
    };
  }
}

class PBLSceneGenerator {
  async generate(outlineItem: OutlineItem): Promise<PBLScene> {
    const project = await this.llm.generate(`
      为以下主题设计项目式学习：${outlineItem.title}
      包含：
       - 项目描述
       - 角色分配（学生扮演）
       - 里程碑（3-5 个）
       - 交付物
       - AI 助手支持计划
    `);
    return {
      type: 'pbl',
      roles: this.parseRoles(project),
      milestones: this.parseMilestones(project),
      collaboration: 'ai_peers', // AI 同学协作
      deliverables: this.parseDeliverables(project)
    };
  }
}

# ~/.openclaw/skills/openmaic/SKILL.md
name: openmaic
description: 从任何主题生成互动 AI 课堂
triggers:
  - "教我.*"
  - "学习.*"
  - "生成课堂.*"
phases:
  clone:
    detection: auto
    confirmation: true
  startup:
    modes:
      - pnpm dev
      - pnpm build && pnpm start
      - docker compose up
    selection: user_choice
  provider_keys:
    recommendation: gemini
    user_edit: true
  generation:
    async: true
    polling: true
  notification:
    link_ready: true

# 克隆项目
git clone https://github.com/THU-MAIC/OpenMAIC.git
cd OpenMAIC
# 安装依赖
pnpm install
# 配置环境变量
cp .env.example .env.local
# 编辑.env.local，添加 LLM API 密钥
# 启动开发服务器
pnpm dev
# 访问 http://localhost:3000

# docker-compose.yml
version: '3.8'
services:
  openmaic:
    build: .
    ports:
      - "3000:3000"
    environment:
      - OPENAI_API_KEY=${OPENAI_API_KEY}
      - ANTHROPIC_API_KEY=${ANTHROPIC_API_KEY}
      - GOOGLE_API_KEY=${GOOGLE_API_KEY}
      - DEFAULT_MODEL=google:gemini-3-flash-preview
    volumes:
      - ./data:/app/data

# 配置环境变量
cp .env.example .env.local
# 编辑.env.local
# 启动服务
docker compose up --build

# 必需：至少配置一个 LLM API 密钥
OPENAI_API_KEY=sk-...
ANTHROPIC_API_KEY=sk-ant-...
GOOGLE_API_KEY=...
# 可选：默认模型
DEFAULT_MODEL=google:gemini-3-flash-preview
# 可选：MinerU 增强文档解析
PDF_MINERU_BASE_URL=https://mineru.example.com
PDF_MINERU_API_KEY=your_api_key

维度	传统方案	OpenMAIC
内容生成	手动制作	AI 两阶段自动生成
互动性	被动观看	多智能体实时互动
个性化	固定路径	动态调整适配
场景类型	单一幻灯片	4 种场景类型
部署便利性	复杂配置	OpenClaw 一键生成

场景	示例	特点
快速学习	'30 分钟 Python 入门'	浓缩核心知识
游戏教学	'阿瓦隆规则讲解'	互动式规则说明
金融分析	'智谱 AI 股价分析'	结合实时数据
论文解读	'DeepSeek 论文精读'	深度技术剖析

# 示例 1：编程教学
user_input = "教我 Python 从零开始"
output = {
  "outline": ["环境搭建", "基础语法", "数据结构", "函数编程"],
  "scenes": [
    {"type": "slide", "topic": "环境搭建"},
    {"type": "interactive", "topic": "代码练习"},
    {"type": "quiz", "topic": "语法测试"}
  ]
}

# 示例 2：论文解读
user_input = "解读 DeepSeek 最新论文"
output = {
  "outline": ["背景", "方法", "实验", "结论"],
  "scenes": [
    {"type": "slide", "content": "核心创新点"},
    {"type": "interactive", "content": "架构可视化"},
    {"type": "pbl", "content": "复现关键实验"}
  ]
}

# 克隆
git clone https://github.com/THU-MAIC/OpenMAIC.git
cd OpenMAIC
# 安装
pnpm install
# 配置
cp .env.example .env.local
# 添加 API 密钥
# 运行
pnpm dev

OpenMAIC 技术深度解析：基于多智能体的沉浸式 AI 课堂

OpenMAIC 技术深度解析：基于多智能体的沉浸式 AI 课堂

一、引言

二、项目概述

2.1 核心理念

2.2 技术栈

三、核心架构设计

更多推荐文章

相关免费在线工具

3.1 整体架构

3.2 项目结构解析

四、核心技术解析

4.1 两阶段生成 Pipeline

4.2 多智能体编排（LangGraph）

4.3 播放引擎

4.4 动作执行引擎

五、LLM Provider 抽象层

5.1 多模型支持

六、场景类型实现

6.1 幻灯片场景

6.2 测验场景

6.3 互动模拟场景

6.4 项目式学习（PBL）

七、OpenClaw 集成

7.1 集成架构

7.2 技能配置

八、部署方案

8.1 本地开发

8.2 Docker 部署

8.3 Vercel 部署

九、技术亮点总结

9.1 创新点

9.2 核心优势

十、应用场景与案例

10.1 典型场景

10.2 使用示例

十一、总结

十二、快速参考

更多推荐文章

相关免费在线工具

OpenMAIC 技术深度解析：基于多智能体的沉浸式 AI 课堂

OpenMAIC 技术深度解析：基于多智能体的沉浸式 AI 课堂

一、引言

二、项目概述

2.1 核心理念

2.2 技术栈

三、核心架构设计

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.1 整体架构

3.2 项目结构解析

四、核心技术解析

4.1 两阶段生成 Pipeline

4.2 多智能体编排（LangGraph）

4.3 播放引擎

4.4 动作执行引擎

五、LLM Provider 抽象层

5.1 多模型支持

六、场景类型实现

6.1 幻灯片场景

6.2 测验场景

6.3 互动模拟场景

6.4 项目式学习（PBL）

七、OpenClaw 集成

7.1 集成架构

7.2 技能配置

八、部署方案

8.1 本地开发

8.2 Docker 部署

8.3 Vercel 部署

九、技术亮点总结

9.1 创新点

9.2 核心优势

十、应用场景与案例

10.1 典型场景

10.2 使用示例

十一、总结

十二、快速参考

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具