前端直连模型 vs 完整 MCP：大模型驱动地图原理与实践 | 极客日志

JavaScriptNode.jsAI大前端

前端直连模型 vs 完整 MCP：大模型驱动地图原理与实践

综述由AI生成对比了前端直连模型与完整 MCP 架构在大模型驱动地图场景下的差异。通过 Vue、Cesium、Node.js 和 WebSocket 构建最小化 Demo，解析了从用户指令到地图动作执行的完整链路。核心在于区分“前端直连”与“Host 调度”的角色分工，明确 Host 负责模型与工具交互，Node 暴露标准工具，浏览器仅执行渲染动作。文章提供了时序图、职责拆分及实战代码，帮助开发者理解如何构建可扩展的大模型工具调用系统，避免架构混乱。

随缘发布于 2026/4/6更新于 2026/5/2446 浏览

在这里插入图片描述

1. 这篇教程要解决什么问题

很多人第一次做'大模型驱动地图'的时候，都会有一个非常自然的想法：

我在网页上放一个聊天框，用户输入'飞到上海'，然后把这句话发给模型；模型决定调用工具；前端收到工具调用后，直接控制地图飞过去。

这个想法并不算错，而且它确实能跑。

但问题在于：这不一定是完整的 MCP 架构。

如果你后面想把地图能力做成：

可以被不同宿主统一调用
可以被大模型按工具方式自动发现
可以在前端、桌面、服务端之间分层复用
可以持续扩展成'通用地图执行器'

那你很快就会发现：

'前端直接请求模型并本地执行工具'，和
'真正完整的 MCP 链路'，其实是两套不同的设计思路。

这篇教程，就是要把这两件事讲清楚。

我们会先讲原理，再讲架构，最后用一个 Vue + Cesium + Node + MCP 的最小 demo 把整个链路跑起来。

2. 先别写代码：先搞懂两个很像但本质不同的方案

2.1 方案一：前端直连模型

这是最容易想到、也最容易快速跑通的一种方式。

它的基本流程是：

用户在网页输入'飞到上海'
前端把用户消息和工具定义一起发给模型
模型返回：要调用 flyToShanghai
前端收到 tool_calls
前端本地执行 flyToShanghai
前端控制 Cesium 飞到上海
前端再把工具结果发回模型
模型生成最终回复

它的时序图长这样：

用户 -> 前端页面 -> 大模型 API -> 前端页面（收到 tool_calls） -> 前端本地工具执行 -> Cesium 地图 -> 前端页面 -> 大模型 API -> 前端页面 ->用户

这个方案的优点非常明显：

容易理解
容易开发
页面交互很直接
没有额外的 Host 层

但它也有一个根本特点：

前端同时承担了'聊天客户端'和'工具执行器'两种角色。

这就是后面很多结构混乱的起点。

2.2 方案二：真正完整的 MCP

完整 MCP 不是前端自己决定怎么调用工具，而是由一个 Host 来负责：

用户 -> Host -> 模型 -> Host -> Node MCP Server -> 浏览器 -> Cesium -> 浏览器 -> Node MCP Server -> Host -> 模型 -> Host -> 用户

维度	前端直连模型	完整 MCP
谁和模型对话	前端页面	Host
谁拿到 tool_calls	前端页面	Host
谁真正调工具	前端页面	Host
Node 在哪里	可以没有	是 MCP Server
浏览器扮演什么	聊天端 + 执行端	纯执行端
是否符合完整 MCP 分层	不一定	是

{"method":"flyTo","params":{"longitude":121.4737,"latitude":31.2304,"height":8000}}

┌──────┐ ┌───────────────┐ ┌──────────┐ ┌──────────────┐ ┌──────────┐ ┌────────────┐ ┌─────────┐ │ 用户 │ │ MCP Host │ │ 模型 │ │ Node MCP │ │ WebSocket │ │ 浏览器前端 │ │ Cesium │ │ │ │ │ │ (LLM) │ │ Server │ │ 通道 │ │ + Bridge │ │ Scene │ └─┬────┘ └──────┬────────┘ └────┬─────┘ └──────┬───────┘ └────┬─────┘ └─────┬──────┘ └────┬────┘ │ '飞到上海' │ │ │ │ │ │ │──────────────────>│ │ │ │ │ │ │ │ 把用户消息发给模型 │ │ │ │ │ │ │──────────────────>│ │ │ │ │ │ │ │ 判断需要用工具 │ │ │ │ │ │<──────────────────│ tool_call: │ │ │ │ │ │ │ flyToShanghai │ │ │ │ │ │ 调 Node MCP 工具 │ │ │ │ │ │ │────────────────────────────────────>│ │ │ │ │ │ │ │ sendToBrowser() │ │ │ │ │ │ │─────────────────>│ │ │ │ │ │ │ │ JSON-RPC 消息 │ │ │ │ │ │ │───────────────>│ │ │ │ │ │ │ │ bridge.execute│ │ │ │ │ │ │──────────────>│ │ │ │ │ │ │ 相机飞到上海 │ │ │ │ │<─────────────────│ 执行结果 │ │ │ │<────────────────────────────────────│ tool result │ │ │ │ │ 再把结果发给模型 │ │ │ │ │ │ │──────────────────>│ │ │ │ │ │ │<──────────────────│ 返回自然语言回复 │ │ │ │ │<──────────────────│ │ │ │ │ │

class MiniBridge {
  constructor(viewer) {
    this.viewer = viewer;
  }

  async execute(cmd) {
    const action = cmd?.action;
    const params = cmd?.params || {};
    switch (action) {
      case 'flyTo':
        await this.flyTo(params);
        return { success: true };
      default:
        return { success: false, error: `Unsupported action: ${action}` };
    }
  }

  flyTo(params) {
    const { longitude, latitude, height = 8000 } = params;
    return new Promise((resolve) => {
      this.viewer.camera.flyTo({
        destination: Cesium.Cartesian3.fromDegrees(longitude, latitude, height),
        complete: resolve,
      });
    });
  }
}

server.tool('flyToShanghai', 'Fly camera to Shanghai in connected browser Cesium scene.', {
  height: z.number().default(8000),
  duration: z.number().default(2),
}, async ({ height = 8000, duration = 2 }) => {
  const result = await sendToBrowser('flyTo', {
    longitude: 121.4737,
    latitude: 31.2304,
    height,
    duration,
    heading: 0,
    pitch: -45,
  });
  return {
    content: [
      { type: 'text', text: JSON.stringify(result ?? { success: true }) },
    ],
  };
});

function sendToBrowser(method, params, timeoutMs = 15000) {
  return new Promise((resolve, reject) => {
    const ws = getBrowser(DEFAULT_SESSION);
    if (!ws || ws.readyState !== WebSocket.OPEN) {
      reject(new Error('No browser connected.'));
      return;
    }
    const id = `${Date.now()}_${Math.random().toString(36).slice(2, 8)}`;
    pendingRequests.set(id, { resolve, reject, timer });
    ws.send(JSON.stringify({ jsonrpc: '2.0', id, method, params }));
  });
}

const tools = await client.listTools();
const first = await callChatCompletions(messages, openAITools);
const toolCalls = first?.choices?.[0]?.message?.tool_calls || [];
for (const tc of toolCalls) {
  const result = await client.callTool({
    name: tc.function.name,
    arguments: JSON.parse(tc.function.arguments || '{}'),
  });
  secondMessages.push({
    role: 'tool',
    tool_call_id: tc.id,
    content: toolResultToText(result),
  });
}
const second = await callChatCompletions(secondMessages, openAITools);

页面输入 -> Host Web API -> 模型 -> Host Web API -> Node MCP Server -> 浏览器执行地图动作 -> Node MCP Server -> Host Web API -> 模型 -> 页面

页面 -> 模型 -> 页面收到 tool_calls -> 页面本地执行工具 -> 页面再请求模型

页面 -> Host Web API -> 模型 -> Host Web API -> MCP Server -> 浏览器地图执行 -> Host Web API -> 模型 -> 页面

用户 -> Host -> 模型 -> Host -> Node MCP Server -> 浏览器 -> Cesium

const transport = new StdioClientTransport({ command: getNpxCommand(), args: ['tsx', 'index.ts'], });

await client.connect(transport);
const toolsRes = await client.listTools();
toolsCache = toolsRes.tools || [];
openAITools = toolsCache.map(mcpToolToOpenAITool);

messages + tools -> model -> tool_calls

终端输入 -> Host -> 模型 -> Host -> MCP Server -> 浏览器 -> Cesium

页面输入 -> host-web.ts -> 模型 -> host-web.ts -> MCP Server -> 浏览器 -> Cesium

页面自己又当聊天端，又当工具执行端

Host 负责调度，Node 负责工具，浏览器负责执行

前端直连模型 vs 完整 MCP：大模型驱动地图原理与实践

1. 这篇教程要解决什么问题

2. 先别写代码：先搞懂两个很像但本质不同的方案

2.1 方案一：前端直连模型

2.2 方案二：真正完整的 MCP

2.3 它们最核心的区别

3. 为什么很多人一开始会把两套方案混在一起

4. 先建立整体认知：完整 MCP 里有哪些角色

4.1 用户

4.2 Host

4.3 MCP Server

4.4 浏览器 + Cesium

5. 完整 MCP 的时序图：一句'飞到上海'是怎么穿过整个系统的

5.1 模型并没有直接连 Node

5.2 浏览器并不参与'思考'

6. 为什么这个架构更适合地图场景

7. 本教程的 demo 架构

前端页面（Vue + Cesium）

MiniBridge

Node index.ts

Host

8. 实战之前，先看一遍项目职责拆分

第 1 层：执行层

第 2 层：工具层

第 3 层：智能调度层

9. 实战搭建：从零把链路跑通

9.1 第一步：浏览器只负责执行地图动作

9.2 第二步：Node 负责 MCP Server + WebSocket 桥接

9.2.1 注册 MCP 工具

9.2.2 通过 WebSocket 把动作发给浏览器

9.3 第三步：Host 负责'模型 ↔ 工具'循环

9.4 第四步：把'终端输入'升级成'页面输入'

10. 两种页面聊天方案对比：哪种是'真 MCP'

10.1 方式 A：页面直接请求模型

10.2 方式 B：页面请求 Host Web API

一句话判断标准

11. 一次完整调用的分层理解

11.1 语义层

11.2 工具层

11.3 执行层

11.4 把读者最容易追问的几个问题串起来理解

问题一：'大模型和 Node 这条链路到底怎么连起来的？'

问题二：'host-web.ts 里没有把工具传给 StdioClientTransport，那工具是怎么来的？'

问题三：'后面看起来不是和前端直连一样吗？不也还是把 tools 发给模型吗？'

前端直连模型

完整 MCP

问题四：'既然终端里输入能飞到上海，为什么还要做页面输入？'

问题五：'我到底该怎么判断自己现在是不是在走完整 MCP？'

问题六：'为什么我一开始总觉得两套方案混在一起？'

12. 新手最容易踩的坑

12.1 把'tool calling'误以为就是 MCP

12.2 让浏览器既当聊天端又当执行端

12.3 误以为模型直接调用 Node

12.4 忘了浏览器必须先连上 WebSocket

12.5 同时起了两个 Server，导致端口冲突

13. 你可以如何扩展这套地图能力

13.1 通用飞行类

13.2 地图绘制类

13.3 图层控制类

13.4 场景查询类

13.5 复杂业务类

14. 学完这篇教程后，你应该真正记住什么

前端直连模型

完整 MCP

结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

Node `index.ts`

问题二：'`host-web.ts` 里没有把工具传给 `StdioClientTransport`，那工具是怎么来的？'