前端直连大模型：技术栈与实战 | 极客日志

JavaScriptNode.jsAI大前端

前端直连大模型：技术栈与实战

综述由AI生成介绍前端调用大模型的四种核心方式：直接 API 调用、SDK 封装、代理服务器模式及 WebSocket 实时通信。通过构建智能代码助手项目，展示了服务层实现、缓存机制、请求队列处理及流式响应解析等关键技术点。内容涵盖安全策略、限流处理及完整的项目结构搭建，为前端开发者集成 AI 能力提供实战参考。

无尘发布于 2026/4/5更新于 2026/5/2231 浏览

引言：前端开发者的 AI 新纪元

随着 ChatGPT 等大模型的爆发式增长，AI 能力正以前所未有的速度渗透到 Web 应用的每个角落。作为前端开发者，我们不再只是数据展示的参与者，而是可以直接与 AI 对话、构建智能应用的核心角色。本文将带你深入探索前端调用大模型的完整技术栈，从基础原理到高级实践。

一、前端调用大模型的四种核心方式

1. 直接 API 调用 - 最直接的交互方式

// 使用 Fetch API 直接调用 OpenAI
const callOpenAI = async (prompt) => {
  const response = await fetch('https://api.openai.com/v1/chat/completions', {
    method: 'POST',
    headers: {
      'Content-Type': 'application/json',
      'Authorization': `Bearer ${process.env.OPENAI_API_KEY}`
    },
    body: JSON.stringify({
      model: 'gpt-3.5-turbo',
      messages: [{ role: 'user', content: prompt }],
      temperature: 0.7
    })
  });
  return await response.json();
};

2. SDK 封装 - 更优雅的开发体验

// 使用 OpenAI 官方 SDK
import OpenAI from 'openai';

const openai = new OpenAI({
  apiKey: process.env.,
  :  
});

  =  () => {
   completion =  openai...({
    : ,
    : [
      { : , :  },
      { : , :  }
    ],
    :  
  });

  
    ( chunk  completion) {
    .(chunk.[]?.?. || );
  }
};

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online

// 前端调用本地代理
const callAIViaProxy = async (message) => {
  const response = await fetch('/api/ai-proxy', {
    method: 'POST',
    headers: { 'Content-Type': 'application/json' },
    body: JSON.stringify({ message })
  });
  return response.json();
};

// Node.js 代理服务器示例
// server.js
app.post('/api/ai-proxy', async (req, res) => {
  const { message } = req.body;
  // 在这里安全地调用大模型 API
  const aiResponse = await callOpenAI(message);
  // 可以添加日志、限流、缓存等逻辑
  logAIRequest(req.user.id, message);
  res.json(aiResponse);
});

// 前端 WebSocket 连接
class AIChatSocket {
  constructor(url) {
    this.socket = new WebSocket(url);
    this.init();
  }

  init() {
    this.socket.onmessage = (event) => {
      const data = JSON.parse(event.data);
      this.onMessage(data);
    };
    this.socket.onopen = () => {
      console.log('AI 连接已建立');
    };
  }

  sendMessage(message) {
    this.socket.send(JSON.stringify({ type: 'chat', content: message }));
  }

  onMessage(data) {
    // 处理 AI 响应
    if (data.type === 'stream') {
      console.log('收到流式数据:', data.content);
    }
  }
}

// src/services/aiService.js
class AIService {
  constructor() {
    this.baseURL = process.env.REACT_APP_AI_PROXY_URL;
    this.cache = new Map();
    this.requestQueue = [];
    this.isProcessing = false;
  }

  // 带缓存的 AI 请求
  async requestWithCache(prompt, options = {}) {
    const cacheKey = this.generateCacheKey(prompt, options);
    // 检查缓存
    if (this.cache.has(cacheKey) && !options.forceRefresh) {
      return this.cache.get(cacheKey);
    }
    // 限流处理
    if (this.requestQueue.length >= 5) {
      throw new Error('请求过于频繁，请稍后再试');
    }
    return new Promise((resolve, reject) => {
      this.requestQueue.push({ prompt, options, resolve, reject });
      this.processQueue();
    });
  }

  // 处理请求队列
  async processQueue() {
    if (this.isProcessing || this.requestQueue.length === 0) return;
    this.isProcessing = true;
    const request = this.requestQueue.shift();
    try {
      const response = await this.makeAIRequest(request.prompt, request.options);
      this.cache.set(
        this.generateCacheKey(request.prompt, request.options),
        response
      );
      request.resolve(response);
    } catch (error) {
      request.reject(error);
    } finally {
      this.isProcessing = false;
      this.processQueue();
    }
  }

  // 实际 AI 请求
  async makeAIRequest(prompt, options) {
    const response = await fetch(`${this.baseURL}/completions`, {
      method: 'POST',
      headers: {
        'Content-Type': 'application/json',
        'X-Request-ID': this.generateRequestId()
      },
      body: JSON.stringify({
        prompt,
        model: options.model || 'gpt-3.5-turbo',
        max_tokens: options.maxTokens || 1000,
        temperature: options.temperature || 0.7
      })
    });
    if (!response.ok) {
      throw new Error(`AI 请求失败：${response.status}`);
    }
    return response.json();
  }

  // 流式响应处理
  async *streamCompletion(prompt) {
    const response = await fetch(`${this.baseURL}/completions/stream`, {
      method: 'POST',
      headers: { 'Content-Type': 'application/json' },
      body: JSON.stringify({ prompt })
    });
    const reader = response.body.getReader();
    const decoder = new TextDecoder();
    while (true) {
      const { done, value } = await reader.read();
      if (done) break;
      const chunk = decoder.decode(value);
      const lines = chunk.split('\n').filter(line => line.trim() !== '');
      for (const line of lines) {
        if (line.startsWith('data:')) {
          yield JSON.parse(line.substring(5));
        }
      }
    }
  }
}

前端直连大模型：技术栈与实战

引言：前端开发者的 AI 新纪元

一、前端调用大模型的四种核心方式

1. 直接 API 调用 - 最直接的交互方式

2. SDK 封装 - 更优雅的开发体验

更多推荐文章

相关免费在线工具

3. 代理服务器模式 - 最安全的企业级方案

4. WebSocket 实时通信 - 最适合聊天场景

二、完整实战：构建智能代码助手应用

项目结构

核心 AI 服务层实现

更多推荐文章

相关免费在线工具

前端直连大模型：技术栈与实战

引言：前端开发者的 AI 新纪元

一、前端调用大模型的四种核心方式

1. 直接 API 调用 - 最直接的交互方式

2. SDK 封装 - 更优雅的开发体验

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 代理服务器模式 - 最安全的企业级方案

4. WebSocket 实时通信 - 最适合聊天场景

二、完整实战：构建智能代码助手应用

项目结构

核心 AI 服务层实现

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具