AI 对话页流式处理架构：Web Streams 与 Fetch API 实践

引言

在构建 AI 智能体应用时，为了降低模型搭建复杂度，通常会将数据流转与 UI 实现统一封装。但若要深入理解底层机制，采用'生产者 - 消费者模式'的流式处理架构是更优解。这种架构将网络 IO、数据解码、文本解析与 UI 渲染解耦，从而实现实时流式响应和 UI 增量渲染。

本文基于 Vue 3 + TypeScript + Vite 技术栈，结合 Ant Design Vue 及 Ant Design X Vue 组件库，探讨如何利用 Web Streams API 与 Fetch API 实现这一流程。

从请求发送到 UI 渲染的整体链路如下：

![流式响应整体链路示意图]

流式响应处理

请求管理

我们需要同时控制上游的网络请求和下游的字节流读取，以实现会话的可取消与可停止。

AbortController：作为上游网络中止句柄。在发起新提问前中止旧请求，或用户点击取消时立即终止当前请求。
ReadableStreamDefaultReader：作为下游传输层字节流的读取器句柄。它驱动上游生产者向管道入队字节块，并在用户取消时终止读取。

// 流控制相关句柄
let abortController: AbortController | null = null;
let currentReader: ReadableStreamDefaultReader<Uint8Array> | null = null;

流处理管道

建立一条 Web Streams 解析管线：生产者 → 解码 → 按行拆分 → 消费者。整体处理流程包含以下三个核心环节。

生产者流

负责将上游 reader 获取的 chunk 字节块按背压节奏入队，供下游消费，实现'读 - 推送'循环。同时需将外部触发的取消信号传播到上游，终止读取链路。当状态指示停止或上游耗尽时，关闭控制器并复位响应状态，确保资源释放。

参考文档：ReadableStream

const producerStream = new ReadableStream<Uint8Array>({
  start(controller) {
    function pump() {
      if (!isResponding.value) {
        controller.close();
        return;
      }
      currentReader?.read().then( {
         (done) {
          isResponding. = ;
          controller.();
          ;
        }
        controller.(value); 
        ();
      });
    }
    ();
  },
});

AI 对话页流式处理架构：Web Streams 与 Fetch API 实践

引言

流式响应处理

请求管理

流处理管道

生产者流

更多推荐文章

相关免费在线工具

转换流

SSE 解析流

API 通信层

发送请求

中止请求

基础 UI 交互组件封装

消息展示

消息发送

更多推荐文章

相关免费在线工具

AI 对话页流式处理架构：Web Streams 与 Fetch API 实践

引言

流式响应处理

请求管理

流处理管道

生产者流

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

转换流

SSE 解析流

API 通信层

发送请求

中止请求

基础 UI 交互组件封装

消息展示

消息发送

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具