什么是流式输出,后端怎么生成,前端怎么渲染

什么是流式输出,后端怎么生成,前端怎么渲染

流式输出(Streaming Output) 就像是在看视频直播,内容是一边产生一边传输给你的,而不是像下载电影那样,必须等整个文件下完才能开始看。

在 AI 领域(比如 ChatGPT),流式输出表现为文字一个接一个地“蹦”出来,而不是转半天圈圈后突然甩出一大段话。


什么是流式输出,有什么特点

1. 它是怎么实现的?

流式输出的核心技术通常是 SSE (Server-Sent Events,服务器发送事件)

在传统的 HTTP 请求中,模式是“一问一答”:客户端发请求,服务器处理完全部逻辑,打成一个大包发回客户端。而在流式输出中,过程如下:

  1. 建立持久连接:客户端发送一个请求,并在 HTTP 头部声明 Accept: text/event-stream
  2. 分块传输:服务器每生成一个字(或一个 Token),就立即将其封装成一个小数据块发送出去。
  3. 保持连接:直到内容生成完毕,服务器才会发送一个特殊的结束标志(如 [DONE]),随后关闭连接。

2. 流式输出的特点

特点说明
低首字节延迟 (TTFB)用户能瞬间看到反馈,大大缓解了等待焦虑。
实时性适合长文本生成。如果是普通模式,生成 1000 字可能需要 20 秒,流式模式下第 1 秒就开始显示。
单向通讯不同于 WebSocket 的双向奔跑,SSE 主要是服务器向客户端“单向投喂”数据。
资源占用因为要长时间维持一个 HTTP 连接,对服务器的并发处理能力有一定要求。

3. 为什么 AI 必须用它?

大语言模型(LLM)的推理过程是自回归的。简单来说,它每生成一个词,都要基于前面所有的词重新算一遍概率。

P(wt+1∣w1,w2,...,wt)P(w_{t+1} | w_1, w_2, ..., w_t)P(wt+1​∣w1​,w2​,...,wt​)

这个过程本身就很耗时。如果等 2000 个 Token 全部算完再给用户,用户可能以为网页卡死了。流式输出完美契合了模型“一个一个词往外蹦”的运行逻辑。

后端怎么实现

在后端实现流式输出,本质上是打破“处理完全部逻辑再返回”的传统模式,改为利用 HTTP 分块传输(Chunked Transfer Encoding) 持续向客户端推送数据。

最常见的方法是使用 SSE (Server-Sent Events)。下面我以 Python (FastAPI) 和 Node.js (Express) 为例展示核心逻辑。


1. Python 实现 (以 FastAPI 为例)

FastAPI 内置了 StreamingResponse,非常适合配合大模型的生成器(Generator)使用。


2. Node.js 实现 (以 Express 为例)

在 Node.js 中,通过手动设置 HTTP 响应头并使用 res.write() 来持续发送数据。


3. 实现的关键要素

要确保后端流式输出成功,必须满足以下几个条件:

  • 正确的 Content-Type: 必须设置为 text/event-stream
  • 禁用缓冲 (Buffering):
    • 如果你使用了 Nginx 等反向代理,它可能会默认缓存后端的数据,攒够一波再发给前端。
    • 解决方法: 在 Nginx 配置中设置 proxy_buffering off;,或者让后端返回 X-Accel-Buffering: no 响应头。
  • 特定的数据格式:
    • 每条消息必须以 data: 开头。
    • 每条消息必须以两个换行符 \n\n 结尾。

4. 进阶:如何对接大模型 (LLM)

如果你是在调用 OpenAI 或 Anthropic 的 API,它们通常提供 stream=True 参数。你的后端实际上充当了一个中转站(Proxy)

  1. 后端调用 AI API(开启流式)。
  2. 后端迭代接收 AI 返回的每一个 Chunk。
  3. 后端立刻将这个 Chunk 转发给前端。

前端怎么实现

在前端捕获流式数据,主要有两种主流方案:传统的 EventSource 和现代的 fetch + ReadableStream

由于现在的 AI 接口(如 OpenAI)大多使用 POST 请求,方案二 (fetch) 是目前最通用的做法。


方案一:使用 fetch 结合 ReadableStream (推荐)

fetch API 本身支持流式读取。通过 response.body,你可以获取一个读取器(Reader),逐块解析数据。


方案二:使用 EventSource (仅限 GET)

如果你的后端接口支持 GET 请求,EventSource 是最简单的原生实现,它会自动处理重连和心跳。


核心难点:如何优雅地“渲染”?

在处理 AI 流式输出时,你可能会遇到以下两个坑:

  1. Markdown 渲染:数据是一点点出来的,如果你每出一个字就渲染一次 Markdown,性能会炸掉。
    • 对策:使用带缓存的渲染库(如 markdown-it),并限制渲染频率(如 100ms 刷新一次)。
  2. 数据截断:有时候一个 Unicode 字符或者一个 JSON 字符串会被拆分到两个不同的 Data Chunk 中。
    • 对策:在前端维护一个缓冲区(Buffer),将接收到的 value 累加,直到匹配到完整的 \n\n 再进行解析。

Read more

【深度解析 Anthropic Claude-Code 2.1.88 源码结构:从 Source Map 揭秘 AI 编程助手内部实现】

前言 近日,一个开源项目在 GitHub 上引起了广泛关注。这个名为 claude-code-sourcemap 的项目通过技术手段还原了 Anthropic 官方 Claude-Code 工具 2.1.88 版本的源代码。作为技术研究者和 AI 编程工具的爱好者,我深入分析了这个项目,为大家带来详细的源码结构解析。 项目概况 项目名称:claude-code-sourcemap GitHub 地址:https://github.com/xy200303/claude-code-sourcemap 版本:2.1.88(基于 @anthropic-ai/claude-code npm 包) 文件数量:4756 个文件(包含 1884 个 .ts/.tsx 源文件) 还原方式:

文心一言是什么?这款百度推出的AI助手都有什么功能?

文心一言是什么?这款百度推出的AI助手都有什么功能?

文章首发于:AI产品库AIProductHub ;作者:陌路遥 1 文心一言是什么? 文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,于2023年3月16日正式发布,同年8月31日向全社会全面开放。作为文心大模型家族的新成员,它能够与人对话互动、回答问题、协助创作,高效便捷地帮助人们获取信息、知识和灵感。 文心一言的技术基础源于百度在人工智能领域20多年的深耕。它从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强三大技术优势。在人工智能"芯片-框架-模型-应用"四层结构中,百度是全球为数不多进行全栈布局的公司,而文心一言正处于模型层这一核心位置。 截至2024年11月,文心一言用户规模已达到4.3亿,文心大模型日均调用量超过15亿次,较2023年增长超30倍。这一数据充分证明了其在市场上的广泛接受度和影响力。 2 文心一言的主要功能和特点 2.1 核心功能概述 文心一言具备五大核心能力:文学创作、商业文案创作、数理逻辑推算、中文理解、

停止把项目扔在GitHub吃灰:为你的AIGC工作流,找一个技术买家和变现平台

停止把项目扔在GitHub吃灰:为你的AIGC工作流,找一个技术买家和变现平台

如果你的LangChain脚本、精调模型或提示词工程库,始终无法跨越从“个人项目”到“商业产品”的鸿沟,那么你错失的不只是收入,更是技术价值的定义权。 作为一名开发者,你是否也陷入了这个典型的技术-商业断层? 在GitHub上:你拥有一个获得几百Star的AIGC项目。它设计精良,README详细,解决了某个垂直领域(如自动化代码审查、智能运维日志分析)的真实痛点。Issue区零星有人问:“这个怎么用?能商业合作吗?” 在现实中:每次沟通都像是从零开始。你需要解释环境配置、API密钥、参数调优,甚至为不同客户定制输入输出格式。这些工程支持消耗的时间,远超项目开发本身。最终,你的技术价值被稀释成“劳务费”,而那个精巧的技术架构,始终未能成为可以独立销售的数字资产。 核心问题浮出水面:开发者的AIGC解决方案被困在 “可运行的项目” 与 “可交易的产品” 之间。缺少的,是一套能将你的技术能力标准化、封装化、并自动化交付的 “技术资产化基础设施”。 聚量库的工程化解法:为你的代码构建“商业接口” 我们旨在成为AIGC开发者的

搭配GitHub Copilot 提升VS code使用技巧 - 新手向

一、 终端 (CMD / PowerShell) 常用命令速查表 在黑框框(终端)里最常用的命令,掌握这几个就够用了: 1. 走路(目录导航) * 进入文件夹:cd 文件夹名 例如:cd MyFLProject * 返回上一级:cd .. 记忆技巧:. 代表当前,.. 代表上一级(爸爸级)。 * 切换盘符(Windows 特有):D: 或 C: 注意: 如果你在 C 盘,想去 D 盘,光敲 cd D:\xxx 是没用的,必须先输入 D: 回车,切过去再说。 * 自动补全(神器):Tab 键