Spring Boot 基于 WebClient 实现 SSE 流式接口实战 | 极客日志

JavaAIjava

Spring Boot 基于 WebClient 实现 SSE 流式接口实战

综述由AI生成记录了在 Spring Boot 项目中将同步接口改造为 SSE 流式接口的过程。针对 AI 问答服务响应慢的问题，发现 Feign 不支持流式消费，改用 WebClient 配合 SseEmitter 实现服务端推送。解决了 WebClient 调用内部服务时的 UnknownHostException 问题（通过引入 LoadBalancer）。最终实现了边生成边返回的流式交互，提升了用户体验。

开源信徒发布于 2026/4/5更新于 2026/5/2432 浏览

一、背景：为什么我要做 SSE？

在最近的一个项目中，我负责接入一个 AI 问答服务。
一开始的接口形态非常常规：

@PostMapping("/health_manager") public RespBean<HealthManagerQueryDataVO> sendQuery(...)

客户端发请求，服务端等 AI 全部生成完内容，再一次性返回。

问题很快就暴露了：

AI 返回慢（10 秒甚至更久）
用户页面'卡死'，体验极差
其实 AI 是'边生成边返回'的，但我们完全浪费了这个能力

于是，目标就很明确了：

把原有同步接口，改造成支持 SSE（Server-Sent Events）的流式接口

二、什么是 SSE？为什么适合 AI 问答？

1️⃣ SSE 是什么？

SSE（Server-Sent Events）是一种 服务器主动推送 的 HTTP 通信方式：

基于 HTTP
单向（服务端 → 客户端）
长连接
文本流（text/event-stream）

返回的数据长这样：

data: 你好 data: 我是 data: AI

客户端可以一边接收，一边渲染。

2️⃣ 为什么 SSE 特别适合 AI 场景？

技术	适配度
HTTP 普通接口	❌ 等全部生成
WebSocket	❌ 太重
SSE	✅ 天生流式

AI 的输出特征是：

token 级 / 句子级生成
可边生成边消费
用户随时可能中断

👉 SSE 几乎是最优解

三、第一个坑：Feign 不支持 SSE

项目里原本调用 AI 服务用的是 Feign：

@FeignClient("mb-ai") RespBean sendQuery(...)

一开始我尝试'硬改'，但很快发现：

Feign 本质是一次性 HTTP 调用，它不支持流式消费响应体

哪怕 AI 服务是 SSE，Feign 也会：

等完整响应

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online

@PostMapping( value = "/health_manager/stream", produces = MediaType.TEXT_EVENT_STREAM_VALUE ) public SseEmitter healthManagerStream( @RequestBody HealthManagerQueryDTO request) { SseEmitter emitter = new SseEmitter(0L); // 不超时 aiService.streamQuery(request, emitter); return emitter; }

webClient.post()
    .uri("/health_manager")
    .contentType(MediaType.APPLICATION_JSON)
    .accept(MediaType.TEXT_EVENT_STREAM)
    .bodyValue(request)
    .retrieve()
    .bodyToFlux(String.class)
    .subscribe(
        data -> emitter.send(data),
        error -> emitter.completeWithError(error),
        emitter::complete
    );

java.net.UnknownHostException: mb-ai

.baseUrl("http://mb-ai")

<!-- Maven dependency -->
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-loadbalancer</artifactId>
</dependency>

@Configuration
public class WebClientConfig {
    @Bean
    @LoadBalanced
    public WebClient.Builder webClientBuilder() {
        return WebClient.builder();
    }
}

.baseUrl("http://mb-ai")

WebClient → LoadBalancer → Nacos → 真实 IP:PORT

<!-- WebClient / SSE -->
<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-webflux</artifactId>
</dependency>
<!-- 服务发现 -->
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-loadbalancer</artifactId>
</dependency>
<!-- Nacos（项目里一般已有） -->
spring-cloud-starter-alibaba-nacos-discovery

Feign └── 普通同步接口（兼容老系统）
WebClient └── SSE 流式接口（AI 问答）

POST /health_manager       // 非流式
POST /health_manager/stream // SSE

Spring Boot 基于 WebClient 实现 SSE 流式接口实战

一、背景：为什么我要做 SSE？

二、什么是 SSE？为什么适合 AI 问答？

1️⃣ SSE 是什么？

2️⃣ 为什么 SSE 特别适合 AI 场景？

三、第一个坑：Feign 不支持 SSE

更多推荐文章

相关免费在线工具

四、正确姿势：WebClient + SseEmitter

1️⃣ Controller 层：返回 SseEmitter

2️⃣ Service 层：WebClient 真正消费 AI 流

五、第二个大坑：UnknownHostException: mb-ai

原因分析

六、正确解法：WebClient 接入服务发现

1️⃣ 引入 LoadBalancer

2️⃣ 给 WebClient.Builder 加 @LoadBalanced

3️⃣ baseUrl 继续用服务名

七、最终依赖组合（最小可用）

八、架构上的最终形态（我现在的做法）

九、一些实战踩坑总结

❌ Feign 强行做 SSE

❌ WebClient 不加 LoadBalanced

❌ 忘了 produces

❌ AI 实际没返回 text/event-stream

十、写在最后

更多推荐文章

相关免费在线工具

Spring Boot 基于 WebClient 实现 SSE 流式接口实战

一、背景：为什么我要做 SSE？

二、什么是 SSE？为什么适合 AI 问答？

1️⃣ SSE 是什么？

2️⃣ 为什么 SSE 特别适合 AI 场景？

三、第一个坑：Feign 不支持 SSE

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

四、正确姿势：WebClient + SseEmitter

1️⃣ Controller 层：返回 SseEmitter

2️⃣ Service 层：WebClient 真正消费 AI 流

五、第二个大坑：UnknownHostException: mb-ai

原因分析

六、正确解法：WebClient 接入服务发现

1️⃣ 引入 LoadBalancer

2️⃣ 给 WebClient.Builder 加 @LoadBalanced

3️⃣ baseUrl 继续用服务名

七、最终依赖组合（最小可用）

八、架构上的最终形态（我现在的做法）

九、一些实战踩坑总结

❌ Feign 强行做 SSE

❌ WebClient 不加 LoadBalanced

❌ 忘了 produces

❌ AI 实际没返回 text/event-stream

十、写在最后

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具