Spring Cloud+AI ：实现分布式智能推荐系统

Spring Cloud+AI ：实现分布式智能推荐系统 | 极客日志

┌─────────────────────────────────────────────────────────────────────┐ │ API Gateway (Spring Cloud Gateway) │ │ 认证 | 限流 | 路由 | 熔断 │ └─────────────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────────────┐ │ Recommendation Service (推荐服务) │ │ ┌─────────────────────────────────────────────┐ │ │ │ Controller → Service → Feature Assembler │ │ │ └─────────────────────────────────────────────┘ │ └─────┬───────────────┬───────────────┬───────────────┬───────────────┘ │ │ │ │ ▼ ▼ ▼ ▼ ┌───────────┐ ┌───────────┐ ┌───────────┐ ┌─────────────────────────┐ │ User │ │ Item │ │ Feature │ │ Model Serving │ │ Service │ │ Service │ │ Engine │ │ (Python/PyTorch) │ │ │ │ │ │ │ │ • 协同过滤 │ │ • 用户信息 │ │ • 商品信息 │ │ • 实时行为 │ │ • 矩阵分解 │ │ • 用户画像 │ │ • 商品特征 │ │ • 特征组装 │ │ • NCF/DeepFM │ └─────┬─────┘ └─────┬─────┘ └─────┬─────┘ └─────────┬───────────────┘ │ │ │ │ └───────────────┴───────────────┴────────────────────┘ │ ▼ ┌───────────────────────────┐ │ Nacos (注册中心) │ │ • 服务注册与发现 │ │ • 配置中心 │ │ • 健康检查 │ └───────────────────────────┘ │ ▼ ┌───────────────────────────┐ │ Kafka (消息队列) │ │ • 曝光事件 │ │ • 点击事件 │ │ • 转化事件 │ └───────────────────────────┘ │ ▼ ┌───────────────────────────┐ │ Event Collector Service │ │ • 实时日志收集 │ │ • 在线学习反馈 │ └───────────────────────────┘

# train_ncf_model.pyimport torch import torch.nn as nn import numpy as np from torch.utils.data import Dataset, DataLoader # 定义 NCF 模型classNCFModel(nn.Module):def__init__(self, num_users, num_items, embedding_dim=32):super(NCFModel, self).__init__()# 用户嵌入层 self.user_embedding = nn.Embedding(num_users, embedding_dim)# 物品嵌入层 self.item_embedding = nn.Embedding(num_items, embedding_dim)# MLP 层 self.mlp = nn.Sequential( nn.Linear(embedding_dim *2,128), nn.ReLU(), nn.Dropout(0.2), nn.Linear(128,64), nn.ReLU(), nn.Dropout(0.2), nn.Linear(64,1), nn.Sigmoid())defforward(self, user_ids, item_ids): user_emb = self.user_embedding(user_ids) item_emb = self.item_embedding(item_ids) concat = torch.cat([user_emb, item_emb], dim=-1)return self.mlp(concat)# 自定义数据集classRecommendationDataset(Dataset):def__init__(self, user_ids, item_ids, labels): self.user_ids = torch.LongTensor(user_ids) self.item_ids = torch.LongTensor(item_ids) self.labels = torch.FloatTensor(labels)def__len__(self):returnlen(self.labels)def__getitem__(self, idx):return self.user_ids[idx], self.item_ids[idx], self.labels[idx]# 训练函数deftrain_model(train_data, val_data, num_users, num_items, epochs=10): device = torch.device('cuda'if torch.cuda.is_available()else'cpu') model = NCFModel(num_users, num_items).to(device) criterion = nn.BCELoss() optimizer = torch.optim.Adam(model.parameters(), lr=0.001) train_loader = DataLoader(train_data, batch_size=256, shuffle=True)for epoch inrange(epochs): model.train() total_loss =0for user_ids, item_ids, labels in train_loader: user_ids, item_ids, labels = user_ids.to(device), item_ids.to(device), labels.to(device) optimizer.zero_grad() predictions = model(user_ids, item_ids).squeeze() loss = criterion(predictions, labels) loss.backward() optimizer.step() total_loss += loss.item()print(f'Epoch {epoch+1}/{epochs}, Loss: {total_loss/len(train_loader):.4f}')return model # 导出模型为 ONNX 格式defexport_to_onnx(model, output_path='ncf_model.onnx'): model.eval() dummy_user_ids = torch.LongTensor([0]) dummy_item_ids = torch.LongTensor([0]) torch.onnx.export( model,(dummy_user_ids, dummy_item_ids), output_path, input_names=['user_ids','item_ids'], output_names=['prediction'], dynamic_axes={'user_ids':{0:'batch_size'},'item_ids':{0:'batch_size'},'prediction':{0:'batch_size'}}, opset_version=14)print(f'Model exported to {output_path}')if __name__ =='__main__':# 模拟训练数据 num_users =10000 num_items =50000 num_samples =100000 user_ids = np.random.randint(0, num_users, num_samples) item_ids = np.random.randint(0, num_items, num_samples) labels = np.random.randint(0,2, num_samples).astype(float)# 划分训练集和验证集 split_idx =int(0.8* num_samples) train_data = RecommendationDataset(user_ids[:split_idx], item_ids[:split_idx], labels[:split_idx]) val_data = RecommendationDataset(user_ids[split_idx:], item_ids[split_idx:], labels[split_idx:])# 训练模型 model = train_model(train_data, val_data, num_users, num_items, epochs=5)# 导出为 ONNX 格式 export_to_onnx(model)

# model_server.pyfrom fastapi import FastAPI, HTTPException from pydantic import BaseModel import torch import onnxruntime as ort import numpy as np from typing import List app = FastAPI(title='Recommendation Model API')# 加载 ONNX 模型 session = ort.InferenceSession('ncf_model.onnx')classPredictionRequest(BaseModel): user_ids: List[int] item_ids: List[int]classPredictionResponse(BaseModel): predictions: List[float]@app.post('/api/v1/predict', response_model=PredictionResponse)asyncdefpredict(request: PredictionRequest):try:# 准备输入数据 user_ids = np.array(request.user_ids, dtype=np.int64).reshape(-1,1) item_ids = np.array(request.item_ids, dtype=np.int64).reshape(-1,1)# ONNX 推理 inputs ={'user_ids': user_ids,'item_ids': item_ids } predictions = session.run(None, inputs)[0]return PredictionResponse(predictions=predictions.tolist())except Exception as e:raise HTTPException(status_code=500, detail=str(e))@app.get('/health')asyncdefhealth_check():return{'status':'healthy'}if __name__ =='__main__':import uvicorn uvicorn.run(app, host='0.0.0.0', port=8000)

<!-- pom.xml --><project><groupId>com.example.recommendation</groupId><artifactId>recommendation-system</artifactId><version>1.0.0</version><packaging>pom</packaging><modules><module>user-service</module><module>item-service</module><module>recommendation-service</module><module>feature-engine</module><module>common</module></modules><properties><java.version>17</java.version><spring-boot.version>3.2.0</spring-boot.version><spring-cloud.version>2023.0.0</spring-cloud.version></properties><dependencyManagement><dependencies><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-dependencies</artifactId><version>${spring-boot.version}</version><type>pom</type><scope>import</scope></dependency><dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-dependencies</artifactId><version>${spring-cloud.version}</version><type>pom</type><scope>import</scope></dependency></dependencies></dependencyManagement></project>

// user-service/src/main/java/com/example/user/controller/UserController.javapackagecom.example.user.controller;importcom.example.user.dto.UserProfileDTO;importcom.example.user.service.UserService;importlombok.RequiredArgsConstructor;importorg.springframework.web.bind.annotation.*;@RestController@RequestMapping("/api/users")@RequiredArgsConstructorpublicclassUserController{privatefinalUserService userService;/** * 获取用户画像 */@GetMapping("/{userId}/profile")publicUserProfileDTOgetUserProfile(@PathVariableLong userId){return userService.getUserProfile(userId);}/** * 批量获取用户画像 */@PostMapping("/profiles/batch")publicMap<Long,UserProfileDTO>getUserProfilesBatch(@RequestBodyList<Long> userIds){return userService.getUserProfilesBatch(userIds);}}

// user-service/src/main/java/com/example/user/service/UserService.javapackagecom.example.user.service;importcom.example.user.dto.UserProfileDTO;importcom.example.user.entity.UserProfile;importcom.example.user.repository.UserProfileRepository;importlombok.RequiredArgsConstructor;importorg.springframework.cache.annotation.Cacheable;importorg.springframework.stereotype.Service;importjava.util.List;importjava.util.Map;importjava.util.stream.Collectors;@Service@RequiredArgsConstructorpublicclassUserService{privatefinalUserProfileRepository userProfileRepository;/** * 获取用户画像，使用 Redis 缓存 */@Cacheable(value ="userProfiles", key ="#userId")publicUserProfileDTOgetUserProfile(Long userId){UserProfile profile = userProfileRepository.findById(userId).orElseThrow(()->newRuntimeException("User not found: "+ userId));returnUserProfileDTO.builder().userId(profile.getUserId()).gender(profile.getGender()).age(profile.getAge()).city(profile.getCity()).membershipLevel(profile.getMembershipLevel()).interestTags(profile.getInterestTags()).build();}/** * 批量获取用户画像 */publicMap<Long,UserProfileDTO>getUserProfilesBatch(List<Long> userIds){List<UserProfile> profiles = userProfileRepository.findAllById(userIds);return profiles.stream().collect(Collectors.toMap(UserProfile::getUserId, profile ->UserProfileDTO.builder().userId(profile.getUserId()).gender(profile.getGender()).age(profile.getAge()).city(profile.getCity()).membershipLevel(profile.getMembershipLevel()).interestTags(profile.getInterestTags()).build()));}}

# user-service/src/main/resources/application.ymlserver:port:8081spring:application:name: user-service datasource:url: jdbc:mysql://localhost:3306/user_db username: root password: password data:redis:host: localhost port:6379# Nacos 注册中心配置spring.cloud.nacos:discovery:server-addr: localhost:8848namespace: public config:server-addr: localhost:8848file-extension: yml

// recommendation-service/src/main/java/com/example/recommendation/client/UserClient.javapackagecom.example.recommendation.client;importcom.example.common.dto.UserProfileDTO;importorg.springframework.cloud.openfeign.FeignClient;importorg.springframework.web.bind.annotation.GetMapping;importorg.springframework.web.bind.annotation.PathVariable;importorg.springframework.web.bind.annotation.PostMapping;importorg.springframework.web.bind.annotation.RequestBody;importjava.util.List;importjava.util.Map;@FeignClient(name ="user-service", path ="/api/users", fallbackFactory =UserClientFallback.class)publicinterfaceUserClient{@GetMapping("/{userId}/profile")UserProfileDTOgetUserProfile(@PathVariable("userId")Long userId);@PostMapping("/profiles/batch")Map<Long,UserProfileDTO>getUserProfilesBatch(@RequestBodyList<Long> userIds);}

// recommendation-service/src/main/java/com/example/recommendation/client/ItemClient.javapackagecom.example.recommendation.client;importcom.example.common.dto.ItemDTO;importorg.springframework.cloud.openfeign.FeignClient;importorg.springframework.web.bind.annotation.GetMapping;importorg.springframework.web.bind.annotation.PathVariable;importorg.springframework.web.bind.annotation.PostMapping;importorg.springframework.web.bind.annotation.RequestBody;importjava.util.List;importjava.util.Map;@FeignClient(name ="item-service", path ="/api/items", fallbackFactory =ItemClientFallback.class)publicinterfaceItemClient{@GetMapping("/{itemId}")ItemDTOgetItem(@PathVariable("itemId")Long itemId);@PostMapping("/batch")List<ItemDTO>getItemsBatch(@RequestBodyList<Long> itemIds);@GetMapping("/category/{category}")List<ItemDTO>getItemsByCategory(@PathVariable("category")String category);}

// recommendation-service/src/main/java/com/example/recommendation/client/UserClientFallback.javapackagecom.example.recommendation.client;importcom.example.common.dto.UserProfileDTO;importlombok.extern.slf4j.Slf4j;importorg.springframework.stereotype.Component;importjava.util.Collections;importjava.util.List;importjava.util.Map;@Slf4j@ComponentpublicclassUserClientFallbackimplementsUserClient{@OverridepublicUserProfileDTOgetUserProfile(Long userId){ log.warn("User service fallback triggered for userId: {}", userId);// 返回默认用户画像returnUserProfileDTO.builder().userId(userId).gender("unknown").age(25).city("unknown").membershipLevel("NORMAL").interestTags(Collections.emptyList()).build();}@OverridepublicMap<Long,UserProfileDTO>getUserProfilesBatch(List<Long> userIds){ log.warn("User service batch fallback triggered");returnCollections.emptyMap();}}

// recommendation-service/src/main/java/com/example/recommendation/service/RecommendationService.javapackagecom.example.recommendation.service;importcom.example.common.dto.*;importcom.example.recommendation.client.ItemClient;importcom.example.recommendation.client.UserClient;importcom.example.recommendation.client.ModelClient;importcom.example.recommendation.config.RecommendationProperties;importlombok.RequiredArgsConstructor;importlombok.extern.slf4j.Slf4j;importorg.springframework.data.redis.core.RedisTemplate;importorg.springframework.stereotype.Service;importjava.time.Duration;importjava.util.*;importjava.util.stream.Collectors;@Slf4j@Service@RequiredArgsConstructorpublicclassRecommendationService{privatefinalUserClient userClient;privatefinalItemClient itemClient;privatefinalModelClient modelClient;privatefinalFeatureEngineClient featureEngineClient;privatefinalRedisTemplate<String,Object> redisTemplate;privatefinalKafkaTemplate<String,Object> kafkaTemplate;privatefinalRecommendationProperties properties;/** * 获取个性化推荐 */publicRecommendationResultgetRecommendations(Long userId,String scenario,int size){// 1. 尝试从缓存获取String cacheKey =String.format("recommendation:%d:%s", userId, scenario);List<RecommendedItem> cachedResult =(List<RecommendedItem>) redisTemplate.opsForValue().get(cacheKey);if(cachedResult !=null){ log.info("Cache hit for user: {}, scenario: {}", userId, scenario);returnRecommendationResult.builder().userId(userId).scenario(scenario).items(cachedResult).source("CACHE").build();}// 2. 获取用户画像UserProfileDTO userProfile = userClient.getUserProfile(userId);// 3. 获取候选商品集（从召回池中筛选）List<Long> candidateItemIds =getCandidateItems(userProfile, scenario, size *10);// 4. 批量获取商品信息List<ItemDTO> candidateItems = itemClient.getItemsBatch(candidateItemIds);// 5. 特征工程FeatureVector featureVector =buildFeatureVector(userId, userProfile, candidateItems);// 6. 模型推理评分Map<Long,Double> itemScores = modelClient.predict(userId, candidateItemIds, featureVector);// 7. 排序并返回 Top-KList<RecommendedItem> recommendedItems = candidateItems.stream().filter(item -> itemScores.containsKey(item.getItemId())).sorted((a, b)->Double.compare( itemScores.get(b.getItemId()), itemScores.get(a.getItemId()))).limit(size).map(item ->RecommendedItem.builder().itemId(item.getItemId()).itemName(item.getItemName()).category(item.getCategory()).price(item.getPrice()).score(itemScores.get(item.getItemId())).reason("基于您的兴趣推荐").build()).collect(Collectors.toList());// 8. 缓存结果 redisTemplate.opsForValue().set( cacheKey, recommendedItems,Duration.ofMinutes(properties.getCacheExpireMinutes()));// 9. 异步记录曝光事件recordExposureEvent(userId, scenario, recommendedItems);returnRecommendationResult.builder().userId(userId).scenario(scenario).items(recommendedItems).source("MODEL").build();}/** * 获取候选商品集 */privateList<Long>getCandidateItems(UserProfileDTO userProfile,String scenario,int poolSize){// 实际实现中，这里可以从离线计算的召回池中获取// 这里简化为按用户兴趣标签获取相关商品List<String> interests = userProfile.getInterestTags();if(interests.isEmpty()){ interests =Arrays.asList("热门");}return itemClient.getItemsByCategory(interests.get(0)).stream().limit(poolSize).map(ItemDTO::getItemId).collect(Collectors.toList());}/** * 构建特征向量 */privateFeatureVectorbuildFeatureVector(Long userId,UserProfileDTO userProfile,List<ItemDTO> items){returnFeatureVector.builder().userId(userId).userGender(userProfile.getGender()).userAge(userProfile.getAge()).userCity(userProfile.getCity()).membershipLevel(userProfile.getMembershipLevel()).interestTags(userProfile.getInterestTags()).itemCategories(items.stream().map(ItemDTO::getCategory).distinct().collect(Collectors.toList())).hourOfDay(LocalDateTime.now().getHour()).dayOfWeek(LocalDateTime.now().getDayOfWeek().getValue()).build();}/** * 记录曝光事件（异步） */privatevoidrecordExposureEvent(Long userId,String scenario,List<RecommendedItem> items){List<Long> itemIds = items.stream().map(RecommendedItem::getItemId).collect(Collectors.toList());ExposureEvent event =ExposureEvent.builder().userId(userId).scenario(scenario).itemIds(itemIds).timestamp(System.currentTimeMillis()).build(); kafkaTemplate.send("recommendation-exposure", event); log.debug("Exposure event sent for user: {}", userId);}/** * 记录点击事件 */publicvoidrecordClickEvent(Long userId,Long itemId,String scenario){ClickEvent event =ClickEvent.builder().userId(userId).itemId(itemId).scenario(scenario).timestamp(System.currentTimeMillis()).build(); kafkaTemplate.send("recommendation-click", event); log.info("Click event recorded for user: {}, item: {}", userId, itemId);}}

// recommendation-service/src/main/java/com/example/recommendation/client/ModelClient.javapackagecom.example.recommendation.client;importcom.example.recommendation.dto.ModelPredictRequest;importlombok.RequiredArgsConstructor;importlombok.extern.slf4j.Slf4j;importorg.springframework.beans.factory.annotation.Value;importorg.springframework.stereotype.Component;importorg.springframework.web.reactive.function.client.WebClient;importreactor.core.publisher.Mono;importreactor.util.retry.Retry;importjava.time.Duration;importjava.util.HashMap;importjava.util.List;importjava.util.Map;@Slf4j@Component@RequiredArgsConstructorpublicclassModelClient{privatefinalWebClient.Builder webClientBuilder;@Value("${model.service.url}")privateString modelServiceUrl;@Value("${model.service.timeout}")privateint timeoutMs;/** * 调用模型服务获取预测分数 */publicMap<Long,Double>predict(Long userId,List<Long> itemIds,FeatureVector featureVector){WebClient webClient = webClientBuilder .baseUrl(modelServiceUrl).build();// 构建请求体List<Integer> userIds =Collections.nCopies(itemIds.size(), userId.intValue());ModelPredictRequest request =ModelPredictRequest.builder().userIds(userIds).itemIds(itemIds.stream().map(Long::intValue).collect(Collectors.toList())).featureVector(featureVector).build();// 发起请求并处理响应Map<Long,Double> scores =newHashMap<>();try{ModelPredictResponse response = webClient.post().uri("/api/v1/predict").bodyValue(request).retrieve().bodyToMono(ModelPredictResponse.class).timeout(Duration.ofMillis(timeoutMs)).retryWhen(Retry.backoff(3,Duration.ofMillis(100))).block();if(response !=null&& response.getPredictions()!=null){for(int i =0; i < itemIds.size(); i++){ scores.put(itemIds.get(i), response.getPredictions().get(i));}}}catch(Exception e){ log.error("Model prediction failed for userId: {}, error: {}", userId, e.getMessage());// 返回默认分数 itemIds.forEach(id -> scores.put(id,0.5));}return scores;}}

# recommendation-service/src/main/resources/application.ymlserver:port:8083spring:application:name: recommendation-service cloud:nacos:discovery:server-addr: localhost:8848# Feign 配置openfeign:client:config:default:connectTimeout:2000readTimeout:5000loggerLevel: basic circuitbreaker:enabled:true# Resilience4j 配置circuitbreaker:configs:default:slidingWindowSize:10minimumNumberOfCalls:5failureRateThreshold:50waitDurationInOpenState: 10s permittedNumberOfCallsInHalfOpenState:3kafka:bootstrap-servers: localhost:9092producer:key-serializer: org.apache.kafka.common.serialization.StringSerializer value-serializer: org.springframework.kafka.support.serializer.JsonSerializer # 模型服务配置model:service:url: http://localhost:8000timeout:3000# 推荐配置recommendation:cache:expire-minutes:30candidate:pool-size:500# 监控配置management:endpoints:web:exposure:include: health,metrics,prometheus metrics:export:prometheus:enabled:true

// recommendation-service/src/main/java/com/example/recommendation/config/ResilienceConfig.javapackagecom.example.recommendation.config;importio.github.resilience4j.circuitbreaker.CircuitBreakerConfig;importio.github.resilience4j.circuitbreaker.CircuitBreakerRegistry;importio.github.resilience4j.timelimiter.TimeLimiterConfig;importorg.springframework.context.annotation.Bean;importorg.springframework.context.annotation.Configuration;importjava.time.Duration;@ConfigurationpublicclassResilienceConfig{@BeanpublicCircuitBreakerRegistrycircuitBreakerRegistry(){CircuitBreakerConfig config =CircuitBreakerConfig.custom().slidingWindowSize(10).minimumNumberOfCalls(5).failureRateThreshold(50).waitDurationInOpenState(Duration.ofSeconds(10)).permittedNumberOfCallsInHalfOpenState(3).slowCallDurationThreshold(Duration.ofSeconds(3)).slowCallRateThreshold(50).build();returnCircuitBreakerRegistry.of(config);}@BeanpublicTimeLimiterConfigtimeLimiterConfig(){returnTimeLimiterConfig.custom().timeoutDuration(Duration.ofSeconds(5)).build();}}

// recommendation-service/src/main/java/com/example/recommendation/fallback/RecommendationFallback.javapackagecom.example.recommendation.fallback;importcom.example.common.dto.RecommendationResult;importcom.example.common.dto.RecommendedItem;importlombok.extern.slf4j.Slf4j;importorg.springframework.stereotype.Component;importjava.util.Arrays;importjava.util.Collections;importjava.util.List;@Slf4j@ComponentpublicclassRecommendationFallback{/** * 模型服务降级：返回热门商品推荐 */publicRecommendationResultgetHotItemsFallback(Long userId,String scenario){ log.warn("Model service degraded, using hot items fallback for user: {}", userId);// 这里可以从缓存或数据库中获取热门商品List<RecommendedItem> hotItems =getHotItems(scenario);returnRecommendationResult.builder().userId(userId).scenario(scenario).items(hotItems).source("FALLBACK_HOT_ITEMS").build();}/** * 获取热门商品（实际实现中应从缓存或数据库获取） */privateList<RecommendedItem>getHotItems(String scenario){// 简化实现，返回固定的热门商品returnArrays.asList(RecommendedItem.builder().itemId(1001L).itemName("热门商品1").category("电子").price(299.0).score(0.95).reason("热门推荐").build(),RecommendedItem.builder().itemId(1002L).itemName("热门商品2").category("服装").price(199.0).score(0.92).reason("热门推荐").build());}}

// recommendation-service/src/main/java/com/example/recommendation/producer/EventProducer.javapackagecom.example.recommendation.producer;importcom.example.common.dto.ExposureEvent;importcom.example.common.dto.ClickEvent;importlombok.RequiredArgsConstructor;importlombok.extern.slf4j.Slf4j;importorg.springframework.kafka.core.KafkaTemplate;importorg.springframework.kafka.support.SendResult;importorg.springframework.stereotype.Component;importorg.springframework.util.concurrent.ListenableFutureCallback;@Slf4j@Component@RequiredArgsConstructorpublicclassEventProducer{privatefinalKafkaTemplate<String,Object> kafkaTemplate;/** * 发送曝光事件 */publicvoidsendExposureEvent(ExposureEvent event){ kafkaTemplate.send("recommendation-exposure", event).addCallback(newListenableFutureCallback<SendResult<String,Object>>(){@OverridepublicvoidonSuccess(SendResult<String,Object> result){ log.debug("Exposure event sent successfully: {}", event);}@OverridepublicvoidonFailure(Throwable ex){ log.error("Failed to send exposure event: {}", event, ex);}});}/** * 发送点击事件 */publicvoidsendClickEvent(ClickEvent event){ kafkaTemplate.send("recommendation-click", event).addCallback(newListenableFutureCallback<SendResult<String,Object>>(){@OverridepublicvoidonSuccess(SendResult<String,Object> result){ log.info("Click event sent successfully: {}", event);}@OverridepublicvoidonFailure(Throwable ex){ log.error("Failed to send click event: {}", event, ex);}});}}

# recommendation-service/Dockerfile FROM eclipse-temurin:17-jre-alpine WORKDIR /app # 复制 JAR 文件 COPY target/recommendation-service-*.jar app.jar # 设置 JVM 参数 ENV JAVA_OPTS="-Xms512m -Xmx1g -XX:+UseG1GC -XX:MaxGCPauseMillis=200" EXPOSE 8083 ENTRYPOINT ["sh", "-c", "java $JAVA_OPTS -jar app.jar"]

# docker-compose.ymlversion:'3.8'services:# Nacos 注册中心nacos:image: nacos/nacos-server:v2.2.3 ports:-"8848:8848"environment:MODE: standalone # MySQLmysql:image: mysql:8.0ports:-"3306:3306"environment:MYSQL_ROOT_PASSWORD: password MYSQL_DATABASE: recommendation_db volumes:- mysql-data:/var/lib/mysql # Redisredis:image: redis:7-alpine ports:-"6379:6379"volumes:- redis-data:/data # Kafkakafka:image: confluentinc/cp-kafka:7.5.0 ports:-"9092:9092"environment:KAFKA_ZOOKEEPER_CONNECT: zookeeper:2181KAFKA_ADVERTISED_LISTENERS: PLAINTEXT://localhost:9092KAFKA_OFFSETS_TOPIC_REPLICATION_FACTOR:1depends_on:- zookeeper zookeeper:image: confluentinc/cp-zookeeper:7.5.0 ports:-"2181:2181"environment:ZOOKEEPER_CLIENT_PORT:2181# 用户服务user-service:build: ./user-service ports:-"8081:8081"environment:SPRING_CLOUD_NACOS_DISCOVERY_SERVER_ADDR: nacos:8848SPRING_DATASOURCE_URL: jdbc:mysql://mysql:3306/user_db SPRING_DATA_REDIS_HOST: redis depends_on:- nacos - mysql - redis # 商品服务item-service:build: ./item-service ports:-"8082:8082"environment:SPRING_CLOUD_NACOS_DISCOVERY_SERVER_ADDR: nacos:8848SPRING_DATASOURCE_URL: jdbc:mysql://mysql:3306/item_db depends_on:- nacos - mysql # 推荐服务recommendation-service:build: ./recommendation-service ports:-"8083:8083"environment:SPRING_CLOUD_NACOS_DISCOVERY_SERVER_ADDR: nacos:8848SPRING_KAFKA_BOOTSTRAP_SERVERS: kafka:9092MODEL_SERVICE_URL: http://model-service:8000depends_on:- nacos - kafka - user-service - item-service # 模型服务（Python）model-service:build: ./model-service ports:-"8000:8000"environment:- MODEL_PATH=/app/models/ncf_model.onnx volumes:- ./models:/app/models volumes:mysql-data:redis-data:

# k8s/recommendation-service-deployment.yamlapiVersion: apps/v1 kind: Deployment metadata:name: recommendation-service labels:app: recommendation-service spec:replicas:3selector:matchLabels:app: recommendation-service template:metadata:labels:app: recommendation-service spec:containers:-name: recommendation-service image: your-registry/recommendation-service:1.0.0 ports:-containerPort:8083env:-name: SPRING_PROFILES_ACTIVE value:"prod"-name: SPRING_CLOUD_NACOS_DISCOVERY_SERVER_ADDR value:"nacos-service:8848"-name: SPRING_KAFKA_BOOTSTRAP_SERVERS value:"kafka-service:9092"-name: MODEL_SERVICE_URL value:"http://model-service:8000"-name: JAVA_OPTS value:"-Xms1g -Xmx2g -XX:+UseG1GC -XX:MaxGCPauseMillis=200"resources:requests:memory:"1Gi"cpu:"500m"limits:memory:"2Gi"cpu:"2000m"livenessProbe:httpGet:path: /actuator/health port:8083initialDelaySeconds:60periodSeconds:10readinessProbe:httpGet:path: /actuator/health port:8083initialDelaySeconds:30periodSeconds:5---apiVersion: v1 kind: Service metadata:name: recommendation-service spec:selector:app: recommendation-service ports:-protocol: TCP port:8083targetPort:8083type: ClusterIP ---apiVersion: autoscaling/v2 kind: HorizontalPodAutoscaler metadata:name: recommendation-service-hpa spec:scaleTargetRef:apiVersion: apps/v1 kind: Deployment name: recommendation-service minReplicas:3maxReplicas:10metrics:-type: Resource resource:name: cpu target:type: Utilization averageUtilization:70-type: Resource resource:name: memory target:type: Utilization averageUtilization:80

# model-service/Dockerfile FROM nvidia/cuda:11.8.0-runtime-ubuntu22.04 RUN apt-get update && apt-get install -y \ python3.10 \ python3-pip \ && rm -rf /var/lib/apt/lists/* WORKDIR /app COPY requirements.txt . RUN pip3 install --no-cache-dir -r requirements.txt COPY model_server.py . COPY models/ ./models/ EXPOSE 8000 CMD ["python3", "model_server.py"]

resources:limits:nvidia.com/gpu:1

// CacheConfiguration.java@Configuration@EnableCachingpublicclassCacheConfiguration{@BeanpublicRedisCacheManagerredisCacheManager(RedisConnectionFactory factory){RedisCacheConfiguration config =RedisCacheConfiguration.defaultCacheConfig().entryTtl(Duration.ofMinutes(30)).serializeKeysWith(RedisSerializationContext.SerializationPair.fromSerializer(newStringRedisSerializer())).serializeValuesWith(RedisSerializationContext.SerializationPair.fromSerializer(newGenericJackson2JsonRedisSerializer()));returnRedisCacheManager.builder(factory).cacheDefaults(config).withInitialCacheConfigurations(getCacheConfigurations()).build();}privateMap<String,RedisCacheConfiguration>getCacheConfigurations(){Map<String,RedisCacheConfiguration> configMap =newHashMap<>();// 用户画像缓存 - 1小时 configMap.put("userProfiles",RedisCacheConfiguration.defaultCacheConfig().entryTtl(Duration.ofHours(1)));// 推荐结果缓存 - 30分钟 configMap.put("recommendations",RedisCacheConfiguration.defaultCacheConfig().entryTtl(Duration.ofMinutes(30)));// 热门商品缓存 - 10分钟 configMap.put("hotItems",RedisCacheConfiguration.defaultCacheConfig().entryTtl(Duration.ofMinutes(10)));return configMap;}}

# 推荐服务的推荐 JVM 参数JAVA_OPTS=" -Xms2g -Xmx4g -XX:+UseG1GC -XX:MaxGCPauseMillis=200 -XX:G1ReservePercent=20 -XX:InitiatingHeapOccupancyPercent=35 -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/logs/heapdump.hprof -XX:+PrintGCDetails -XX:+PrintGCDateStamps -Xloggc:/logs/gc.log -Duser.timezone=Asia/Shanghai -Dfile.encoding=UTF-8 "

-- 用户画像表索引优化CREATEINDEX idx_user_id ON user_profile(user_id);CREATEINDEX idx_membership ON user_profile(membership_level);CREATEINDEX idx_city ON user_profile(city);-- 商品表索引优化CREATEINDEX idx_item_category ON item(category);CREATEINDEX idx_item_brand ON item(brand);CREATEINDEX idx_item_created ON item(created_at);

并发数	QPS	平均响应时间	P95 响应时间	P99 响应时间	错误率
100	850	115ms	180ms	250ms	0%
500	3200	155ms	280ms	420ms	0%
1000	4800	205ms	450ms	680ms	0.1%
2000	5200	380ms	850ms	1200ms	2%

并发数	QPS	平均响应时间	P95 响应时间	P99 响应时间	错误率
100	1500	65ms	95ms	130ms	0%
500	5800	85ms	150ms	220ms	0%
1000	9500	105ms	200ms	320ms	0%
2000	12000	165ms	350ms	520ms	0.05%

Spring Cloud+AI ：实现分布式智能推荐系统

引言

整体架构设计

更多推荐文章

相关免费在线工具

AI 模型选型与训练

核心微服务实现

项目结构与依赖

User Service 实现

Recommendation Service 实现

熔断与降级配置

异步日志收集

部署与性能优化

Docker 容器化

Kubernetes 编排

性能优化策略

压测结果

总结与展望

更多推荐文章

相关免费在线工具

Spring Cloud+AI ：实现分布式智能推荐系统

引言

整体架构设计

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

AI 模型选型与训练

核心微服务实现

项目结构与依赖

User Service 实现

Recommendation Service 实现

熔断与降级配置

异步日志收集

部署与性能优化

Docker 容器化

Kubernetes 编排

性能优化策略

压测结果

总结与展望

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具