LLM4Rec 在业界的应用范式梳理

综述由AI生成梳理了 LLM 在推荐系统领域的三种应用范式：LLM-to-Rec、Rec-to-LLM 及 Towards RecLM。重点分析了利用 LLM 进行特征增强、语义 Embedding 获取、微调策略以及多模态融合的具体方法。涵盖了从冻结 LLM 到生成式训练等多种技术路径，并探讨了工业界落地的训练推理策略，旨在为 LLM4Rec 提供体系化的技术参考。

RustyLab发布于 2025/2/6更新于 2026/6/216 浏览

LLM4Rec 在业界的应用范式梳理

随着近年来 LLM 的各种突破性进展，工业界也在不断尝试将 LLM 与推荐系统结合起来，以期吃到 LLM 带来的技术红利。最近一年各大互联网公司相继提出了各种落地 LLM4Rec 的方案。本文希望能从更加全面且细致的维度梳理这些技术方案，以期对 LLM4Rec 形成更加体系性的认识。

最近一年业界 LLM4Rec 的工作整体可以划分成 3 类范式：

LLM-to-Rec: 以推荐系统为主导，主要使用 LLM 的能力做特征增强/样本增强等，以提升推荐系统的整体效果。这种方式成本相对可控，是工业界尝试最多也是相对比较容易拿到收益的方式。

Rec-to-LLM: 以 LLM 为主导，将推荐系统的用户行为用自然语言形式描述，以期 LLM 能捕获用户兴趣。这种方式主要应用在对 LLM 特别擅长领域有特别要求的业务场景，比如对会话能力有要求的对话式推荐系统，以及对推理能力有要求的可解释性推荐场景等。

Towards RecLM: 这里的目标是探索推荐系统的 Scale Law，以期能通过拓展模型参数量、数据量、算力或其它要素显著提升推荐效果。这种方法可能非常吃算力/成本，其中最引起广泛讨论的就是 Meta 提出的 GRs 了。

本文整体的思维导图如下图所示，基本上覆盖了最近一年 LLM4Rec 的重点工作：

LLM4Rec 思维导图

1. LLM-to-Rec 范式

随着 ChatGPT 的爆火，各大公司&机构纷纷加入了 LLM 军事竞赛之中，LLM 的综合能力也是屡破新高。预训练的 LLM 现在已经具备非常丰富的世界知识，这是传统以 ID 为主并以协同信息为监督信号的推荐算法所欠缺的。相对而言，将预训练 LLM 应用于推荐场景是一种成本比较可控的方式。但在将 LLM 应用于推荐系统的过程中，根据不同的业务场景特点及成本因素考虑，工业界在使用 LLM 的方法上有着很大的区别。

LLM-to-Rec 细分结构

1.1 利用 LLM 的哪些信息？

LLM 拥有非常优秀的综合能力，并且积累了很多可被推荐借鉴的一些实践经验，在 LLM-to-Rec 的范式下，首先要回答的第 1 个问题是，在实际应用中，LLM 有哪些实践经验或者有用信息可以被推荐借鉴或使用的呢。

1.1.1 借鉴 LLM 的有效经验

LLM 领域的发展沉淀了很多不错的实践，比如 LLM 的架构的有效性已被大量验证，检索增强是提升 LLM 表现的一大利器，好的 Prompt 对 LLM 的效果提升至关重要等。

1) 借鉴 LLM 架构 (快手 KuaiFormer 方法)

快手这里的 KuaiFormer 直接以 Llama Transformer 架构作为 Backbone，并结合快手的业务场景进行训练上的适配和优化，除了用了架构，基本上和 LLM 本身没有太大关系了，其整体框架如下图所示：

KuaiFormer 框架

这里只简单做些介绍，主要的思想包括：

扩展至更长的序列长度 (从 64->256): 作者将用户历史行为序列，按交互时间顺序分成了早中晚 3 部分（早 642 组、中 165 组、晚 164 组），对早中部分分别做了聚合处理。
扩展至多兴趣: 作者这里使用了多个特殊的 token 作为用户的各兴趣 query token，将这个 token 对应位置的输出作为用户的多兴趣表示。