最近深入研究了大模型相关的内容,决定从互联网的推荐算法岗位转行做大模型推理工程化相关的工作。在此分享我在这一职业决策中的思考过程,以及针对技术转型的完整学习路径。
1. 推荐算法岗的现状分析
我原本在大厂担任推荐算法工程师,收入处于行业中游水平。虽然看似稳定,但互联网行业的岗位性质与公务员或事业单位不同,不存在'铁饭碗'。工作的持续性完全取决于市场对岗位的需求。
当前推荐算法领域面临的主要挑战是流量增长见顶,需求显著萎靡。
前两年推荐算法之所以火爆,是因为 4G 普及后移动端 APP(如抖音、快手、小红书等)用户量激增,创作内容需要通过算法分发给目标用户。然而近年来,这些头部 APP 的用户增长已基本触顶。即便算法优化再极致,最大一波用户红利已经结束。当存量用户每天的使用时长仅能增加 1-2 分钟时,市场对于推荐算法的实际增量需求已大幅减少。
从招聘市场反馈来看,目前仍在大规模招聘推荐算法的公司寥寥无几,主要集中在字节和小红书。其他公司普遍缩招,薪资涨幅停滞,跳槽往往只能平薪甚至降薪。整个行业似乎都在卡住 30% 的常规跳槽涨幅上限。
对于抖音生活服务、小红书电商等新业务,虽然有一定增长空间,但整体体量较小,且并不完全依赖顶尖算法能力。而对于短视频等成熟业务,算法优化已进入深水区,边际收益递减明显,往往需要极端技巧才能获得不到千分之五的业务指标提升。从管理层角度看,继续增加算法工程师投入带来的 ROI 正在降低。
因此,传统推荐算法在流量见顶的大环境下,岗位需求变得萎靡不振。
2. 大模型创造的新需求
今年年初,ChatGPT 的横空出世展示了人工智能的巨大潜力。它类似于 2016 年的 AlphaGo,为创业者和投资者指明了方向。尽管目前的生成式 AI 应用场景仍在探索中,但其底层技术的进步预计将在未来几年颠覆多个行业。
从英伟达等硬件厂商的股价表现来看,资本对这一新兴增长点抱有极高预期。大量资本的注入意味着人才需求的爆发。对于从业者而言,市场需求暴增而供给跟不上时,往往是议价能力最高的时期。
根据近期猎头反馈,已有许多大模型公司在疯狂招人,部分原做推荐算法的猎头也开始转向大模型领域。这直接反映了市场供需关系的变化。技术再牛逼,如果没有市场落地场景也是无用的。但在当前阶段,大模型的应用场景正在快速拓展,从客服问答到代码生成,再到企业私有化部署,需求端非常旺盛。
互联网行业的发展逻辑通常是快速扩张、抢占市场。除非是利润微薄的细分角落,否则'快'字当头。趁着年轻,在行业窗口期完成转型,是应对 35 岁职场门槛的有效策略。
3. 大模型技术学习路径
作为一名希望深耕 AI 领域的工程师,以下是基于行业现状整理的系统化学习路径,涵盖从基础理论到工程落地的关键环节。
3.1 基础架构与原理
理解 Transformer 架构是大模型的基础。重点掌握以下概念:
- Self-Attention 机制:理解并行计算与上下文关联。
- Positional Encoding:位置编码的作用与实现。
- Pre-training & Fine-tuning:预训练与微调的区别及流程。
# 示例:使用 Hugging Face Transformers 加载模型
from transformers import AutoModelForCausalLM, AutoTokenizer
model_name = "meta-llama/Llama-2-7b"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)
inputs = tokenizer("Hello, world!", return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=50)
print(tokenizer.decode(outputs[0]))
3.2 提示词工程 (Prompt Engineering)
通过设计高质量的 Prompt 来激发模型潜能,无需修改模型参数即可提升效果。


