国产大模型领域跳槽:收入潜力解析
2024 年,国产大模型市场看似喧闹已止,进入稳定竞争期。作为一种新的 IT 解决方案,国产大模型一出生便伴随着激烈竞争。外有 GPT-4 等国际模型的挑战,内有多家公司角逐'中国版 ChatGPT'。
据行业观察,就国内某家头部大模型创业公司的收入而言,几千万的合同订单已有落地。组队窗口期已进入后期,难度越来越大,而竞争格局未定,研发仍在持续投入。虽说优秀人才越多越好,但客观规律是 IT 人才结构呈金字塔形,顶部人才是极少数。
本文将借用游戏段位概念,划分大模型技术段位:王者、白金、黄金、青铜,并解析不同段位的跳槽境况与收入潜力。
一、王者段位:领军人物归位
王者们,那些科技大厂背景的领军人和硬核科研背景的 AI 科学家,已经陆续'众神归位'。例如字节跳动的杨红霞(原阿里达摩院)、百川智能的陈炜鹏(原搜狗旧部)、昆仑万维的颜水成(原 360)等。另有一些大神独立门户,如爱诗科技、HiDream.ai、衔远科技等。
无论大厂还是创业公司,挖人核心靠钱。这一层级的人才已基本完成流动,更多关注的是战略匹配度而非单纯薪资。
二、白金段位:不设上限
当猎头询问'薪酬带宽'时,多家大模型创业公司负责人做出类似表态:'收入不设上限,就怕你们找不来人。'
通用大模型存在许多未知的技术秘密,关键技术路线更依靠金字塔上一层决策。路线创新会有风险,但又不能一味跟随。这种'不设上线'的表态,侧面反映了这类人才的重要性,尤其是已有大模型高水平实战经验且能'实线带人'的管理者。
1. 核心需求方
市场上大致有四批雇主在抢'白金'人才:
- 互联网科技公司:拥有充足资金和技术积累。
- 大模型创业公司:急需快速落地产品,对核心骨干依赖度高。
- 有创新能力的甲方公司:传统行业头部企业(如能源、金融)正在'炼'行业大模型,偏爱有领先创业公司经验的员工。
- 老牌 IT 服务厂商:不想落后于技术潮流。
前两者尤其抢得厉害,后两者似乎胜算较小。有些创业公司的核心竞争力正是'王者'和'白金'两个段位共同产生的合力。一些'王者'本身就是知名学者,悉心培养高徒;'白金'段位的人才之间往往也是师兄弟关系。
2. 隐藏高手:AI Infra 与数据团队
在白金段位中,还有一批隐藏高手,他们是 AI Infra 的资深技术和架构师。这些人在互联网大厂的起点年薪就很高,部分优秀人才年薪甚至可达 150-200 万。市场上牛人 AI Infra 的年薪,可达 300-400 万或者更高。
另一方面,量化头部企业也出其不意杀了进来,尤其像幻方和九坤这类技术驱动的量化投资公司,对此类人才钟爱有加。一位量化公司技术高管表示:'我心仪的候选人不是被大模型创业公司挖走,就是被大厂大模型团队挖走,如果大模型遇冷,AI Infra 同学们的薪酬溢价就没这么高了。'
同样重要又易被忽略的是数据团队负责人。大模型数据组的功能大致分为采集、清洗和配比。其中配比的技术含量较高,虽不属于算法技能,但极为考验洞察力和经验。
3. 职业建议
对于白金段位人才,若有机会在通用大模型团队中负责无监督预训练,则转做行业垂直大模型的意愿会较低。原因在于通用大模型的实战经验难得,在通用大模型团队对个人价值提升更大。行业大模型团队中行业专家多,大模型专家少,缺少相互探讨精进技术的氛围。
抢'白金'最激烈的竞争,发生在互联网头部和大模型创业公司之间。白金段位的人才在这个阶段很难被垂直行业头部企业吸引,因为稀缺性导致议价权极高。
三、黄金段位:极致性价比
这一段位可被称为在研发管理层领导下的开发主力。分两种情况:
1. 有过大模型训练经验
非常幸运,有过大模型训练经验,跳槽的红利期来了。第一批跳槽高峰早在三个月前就已经结束。那些经历过的人说,谁不是脱一层皮呢?刷 LeetCode,投简历,接触猎头,一二三面,谈薪酬,打印收入流水,到岗,很费一番功夫。
创业公司招聘周期短,决策快;互联网大厂的速度次之;而有些企业招聘程序冗长。面试了一堆公司,包括但不限于智谱华章、百川智能、澜舟科技、面壁智能、月之暗面、智源研究院、深言科技、爱诗科技、生数科技、衔远科技;阿里、蚂蚁、百度、字节跳动、AWS、贝壳、网易伏羲、小红书。
为什么说有实战经验的人幸运?大模型创业公司的需求急,竞争窗口期小。没时间培养,先录用'已有大模型经验',俗称'来了就能干活'。
2. 原地转型
有的公司研发人才储备扎实,鼓励员工原地转型。一方面公司用人成本不会增加,另一方面,技术人员也乐于跟上技术潮流。另外,数据采集和清洗属于黄金段位的工作内容。
3. 薪酬涨幅分析
拿到 30% 涨幅者居多。也有互联网头部企业的资深算法去往大模型创业公司头部的一名同学,100% 涨幅,只此一位。我的结论是:对比下来,大模型黄金段位涨幅并不出众。


