AI 大模型与互联网行业变革:人才需求及薪酬分析
文章探讨了 AI 大模型作为工业革命级别机遇的行业背景,分析了通用模型与垂类模型的分化趋势,对比了开源与闭源模型的优劣势。详细介绍了 GPT-4、Claude 3.5、Llama 3 等代表性模型的技术特性与多模态能力。同时深入剖析了当前 AI 领域的人才市场供需状况,提供了国内外大模型相关岗位的薪资数据,并总结了从业人员所需的核心技能栈及未来端侧 AI 的发展趋势。

文章探讨了 AI 大模型作为工业革命级别机遇的行业背景,分析了通用模型与垂类模型的分化趋势,对比了开源与闭源模型的优劣势。详细介绍了 GPT-4、Claude 3.5、Llama 3 等代表性模型的技术特性与多模态能力。同时深入剖析了当前 AI 领域的人才市场供需状况,提供了国内外大模型相关岗位的薪资数据,并总结了从业人员所需的核心技能栈及未来端侧 AI 的发展趋势。

在腾讯股东大会上,CEO 马化腾深刻指出,人工智能(AI)并非仅仅是互联网领域十年一遇的机遇,而是一个具有深远影响的、堪比电力发明的工业革命级别的重大机遇。
随着 AI 领域的竞争日益激烈,模型的发展方向开始呈现分化趋势,从追求通用性转向专注于特定领域的专业化。
据目前统计,中国已有超过 40 家企业推出了自己的大型 AI 模型,例如百度的'文心一言'、阿里巴巴的'通义千问'、科大讯飞的'星火'等,以及即将推出的腾讯'混元'、京东'ChatJD'和华为'盘古'等。这些模型主要分为两大类:
AI 大模型的应用路径日益明晰,一般遵循从'基础大模型'到'行业大模型',最终实现'终端应用'的流程。行业大模型则是在基础大模型的基础上,进一步整合行业数据、知识和专家经验,以提高模型的表现力和可控性。目前在金融、能源、制造、传媒等多个领域,一些领先企业和科研机构已经开始联合开发行业大模型。
在开源模型与闭源模型的竞争中,开源模型以其低成本、快速迭代和技术可私有化部署的优势,对闭源模型构成了挑战。例如,Meta 的开源模型 Llama 系列在全球范围内受到开发者和爱好者的欢迎,而国内的百度、腾讯、阿里等企业则在持续迭代自己的闭源模型。随着高性能开源大模型的出现,一些垂直行业应用公司开始转向使用开源模型结合矢量数据库的解决方案,以应对特定应用场景的需求。
开源大模型有效解决了闭源大模型在应用中的一些痛点。例如,使用开源模型可以避免从头训练模型所需的高昂成本,同时,开源社区如 HuggingFace 提供的预训练模型可以让用户快速进行微调和部署。此外,开源模型的快速迭代和私有化部署能力,也帮助企业保护了敏感数据的安全性。
在 AI 投资领域,'AI+'与'+AI'的争论一直存在。
'大模型',即大型语言模型(LLM),以其庞大的参数量、深层神经网络结构和高维特征空间而著称。这类模型通常拥有数以百亿计甚至上千亿的参数,其训练和部署所需的资源极为庞大,主要表现在以下几个方面:
与此相对,'小模型'则更为轻量级,具有较少的参数和较低的计算资源需求。它们结构简单,易于部署和进行实时运算,更适合资源受限的环境和应用场景。尽管在特定任务上可能不如大模型表现出色,但小模型的高效和便捷性使其在实际应用中同样重要。
近期,小模型的发布呈现出井喷之势:
特别值得一提的是,GPT-4o Mini 以其经济实惠著称,其成本比 OpenAI 之前最轻量级的 GPT-3.5 Turbo 还要低 60% 以上。GPT-4o Mini 不仅价格低廉,性能同样出色,在 MMLU 测试中得分高达 82%,在 LMSYS 排行榜上甚至超过了 GPT-4。此外,GPT-4o Mini 在数学和编码任务、多模态推理任务方面也超越了 GPT-3.5 Turbo 和其他小型模型,显示出其在性价比和性能上的双重优势。
在 2023 年初,闭源大模型主要以纯文本的语言模型(LLM)为主。然而,随着时间推移,闭源模型在多模态能力上取得了显著进步,目前能够理解图像并生成图像内容。相比之下,尽管开源模型在文本处理能力上有了显著提升,但大多数开源模型尚未实现多模态功能。
国内主流大模型在 2023 年底以来的更新中开始追赶 GPT-4。例如:
GPT-4 是 OpenAI 开发的最新语言模型,它在生成类似人类语言的文本方面表现出色,是 GPT-3.5 的一次重大升级。OpenAI 指出,GPT-4 在以下三个关键领域实现了显著进步:
尽管 GPT-4 在多个方面取得了进步,但它仍然存在一些局限性,如社会偏见、幻觉以及对抗性提示等问题。这些问题可能导致模型提供错误的答案或不准确的信息。网上有许多例子展示了 GPT-4 的这些局限性,表明尽管 AI 技术不断进步,但仍需持续优化和改进以提高模型的准确性和可靠性。
由 Anthropic 公司于 2024 年 6 月 20 日发布的 Claude 3.5 Sonnet 是其 LLM 大语言模型系列中的先遣版本。根据 Anthropic 公布的测评结果,Claude 3.5 Sonnet 在多个标准测试中表现卓越,甚至超越了业界公认的强模型 GPT-4o。
以下是 Claude 3.5 Sonnet 的一些关键特性:
Claude 3.5 Sonnet 的这些特性使其在多模态任务中具有强大的应用潜力,特别是在需要视觉和文本信息整合的场景中。
Llama 3 是 Meta 创建的一个开源 LLM,用于生成式 AI,包括聊天机器人,能够以自然语言响应各种查询。以下是 Llama 3 的一些关键特性和架构:
Llama 3 的开源特性和灵活性使其在 AI 社区中具有广泛的应用前景,特别是在需要定制化解决方案的场景中。
在 2024 年上半年,人工智能和软件工程领域的人才市场呈现出高度紧缺的状态,特别是在大模型算法、ChatGPT 研究、云计算和数字前端工程等岗位上。这种供需不平衡导致了激烈的人才争夺战,其中人才供需比低于 0.5,意味着平均有两个岗位在竞争一个合适的候选人。
在薪资方面,人工智能领域的薪资水平一直保持着较高的增长趋势。根据相关报告,2022 年人工智能新发岗位的平均月薪为 43817 元,而到了 2023 年前 8 个月,这一数字上涨至 46518 元,增长率达到 6.16%。
对于在国家实验室或国家重点实验室等第一梯队核心实验室工作的博士生,年薪甚至可以达到 120 万至 150 万元,这在业界被认为是一个常见的薪酬水平。
根据薪酬网站 Levels.fyi 的信息,OpenAI 的软件工程师年薪总额为 92.5 万美元。这其中包括 30 万美元的基本工资和 62.5 万美元的股权,后者会分 4 年发放。如果员工能够正常完成服务期,总共可以获得高达 250 万美元的薪酬。
产品经理岗位的薪酬同样处于高位,反映了市场对既懂技术又懂业务人才的渴求。
要在这个领域获得发展,技术人员通常需要掌握以下核心技能栈:
未来的发展趋势显示,端侧大模型(Edge AI)将成为新的增长点,这意味着对模型压缩、量化以及边缘计算优化的需求将大幅增加。同时,多模态能力的普及将推动视频、音频与文本融合应用的爆发。对于从业者而言,保持持续学习的能力,紧跟技术迭代节奏,将是应对行业变革的关键。
AI 大模型正在重塑互联网行业的格局,从技术底层到应用层都发生了深刻变化。虽然通用大模型竞争激烈,但垂直领域的深耕机会依然巨大。对于人才而言,这不仅意味着高薪的诱惑,更代表着职业赛道的转换。无论是选择投身于基础模型的研究,还是专注于行业应用的落地,都需要扎实的技术功底和对业务场景的深刻理解。随着技术的成熟,AI 将从概念走向规模化生产,成为数字经济的核心驱动力。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online