ChatGPT 的出现在全球掀起了 AI 大模型的浪潮,2023 年被称为 AI 元年。AI 大模型以迅猛的态势融入日常生活,从问答对话到辅助编程,从图画解析到自主创作,其展现的能力超出了多数人的预料。AI 大模型已成为互联网从业者必备技能。
一、大模型岗位需求
大模型时代,企业对人才的需求发生了显著变化。AIGC 相关岗位人才难求,薪资持续走高。根据行业数据,AI 运营薪资平均值约 18457 元,AI 工程师薪资平均值约 37336 元,大模型算法薪资平均值约 39607 元。
掌握大模型技术能带来更多可能性:
- 成为全栈大模型工程师,涵盖 Prompt 工程、LangChain 开发、LoRA 微调等技术方向;
- 拥有模型二次训练和微调能力,主导智能对话、文生图等热门应用落地;
- 薪资上浮 10%-20%,覆盖更多高薪岗位,这是高需求、高待遇的热门领域;
- 积累优质项目经验,为未来创新创业提供基石。
二、主流大模型分类
大模型是指具有庞大参数规模和复杂程度的机器学习模型。在深度学习领域,通常指具有数百万到数十亿参数的神经网络模型。这些模型在自然语言处理、图像识别、语音识别等领域表现出高度准确和广泛的泛化能力。大模型按照功能可分为 NLP 大模型、CV 大模型、科学计算大模型和多模态大模型。
1. NLP(自然语言处理)大模型
LLM 是 NLP 大模型的一种,主要用于处理自然语言文本数据,具备强大的语言理解和生成能力,帮助人类完成问答、创作、文本摘要等工作。例如 OpenAI 的 GPT 系列模型。
2. CV(计算机视觉)大模型
主要用于处理图像和视频数据,具备强大的图像识别和视频分析能力,如人脸识别、物体检测等。具体应用场景包括智能驾驶、安防监控等。例如腾讯的 PCAM 大模型。
3. 科学计算大模型
主要用于解决科学领域的计算问题,如生物信息学、材料科学、气候模拟等,需要处理大规模数值数据。例如华为的盘古气象模型。
4. 多模态大模型
可以同时处理多种类型的模态数据,如文本、图像、语音等,实现跨模态搜索、跨模态生成等任务。已有渗透应用包括搜索引擎、办公工具、金融电商等。例如谷歌的 Vision Transformer 模型。
三、2024 大模型学习路线图
大模型学习路线图整体分为 7 个阶段,旨在系统性地构建从理论到实战的能力体系。
第一阶段:大模型系统设计 从大模型系统设计入手,讲解大模型的主要方法。理解 Transformer 架构、注意力机制、预训练与微调的基本原理,建立对大模型底层逻辑的认知。
第二阶段:提示词工程(Prompt Engineering) 通过大模型提示词工程从 Prompts 角度入手,更好发挥模型的作用。学习零样本(Zero-shot)、少样本(Few-shot)提示技巧,掌握结构化提示词设计,优化模型输出质量。
第三阶段:大模型平台应用开发 借助阿里云 PAI 等平台构建电商领域虚拟试衣系统。熟悉云原生部署流程,掌握模型推理服务化(Serving)的关键技术,实现业务场景的快速集成。
第四阶段:大模型知识库应用开发 以 LangChain 框架为例,构建物流行业咨询智能问答系统。深入理解检索增强生成(RAG)技术,掌握向量数据库的使用,解决大模型幻觉问题,提升回答准确性。
第五阶段:大模型微调开发 借助大健康、新零售、新媒体领域构建适合当前领域的大模型。学习全量微调、LoRA、P-Tuning 等高效微调技术,进行数据准备、数据蒸馏及垂直领域适配。
第六阶段:多模态大模型实战 以 SD(Stable Diffusion)多模态大模型为主,搭建文生图小程序案例。掌握扩散模型原理,学习控制网(ControlNet)等高级应用,实现创意内容的自动化生成。
第七阶段:行业应用综合构建 以大模型平台应用与开发为主,通过星火大模型、文心大模型等成熟大模型构建大模型行业应用。整合前述技术,完成端到端的解决方案交付。
四、量身定制学习方案
不同基础人群有不同的模型适配方案,匹配相关岗位,清晰明了。根据不同基础主要分了三类人群:
- 0 基础人群:从 Python 基础语法开始,逐步过渡到大模型概念,适合转行或初学者。
- Java、前端、大数据、C++、PHP 等人员:利用现有编程基础,重点补充 AI 知识体系,快速转型大模型开发。
- 数据科学家、人工智能研究人员、AI 开发人员等:深化大模型前沿技术,关注 SFT、RLHF 等进阶内容。


