提示工程师兴起:ChatGPT 驱动的新职业路径与行业趋势
引言:从玩到职业的转变
随着 ChatGPT 等生成式人工智能技术的爆发,一种名为'提示工程师'(Prompt Engineer)的新兴职业应运而生。Riley Goodside(业内常称好面哥)是这一领域的代表性人物。他在今年 4 月开始在网上分享使用 GPT-3 的心得,不仅积累了大量粉丝,还成功获得了硅谷独角兽公司 Scale AI 的正式聘请。
Scale AI 创始人兼 CEO 宣布设立'提示工程师'这一岗位,并称之为业内首次开设。这位 CEO 认为,AI 大模型可以被视为一种新型计算机,因此需要一种新型程序员去对其进行编程。虽然被称为程序员,但这份工作的核心并非传统意义上的编写代码,而是通过自然语言指令让 AI 生成所需的逻辑和代码。
关于薪酬,虽然双方未透露具体数字,但参考该公司平均年薪约为 13.7 万美元(约合人民币 95 万元),这比去年美国机器学习工程师的整体平均年薪高出约 22%。此外,a16z 支持的创业社区 Launch House 也发布了招聘信息,底薪高达 30 万美元,显示出市场对这一技能的高度渴求。
什么是提示工程?
提示(Prompt)的定义
提示(Prompt)最早是对预训练模型做微调的一种新兴方法,被称为'NLP 的第四范式'。这种方法能以极小的代价让 AI 完成新的、在训练过程中未学过的任务。传统的微调方法需要更新模型的参数,对于像 GPT-3 这样拥有 1750 亿参数的超大模型,成本极高且效率低下。
提示学习的新方法完全不需要改动模型参数,只需将新任务写成提示模版给 AI 描述一下,再提供几个示例(Few-Shot Learning)即可。这种方法不仅节省成本,还能让训练好的 AI 大模型快速适应越来越多的新任务。
提示工程的实践
提示工程(Prompt Engineering)的核心在于找出合适的提示词,让 AI 发挥出最大潜力。例如,在 AI 绘画领域,早期用户发现只要在提示词中加入'虚幻引擎'字样,画质就会瞬间提升,这被视为最早的提示工程实践之一。
在纯语言模型中,技巧同样适用。研究表明,在提示词中加入'让我们一步一步地思考'(Chain-of-Thought),AI 做题的正确率可以从 17% 暴涨到 78.7%。这种技巧使得普通用户也能通过调整说话方式,引导 AI 给出更满意的结果。
典型案例解析
Riley Goodside 之所以脱颖而出,是因为他不仅仅是随意出题,而是结合论文方法和总结的技巧组合使用。例如,他曾让 AI 根据一系列条件判断电视剧角色是否符合特定标准;甚至发现了 GPT-3 的'提示注入攻击'方法,能够绕过安全限制,让 AI 忽略之前的命令。
他最知名的作品之一是让 ChatGPT 扮演推特员工,在面对马斯克审查时撰写周报。经过多轮提示优化,AI 不仅给出了工作总结,还自动生成了配套代码,引发了广泛讨论。
行业现状与岗位需求
企业布局
Scale AI 主营为 AI 训练提供数据服务,是数据标注领域估值最高的公司之一。针对语言模型潮,该公司推出了 Spellbook(魔法书)业务,旨在存储、管理、自动推荐合适的提示词,比较同一提示词在不同模型下的效果,并结合其他服务快速上线部署 AI 应用。
除了 Scale AI,市场上已有不少初创公司和社区开始招聘此类人才。招聘要求往往不拘泥于传统技术背景,有的甚至只要求文学学位和对机器人的喜爱,这反映了该岗位对沟通能力和逻辑思维的高要求。
薪资水平
目前市场上的薪资水平普遍较高。以 a16z 支持的社区为例,其提供的底薪约为 30 万美元,另有提成机制。相比之下,传统软件工程师的平均年薪也在稳步增长,而提示工程师作为新兴工种,其溢价能力更为明显。
争议与未来展望
职业定义之争
对于提示工程师是否算作真正的工程师,业界存在分歧。部分风险投资人和专家认为,提示工程师不能算作工程师,因为传统工程师需要学历和证书,而提示工程师似乎有手会打字就能干。
然而,支持方认为,编程就是用特定的文本序列让计算机做特定的事,写提示也是用文本序列让 AI 做特定的事。如果编程是一种工程,那写提示也应该属于工程范畴。特斯拉前 AI 总监曾倾向于将其称为'语言模型心理学家',也有观点建议称为'AI Handler'或'Model Whisperer'。
职业寿命预测
有人预测这可能是一个短命的职业。随着微调大模型成本的降低,以及未来可能出现能自动生成提示词的 AI 模型,人工编写提示的需求可能会减少。此外,一旦与 AI 交互方式的文档完善起来,流程标准化后,这个工种也可能不再被需要。
但另一方面,随着应用场景的复杂化,人类在理解上下文、创意构思和伦理判断上的优势短期内难以被完全替代。人机协作的模式可能成为主流,提示工程师的角色将演变为更高级的 AI 架构师或协调者。
如何系统学习提示工程
对于希望进入这一领域的开发者,以下是一个基于行业共识的学习路径建议:
第一阶段:大模型系统设计
从理解大模型的基本原理入手,掌握 Transformer 架构、注意力机制等核心概念。了解模型是如何处理输入输出数据的,这是设计有效提示的基础。
第二阶段:提示词工程基础
深入学习 Prompts 的设计技巧。包括零样本(Zero-shot)、少样本(Few-shot)提示,以及思维链(Chain-of-Thought)推理。练习如何通过调整措辞来改变模型的输出风格和质量。
第三阶段:平台应用开发
借助云平台(如阿里云 PAI、AWS Bedrock 等)构建实际项目。例如,利用大模型构建电商领域的虚拟试衣系统,理解 API 调用、上下文窗口限制及成本控制。
第四阶段:知识库与 RAG 开发
以大模型知识库应用开发为主,以 LangChain 框架为例,构建物流行业咨询智能问答系统。学习如何将私有数据向量化,并通过检索增强生成(RAG)技术提高回答的准确性。
第五阶段:微调与垂直训练
掌握 Fine-tuning 垂直训练大模型的技能,包括数据准备、数据蒸馏、大模型部署等一站式流程。针对大健康、新零售、新媒体等领域构建适合当前场景的专用模型。
第六阶段:多模态与大模型融合
以 SD(Stable Diffusion)等多模态大模型为主,搭建文生图、文生视频小程序案例。探索文本、图像、音频等多种模态之间的交互与转换。
第七阶段:行业应用落地
以大模型平台应用与开发为主,通过星火大模型、文心大模型等成熟产品构建大模型行业应用。重点在于解决实际业务痛点,实现商业价值闭环。
结语
ChatGPT 带来的热潮确实让写提示词这项技能变得抢手。无论最终这个岗位叫什么名字,它都标志着人机交互方式的重大变革。对于程序员而言,掌握与 AI 高效沟通的能力,将是未来职业生涯中的核心竞争力之一。