在大模型公司担任提示词工程师的职业体验与技术思考
个人背景与职业转型
2014 年至 2019 年,我在安徽一所非双一流院校攻读城乡规划本科;2019 年至 2022 年,在南京一所 985 院校攻读城市规划硕士。毕业后,我曾在设计院从事城市设计工作,从 2022 年 7 月到 2023 年 7 月。2023 年 8 月至今,我任职于国内一家大模型公司,担任提示词工程师(Prompter)。
传统行业的困境
2022 年刚毕业时,我对城市设计行业抱有理想,幻想着能改变中国城市面貌。领导描绘的蓝图看似宏大:第一年沉淀画图成为组长,第二年学习项目管理成为经理,再几年成为项目负责人拿分成。然而现实是,所谓的'沉淀'往往意味着无休止的加班和熬夜。当时的字典里充满了'节后第一天送审'、'下班前发给我'等高压词汇。我在社交媒体上分享设计方案,期望成为行业新星,结果却成了被各种图纸截止日期追赶的'大炸鸡'。
在经历了行业黑话的洗礼后,如'空间营造'、'在地性表达'以及内部的'预借奖金'、'所内统筹'等,我开始反思这条职业路径。这艘承载梦想的船,究竟是诺亚方舟还是泰坦尼克号?
AI 带来的冲击与自学
2023 年 3 月,ChatGPT 的出现如同一声惊雷。当时我正在为一个城市设计方案绞尽脑汁,PPT 中堆满了高大上实则空洞的词汇。使用 ChatGPT 后发现,这些内容生成不再是难题。这不仅是摸鱼神器,更是生产力的革命。大学辛苦学习的专业技能,似乎不如一个 AI 工具高效。这种落差感促使我白天继续完成日常工作,晚上则去自习室自学大模型相关知识。
当时学习资料较为杂乱,我广泛阅读与大模型相关的资料并整理成笔记。为了深入理解,我还尝试在公司最贵的电脑上部署了 Stable Diffusion 和本地大模型。虽然 SD 文生图在建筑设计行业的应用存在局限性,主要卡点在于可控性,生成的图片第一眼尚可但缺乏专业性细节,但这让我对多模态技术有了更直观的认识。
6 月份,我开始谋划跳槽。面对没有互联网经验的短板,我将面试视为实习机会,把面试官当作老师,通过面试反馈积累知识与经验。7 月份,凭借积累的经验,我成功入职了一家大模型公司。
岗位认知与职责
什么是 Prompter?
提示词工程师的核心职责是专门设计、优化和改进用于与大型语言模型互动的指令或问题。具体工作内容分为三个层级:
- 基础层:设计高效的提示词来引导大模型生成期望的输出,包括角色设定、任务描述、约束条件等。
- 进阶层:结合 Coze、Dify、清流等大模型低代码平台,引导大模型生成期望输出。这涉及到整体架构设计、代码能力以及对大模型能力边界的深刻理解。
- 综合层:把控客户需求,协调团队成员,进行产品沟通开发,推进项目进度。这需要更强的项目管理能力和跨部门协作能力。
技术栈与工具
在实际工作中,我们不仅关注文本生成,还探索更多酷炫的大模型应用。例如通过照片计算每餐的热量消耗、创作长篇小说、制定理财投资策略、开发文字游戏等潮流产品。这些应用需要掌握以下技术栈:
- LLM 框架:熟悉 LangChain、LlamaIndex 等框架,能够构建复杂的 Agent 工作流。
- API 集成:熟练掌握各大厂商的 API 调用,处理鉴权、限流、错误重试等机制。
- 向量数据库:了解 Chroma、Milvus 等向量数据库,用于实现 RAG(检索增强生成)架构。
- 低代码平台:熟练使用 Coze、Dify 等平台快速搭建原型,验证业务逻辑。
面临的挑战与压力
回顾这一年多的工作,既有薪资的提升(从设计院年薪 15 万增至大模型公司 30 万左右),也有新的压力来源。主要分为创新压力和未来不确定性压力。
创新压力与技术瓶颈
大模型作为新技术,尚不成熟,存在诸多技术瓶颈:
- 垂直知识深度不足:专业领域往往需要深厚的背景知识和行业经验。即使是大模型,通常难以达到专业人员在特定领域的知识深度。例如在法律、医疗等垂直领域,模型的回答可能缺乏足够的专业严谨性。
- 数理推算能力弱:大模型的数学推理能力受限于其 Transformer 架构。基于 Token 级别的从左到右的'一次性'推理机制,与人类'综合性'的逻辑推理存在区别。这导致模型在处理复杂数学问题时容易出错,例如区分 3.11 和 3.9 的大小,或者数清草莓中有几个 r。玩不好 24 点游戏也是常见现象。
- 模型幻觉问题:由于训练数据集可能过时或不可靠,大模型会产生幻觉。例如让模型写出'林黛玉倒拔垂杨柳'这样不符合事实的回答。此外,由于训练语料的时效性限制,模型可能不知道近期的新闻事件,如中国足球的比赛结果。


