大模型 Prompt 工程核心技巧与实战指南
随着 ChatGPT 等生成式 AI 的爆发,大语言模型(Large Language Model, LLM)已深入公众视野。虽然 LLM 达到了类人的交互水平,但要最大化其能力,仍需以'大模型视角'进行思考和对话。这正是提示词工程师(Prompt Engineer)的核心工作。本文将系统梳理 Prompt 工程的关键技巧,帮助用户高效驾驭大模型。
一、本质是提问的技巧
大模型首次实现了自然语言与计算机的深度交流。为了达到事半功倍的效果,必须精进提问技巧。建议将大模型视为精通某一领域的专业顾问(如导游、咨询师),以专业对话的角度提出问题。
常见误区示例:
- 模糊提问: '五一假期去上海玩,推荐一些行程'。
- 结果: 大模型通常给出中规中矩的通用日程,缺乏参考价值。
优化原则:
- 角色设定: 明确大模型的身份,例如'你是一位资深旅游规划师'。
- 专注主题: 一次对话聚焦一个具体问题或主题。
- 要素齐全: 列出关键信息,如时间、地点、人物、事件等。
- 限定范围: 明确约束条件,例如'可以做什么'、'不可以做什么'、'特定时间点要求'。
- 分隔清晰: 使用标点符号对提问进行结构化分隔,帮助模型抓住重点。
优化后的 Prompt 示例:
'五一假期,从南京出发,坐高铁,目的地上海,亲子 3 日游,不去迪士尼,不去动物园,安排详细行程。'
这种结构化的提问能显著提升回答的针对性和可用性。
二、及时补充上下文
大语言模型相比传统 AI 的最大进步在于超长上下文记忆能力。在与模型对话时,应充分利用这一特性:
- 动态补充: 不可能一次性写出完美提示。一旦有新想法或发现遗漏,应及时追加信息。
- 纠正偏差: 大模型有时会产生幻觉或胡言乱语(受 Temperature 参数影响)。一旦发现跑偏,需提供新的上下文进行纠正。
- 提供示例: 若对输出有特殊要求,提供 Few-Shot(少样本)示例是极佳的方式。模型能很好地捕获示例中的模式,从而输出更优质的内容。
关于上下文长度: 现代大模型的上下文窗口通常在 4096 Token 以上,部分模型甚至支持数十万 Token。对于常规问题,输入字数溢出并非主要担忧,但需注意有效信息的密度。
三、掌握命令和特殊标记
尽管输入是自然语言,但底层仍是程序化机器,因此存在特殊的命令和标记来简化输入并提升效率。
1. 简洁的命令动词
使用清晰、无歧义的动词作为指令开头:
描述(Describe)拟定(Draft)写出(Write)规划(Plan)总结(Summarize)
2. 特殊标记符号
利用符号增强语义共识,类似数学物理符号的作用:
- 方括号:
[ ]用于强调关键词或变量。 - 引号:
"""或'''用于包裹长文本块,避免被误解析为指令。 - 井号:
###常用于标题或段落分隔。
四、理解专业领域知识
通用技巧适用于常规问题,但在专业领域(如代码生成、图像创作),仅靠通用技巧是不够的。需要结合领域知识,将抽象需求转化为专业术语。


