Prompt 工程:大语言模型高效使用指南
1. Prompt 工程概述
1.1 什么是 Prompt?
大语言模型(LLM)本质上是一个强大的工具,我们无需训练每一个模型,关键在于如何高效利用。就像计算器一样,计算 10 的 10 次方,是按 10 次加法还是直接乘法,决定了效率。
提示词(Prompt)是用户向大模型下达的指令输入,通常包含以下要素:
- 指令:明确模型需要执行的任务。
- 上下文:提供背景信息或额外数据,辅助模型理解。
- 输入数据:具体的问题或待处理内容。
- 输出指示:规定输出的格式、类型或风格。
1.2 什么是 Prompt 工程?
Prompt 工程是指开发和优化提示词的技巧。通过提供清晰、结构化的指令,引导模型更好地理解需求,从而获得高质量的输出。在使用大模型时,用户实际上扮演了产品经理的角色:模糊的需求导致随意的回答,而详尽的背景、数据和格式定义则能激发模型的潜力。
2. Prompt 工程基本原则
2.1 给出清晰、详细的指令
策略包括:
- 使用分隔符:利用
""",<>,<tag>等符号区分指令的不同部分。 - 指定结构化输出:要求模型返回 JSON、HTML 或 Markdown 表格等格式。
- 自检测机制:要求模型在输出前自我检查是否满足约束条件。
- 提供示例:Few-shot prompting(少样本提示),给出一两个正确示例供模型参考。
2.2 给模型思考的时间
不要期望一步到位,应允许模型进行推理。这被称为'思维链'的基础。
- 分步任务:明确告知模型完成任务所需的步骤。
- 显式推理:要求模型在给出结论前先写出推理过程,消耗 Token 换取准确性。
3. Prompt 工程迭代思维
提示工程与软件工程类似,是一个不断迭代优化的过程。初始 Prompt 往往不完美,需要根据输出结果调整指令,逐步逼近最优解。
4. 核心方法详解
4.1 思维链 (Chain-of-Thought)
思维链由 Google 论文提出,通过让模型生成一系列中间推理步骤,提升解决复杂问题的能力。其特性包括:
- 多步拆分:将复杂问题分解为子问题。
- 可解释性:推理过程透明,便于定位错误。
- 广泛适用:适用于数学、常识推理及符号操作。
示例对比:
- 零样本:直接提问。
- 零样本思维链:要求'请一步步思考'。
- 少样本:提供输入输出对。
- 少样本思维链:提供带推理过程的输入输出对。
4.2 思维树 (Tree of Thoughts, ToT)
ToT 是 CoT 的扩展,旨在解决单一推理路径可能遗漏最优解的问题。它模拟人类搜索过程,包括:
- 问题分解:将大问题拆解。
- :生成多个可能的解决方案分支。


