模型设置
在使用提示词与大语言模型交互时,合理配置模型参数对输出质量至关重要。常见设置包括温度(Temperature)、Top_p、最大长度(Max Length)、停止序列(Stop Sequences)、频率惩罚(Frequency Penalty)和存在惩罚(Presence Penalty)等。
Temperature 参数:控制生成的随机性。值越小(如 0.2),模型结果越确定,适用于需要高质量、准确性的任务;值调高(如 0.8-1.0),结果更随机,可能带来更多样化或创造性产出,适合诗歌生成或头脑风暴任务。
Top_p 参数:用于控制模型返回结果的累积概率分布。值调低可获得准确事实答案,值调高则响应更多样化。较低值会选择最有信心的 token 进行采样,有助于减少幻觉。
Max Length 参数:控制大模型生成的 token 数量上限。防止生成冗长或不相关响应,同时有助于控制 API 调用成本。
Stop Sequences 参数:定义阻止模型继续生成特定字符串的终止符。可精确控制大模型响应的长度和结构,例如在对话中指定换行符作为结束。
Frequency Penalty 和 Presence Penalty 参数:对重复的 token 施加惩罚。前者与 token 出现次数成比例,后者对所有重复 token 惩罚相同。一般调整其中一个参数即可,避免过度抑制多样性。
提示词要素
常见的提示词可以包含以下任意要素,组合使用效果更佳:
- 指令:明确想要模型执行的特定任务或操作命令。
- 上下文:提供外部信息或背景知识,引导语言模型更好地理解场景。
- 输入数据:用户提供的具体问题、文本或数据。
- 输出指示:指定输出的类型、格式或风格要求。
提示词设计常用技巧
- 从简单开始:设计提示是一个迭代过程。可从简单提示词入手,逐渐添加元素和上下文,也可将大任务分解为简单子任务,避免初始过于复杂。
- 指令清晰:用命令指示模型执行任务。需通过实验确定最有效方式,指令可置于提示开头或用分隔符隔开,上下文具体且相关效果更好。
- 具体性:提示应具体描述任务,提供示例有助于获得期望输出。但要注意长度,避免不必要细节,需通过实验优化。
- 避免不明确:提示应具体直接,避免过于复杂或不明确的描述。说'要做什么'比'不要做什么'更有效。
常用的提示技术
零样本提示 (Zero-Shot Prompting)
特点:不提供任何样例数据,直接让模型完成任务。
示例:
将文本分类为中性、负面或正面。
文本:我认为这次假期还可以。
情感:
输出:中性
少样本提示 (Few-Shot Prompting)
特点:提供少量示例(1-shot, 3-shot 等)帮助模型理解任务模式。
示例:
'whatpu'是坦桑尼亚的一种小型毛茸茸的动物。一个使用 whatpu 这个词的句子的例子是:我们在非洲旅行时看到了这些非常可爱的 whatpus。
'farduddle'是指快速跳上跳下。一个使用 farduddle 这个词的句子的例子是:
输出:当我们赢得比赛时,我们都开始庆祝跳跃。
对于更困难的任务,可以增加演示数量(如 5-shot、10-shot),但需注意上下文窗口限制。
链式思考 (Chain-of-Thought, CoT) 提示
特点:通过中间推理步骤实现复杂推理能力。将问题分解为逐步推导的过程。


