Prompt 提示词工程使用指南

一、前言

ChatGPT 的问世带动了一大批 AI 大模型开源并开始投入商用，尤其是从去年下半年开始，各类大模型纷纷问世，加之国内的互联网大厂也纷纷投入大模型赛道，让大模型的黑科技也能被很多不懂 AI 的小伙伴开始尝鲜。举例来说，像国内阿里的通义千问，百度的千帆大模型，腾讯的混元大模型等，都是很不错的 AI 大模型产品，得到了很多业内人士的认可。

但对于很多初学大模型或不懂大模型的人来说，如何真正用好 AI 大模型，并利用大模型强大的对话能力为日常事务助力增效呢？这就需要全面而系统的学习 Prompt 提示词工程。

二、Prompt 提示词工程介绍

2.1 Prompt 提示词工程是什么

Prompt 提示词工程（Prompt Engineering）是在自然语言处理（NLP）领域中一种重要的技术和方法，主要用于指导预训练的大规模语言模型（Large Language Models, LLMs）生成高质量、准确且有针对性的输出。

Prompt Engineering，也称为'指令工程'或'提示词工程'，是指通过设计、实验和优化输入提示词（Prompt）来引导预训练语言模型生成所需的响应或完成特定任务的技术。

2.1.1 Prompt 构成要素

一个有效的 prompt 通常包含以下几个关键要素：

引导语或指示语：明确告诉模型需要完成什么样的任务；
上下文信息：提供必要的背景知识，帮助模型更好地理解问题；
任务描述：明确地描述您期望模型执行的具体任务；
输出格式指示：如果需要特定格式的输出，需要在 prompt 中指明；
角色设定：为模型定义一个角色，以缩小问题范围并减少歧义；

2.2 Prompt 提示词工程有什么作用

Prompt 提示词工程的作用在于指导和控制大规模语言模型（LLMs）的行为，使其能更准确、更有针对性地生成文本或完成人们下发的特定任务。下面结合实践经验总结了 Prompt 提示词工程的主要作用：

指导模型行为

明确任务：通过精确的 prompt，可以明确地告诉模型需要执行什么任务，比如回答问题、创作故事、提供建议等；
上下文设置：提供必要的背景信息，帮助模型更好地理解问题的上下文环境，从而给出更加贴切的回答；

控制内容输出质量

提高输出内容准确性：精心设计的 prompt 可以帮助模型生成更准确、相关度更高的内容；
减少输出内容偏差：通过提供适当的指导，可以减少模型可能产生的偏见或错误信息；

规定输出格式

格式化输出：如果需要特定格式的输出，可通过 prompt 指定输出格式，比如表格、列表、段落、markdown 等；
标准化答案：对于需要标准化回答的场合，比如考试答案或官方声明，可以通过 prompt 来规范输出；

促进创造性应用

创意生成：规范的 prompt 可以激发模型创造力，生成新颖的想法、故事或艺术作品；
角色扮演：通过定义角色或情境，使模型能够在特定角色下进行对话或创作；

无需反复训练

灵活调整：通过修改 prompt，可以在不改变模型本身的情况下调整其输出，从而实现快速迭代和测试；
节省资源：避免了重新训练模型所需的大量时间和计算资源；

助力教育和培训

名称	描述	示例
指令词 (必须)	此部分为 prompt 的指令，告诉模型应如何响应	'简述'、'解释'、'翻译'、'总结'、'润色'、'写一篇文章"等
输入数据 (必须)	提供给模型的问题或具体內容，应清晰、完整，以确保模型生成满意的答案，注意控制长度，必要的时候建议分段发送	当需要总结时，提供原始的文本内容；当需要编写 SQL 代码时，提供的数据库表和字段信息
背景 (非必须)	与任务相关的其他信息，提供额外信息以帮助模型更好地理解需求	同样是写关于计算机的科普文章，是写给小学生还是计算机专业大学生，得到的内容会完全不同
输出要求 (非必须)	期望模型输出的指标或结构，比如：类型、字数	'请输出五条'XX'相关的事实，并按重要性排序：1. …，2. …，3. …'，请按照 markdown、表格…形式进行输出

#### 4.3.4 保持指令的简洁性在使用大模型进行提问时，一方面大模型自身对于单次输入的内容回答长度有限制，超过一定的长度限制后，反馈的输出结果准确性不好，另一方面，这也并不符合现实的对话场景下，通过一次性的问答就能得到我们预期的答案，简而言之，当你需要向大模型提问的内容很长，又希望得到相对精准且全面的回复，可以参考这几个经验： - 将一次性提问的长文本内容，拆分成具有前后逻辑关联的较短的多个文本； - 分多次进行提问，在一定的时间限度和语境内，大模型会记录上文的已回答的内容语义； - 每次提问时，可基于大模型上一次的回复，进行递进式的提问，或者针对已经回复的内容进行微调，然后重新发起提问； - 每次提问的文本内容不要太长，即指令尽量简短清晰，避免给大模型过多的理解成本；下面看一个具体的示例，为了让大模型为我们提供 5 个短视频营销文案的标题，我们分多次提问，从而逐渐逼近最符合我们需求的输出内容； **指令一：** > 作为一个专业的营销策划师，请为我拟定 5 个关于创意短视频的文案标题 **指令二：** > 注意，我的短视频受众群体主要是年轻的女性，内容尽量与时尚、好玩、有趣这些标签相关，请重新拟定 **指令三：** > 基于你的回答，我现在想进一步缩小范围，提供时尚穿搭方面的，请重新拟定通过上述大模型的回复，不难发现，通过这种模拟真实对话场景的提问，大模型可以不断的根据上下文的语义环境进行输出内容的调整，从而得到我们预期的结果。 #### 4.3.5 提供必要的上下文信息也即上文提到的情境相关性，在一些复杂的场景中，比如你需要大模型帮你分析某个科学或技术问题，那么你必须提供相对完整的语境内容，否则大模型就是瞎猜了，为什么这么说呢，设想你是一个想写一篇针对某个技术观点的文章，但是你并不很懂技术，如何让大模型帮你写出一篇这样的文章呢？答案是，你要向大模型提出你的需求，比如你希望你的文章包括哪些章节，每个章节还包括哪些具体的子标题，每个章节中要重点突出哪些观点等，如下是一个具体的操作示例，是关于借助大模型我我们生成一个文章的提纲。 **指令一：**

Prompt 提示词工程使用指南