简介
大语言模型(LLM)如 ChatGPT 的主要优点之一是能够理解和响应自然语言输入。在日常生活中,沟通本身就是一门重要的课程,表达越清晰、提供的信息越丰富,沟通就越顺畅。与 LLM 交互同样遵循这一逻辑:如果想要获取更准确、更清晰的回复,建立高效的沟通方式至关重要。
如何能与 AI 建立一个良好的沟通方式呢?核心在于提示词(Prompt)。提示词工程(Prompt Engineering)并非简单的打字操作,而是一门结合语言学、心理学和计算机科学的交叉学科。它要求开发者理解模型的训练机制、上下文窗口限制以及概率生成特性,从而通过精心设计的指令引导模型输出高质量结果。
核心价值
许多初学者常疑惑:提示词是否需要专门学习?看似简单的输入框操作,真的需要系统掌握吗?
实际上,"会用"和"用好"是两回事。我们可以将 LLM 想象成孙悟空的金箍棒,本身具备强大的法力,但如果不会使用,它也不过是一根普通的铁棍。提示词的质量直接决定了模型能力的发挥上限。对于有编程基础或业务需求的人来说,若希望基于 LLM 快速构建应用软件或功能模块,不掌握 Prompt 的基本原理和使用技巧,将无法达到预期的工程效果。
提示词的基本原则
编写高质量的提示词,需遵循以下核心原则:
1. 明确具体需求
GPT 类模型无法直接读取用户的思维,因此在提供需求时尽可能具体化是关键。这包括在查询中包含详细信息、要求模型采用特定角色、以及使用定界符清楚地指示输入的不同部分。
- 定义术语:避免使用行业黑话或网络流行语,除非模型已知晓。例如,"哈基米"属于特定语境下的网络用语,早期模型可能无法理解其语义。
- 消除歧义:避免模棱两可的语言。例如,"帮我写点东西"不如"请帮我写一篇关于人工智能发展趋势的 800 字科普文章"。
- 结构化输入:使用 Markdown 标题、列表或 XML 标签来组织输入内容,帮助模型区分指令和数据。
2. 提供参考文本(Few-Shot Learning)
如果可能,提供与您希望模型生成的内容相似的参考文本。这将有助于模型了解您的风格偏好和格式要求。
- 短文本引用:可以直接将法律条款、代码片段或文档内容粘贴到提问中。例如:"根据以下的法律条款,解释什么是知识产权?"随后附上条款内容。
- 长文本处理:对于网页链接或长文档,建议先提取关键信息再提供给模型,或者利用支持长上下文的模型版本。注意,部分功能可能需要特定的插件支持。
3. 任务拆解(Chain of Thought)
将复杂的任务拆分为更简单的子任务。作为一个厨师,在做饭时需要完成准备食材、清理、处理、烹饪、摆盘等步骤。同理,在编程或复杂逻辑推理中,将一个复杂需求拆解为 N 个简单的子需求,能显著提高成功率。
优势:
- 更好理解每一个操作步骤。
- 减少上下文窗口限制带来的遗忘问题。
- 方便针对中间环节进行调整。
示例: 原始复杂任务:"作为一个测试工程师,我即将进行述职答辩,我想编写一个述职报告,包含成绩、目标和遇到的问题。" 优化后拆解:
- "列出今年测试团队的关键指标数据。"
- "基于数据撰写一段关于 bug 逃逸率降低的分析。"
- "规划明年的技术改进目标。"
- "总结遇到的主要挑战及解决方案。"
- "整合上述内容,生成一份结构完整的述职报告。"
4. 角色扮演(Persona Adoption)
告诉 ChatGPT 在对话中扮演一个特定的角色或人物。这对于创造更有吸引力和沉浸感的对话,或模拟真实世界的场景特别有用。
- 专业角色:"你是一位资深 Python 架构师..."
- 风格模仿:"请用鲁迅的口吻,写一篇文章,叫做我的妈妈..."
- 工具模拟:"我希望你作为一个 JavaScript 控制台。我将输入命令,你回复终端输出..."
5. 系统性测试与迭代
对需求或参考文本进行更改时,重要的是系统地测试结果以了解它们如何影响模型的输出。LLM 具有随机性,每一次回复都可能有细微差别。确认没有问题之后再使用,如果有问题,可以进一步追问,让模型根据反馈纠正回复。


