AI 大模型提示工程技术指南
一、提示工程简介
1. 通用人工智能与专用人工智能
在探讨提示工程之前,有必要明确人工智能的两个主要分类:
- 通用人工智能 (AGI, Artificial General Intelligence):具备学习、推理、感知、理解等人类智能的全面系统。它不局限于特定领域或任务,能够在多个领域表现出类似于人类的智能水平。
- 专用人工智能 (ANI, Artificial Narrow Intelligence):只能执行特定任务,例如语音识别、图像识别、自然语言处理中的特定子任务等。
提示工程(Prompt Engineering)主要作用于 AGI 及当前的大语言模型阶段,旨在通过自然语言交互激发模型的潜在能力。
2. Prompt 提示词的作用
Prompt(提示词)是用户与大模型交互的接口。其作用是引导模型生成特定类型的文本或完成特定任务。提示词通常是一段文本或代码片段,提供了关于期望输出的一些指导或约束。
在使用 GPT 等大模型时,设计和使用优秀的提示词可以显著提升模型的实用性和效果,满足特定的业务需求。具体作用包括:
- 引导模型生成特定主题或风格的文本;
- 指导模型完成特定任务,如翻译、摘要、问答、编程辅助;
- 控制模型生成的语言风格或口吻;
- 作为约束条件,限制模型生成的范围或内容,避免幻觉;
- 更准确地表达用户意图,生成高质量的输出结果。
3. 什么是提示工程
提示工程(Prompt Engineering),又称指令工程。它是使用通用人工智能的基础语言进行工程化实践的过程。简单来说,提示工程就是如何设计、优化和使用提示词的工程学科。
4. 掌握提示工程的优势
在 AGI 时代,提示工程师相当于能够设计和使用优秀提示词的专家。随着大模型能力的普及,了解并精通提示工程对开发者而言是巨大的优势。一个程序员如果提示工程素养不足,其工作效率可能会降低,逐渐被技术迭代淘汰。目前,有意识掌握提示工程的人相对较少,这构成了核心竞争力。
5. 提示工程的目的
GPT 大模型本质上是基于概率预测下一个字的生成器,生成的语句并不总是符合预期。对于不同的提示词,有的有效,有的无效。即使相同的提示词,在不同语境下效果也可能不同。
提示工程的核心目的是提高提示词的有效性,通过对多轮对话、渐进式提问和不断校准,提升输出结果的质量,确保模型准确理解并执行用户意图。
二、提示词组成、迭代与调优
1. 提示词的组成要素
构建一个高质量的提示词通常包含以下核心要素:
- 任务指示:清晰描述具体的需求,明确要执行什么任务。
- 构造语境环境(上下文):在多轮交互中,不断补充任务的细节和背景信息,帮助模型理解场景。
- 给出示例(Few-Shot):提供输入输出的参考样本,让模型模仿格式或逻辑。
- 输入信息:明确该任务所需的具体数据,包括参数、文字、图片描述等。
- 输出信息:指定想要的输出结果格式,如 JSON、HTML、XML 或纯文本。
2. 提示词的迭代与调优
使用大模型解决问题往往需要持续的迭代。找到好的 Prompt 不是一蹴而就的,需要不断完善需求的细节。大模型不具备人类的本能逻辑,只是根据概率生成词汇的机器,因此必须将需求的各个细节尽可能描述清楚,避免歧义。
调优过程通常遵循以下步骤:
- 初步尝试:编写基础提示词。
- 观察输出:分析模型是否理解意图,是否存在幻觉或格式错误。
- 增加约束:针对问题添加限制条件或修正指令。
- 多轮反馈:通过对话逐步引导模型修正方向。
3. 基础示例:信息提取
给定一段非结构化文本,要求提取关键信息。
输入文本:
我叫小王,住在北京市海淀区清华东路 16 号,手机号是 18588888888,爱好是打篮球


