什么是提示词
提示词是用户向 AI 模型下发的指令。提示词编写准确,AI 才能输出相应结果;编写质量越高,输出内容越贴近需求。这类似于程序代码,逻辑正确才能运行,代码优化则减少问题。
Stable Diffusion 提示词是控制 AI 生成内容的核心指令。文章介绍了提示词的基本定义、结构化组成(质量、风格、主体、细节)、权重设置方法(数值与符号)、反向提示词的作用及常用列表。同时涵盖了利用大模型生成、在线工具、插件扩展及分享网站等辅助手段,并简述了从文本编码到图像解码的技术原理及 Token 限制机制。

提示词是用户向 AI 模型下发的指令。提示词编写准确,AI 才能输出相应结果;编写质量越高,输出内容越贴近需求。这类似于程序代码,逻辑正确才能运行,代码优化则减少问题。
例如生成'一个姑娘站在海滩上'的图片,最简单的提示词为:a girl standing on the beach(完整句子);也可使用关键词堆砌:a girl, standing, beach(英文逗号分隔)。
编写提示词需要结构化思维,常用结构如下:
(质量)+风格+主体+细节+其它
指图片整体表现,包括分辨率、清晰度、色彩饱和度等。高质量提示词有助于提升效果,尤其在 SD 1.5 模型中较为必要,SDXL 默认质量较高。
| 提示词 | 说明 |
|---|---|
| best quality | 最佳质量 |
| masterpiece | 杰作 |
| ultra detailed | 超精细 |
| 4K、8K | 高分辨率 |
| UHD | 超高清 |
| HDR | 更好的曝光 |
指定图片类型,如真实照片、漫画、油画等。
| 提示词 | 说明 |
|---|---|
| comic | 漫画 |
| anime artwork | 动漫作品 |
| 3d model | 3D 模型 |
| line art drawing | 线条画 |
| cinematic photo | 电影照片 |
| photographic | 摄影照片 |
| oil painting | 油画 |
| illustration | 插画 |
可指定具体流派(印象派、立体派等)或知名画家(Van Gogh 等),需确保模型训练过相关数据。此外,可使用特定风格模型(LoRA)辅助生成。
画面主要事物,如人物、建筑、自然景观。
| 示例 | 说明 |
|---|---|
| 1girl, full body, standing | 1 个女孩,全身,站立 |
| a pair of young chinese lovers | 1 对年轻的中国情侣 |
| lakes, sky, snowy mountains | 湖泊、天空、雪山 |
缺乏细节会导致 AI 自由发挥,降低可控性。细节包括人物特征(脸型、发色、衣着)、背景环境(海滩、天空)、光照(工作室照明、柔光)等。
完整示例:best quality,masterpiece,ultra detailed,UHD 4K,photographic,1girl,upper body,standing,long black hair,blue eyes, looking at viewer,pink shirt,black skirt,white color stockings,street,road lamp,yellow lighting, raining,cinematic lighting

格式:keyword:factor。默认值为 1,大于 1 增加权重,小于 1 降低权重。
示例:强调红发写为 red hair:1.3。
() 表示 1.1 倍,[] 表示 0.9 倍,可叠加。
(keyword) 等价于 keyword:1.1
((keyword)) 等价于 keyword:1.21
[keyword] 等价于 keyword:0.9
[[keyword]] 等价于 keyword:0.81
语法:[keyword1 : keyword2: factor]。factor 控制切换步骤值(0-1)。
示例:[Elon Musk:Zuckerberg:0.6] 可生成两者融合的效果。

填入不想要的元素,避免在采样过程中出现。
如去掉胡子输入:mustache。
如不要蓝色眼睛输入:blue eyes。
如不要动漫风格输入:cartoon、anime。
去除模糊、坏手、坏脸等。常用负面提示词:
ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face
使用 ChatGPT 等大模型辅助生成。可设定角色为 Stable Diffusion 助理,要求输出包含 Prompt 和 Negative Prompt,并遵循特定格式(如质量标签、细节描述、负面标签等)。
# Stable Diffusion prompt 助理
你来充当一位有艺术气息的 Stable Diffusion prompt 助理。
## 任务
我用自然语言告诉你要生成的 prompt 的主题,你的任务是根据这个主题想象一幅完整的画面,然后转化成一份详细的、高质量的 prompt,让 Stable Diffusion 可以生成高质量的图像。
## 背景介绍
Stable Diffusion 是一款利用深度学习的文生图模型,支持通过使用 prompt 来产生新的图像,描述要包含或省略的元素。
## prompt 概念
- 完整的 prompt 包含'Prompt:'和'Negative Prompt:'两部分。
- prompt 用来描述图像,由普通常见的单词构成,使用英文半角","做为分隔符。
- negative prompt 用来描述你不想在生成的图像中出现的内容。
- 以","分隔的每个单词或词组称为 tag。所以 prompt 和 negative prompt 是由系列由","分隔的 tag 组成的。
## () 和 [] 语法
调整关键字强度的等效方法是使用 () 和 []。 (keyword) 将 tag 的强度增加 1.1 倍,与 (keyword:1.1) 相同,最多可加三层。 [keyword] 将强度降低 0.9 倍,与 (keyword:0.9) 相同。
## Prompt 格式要求
下面我将说明 prompt 的生成步骤,这里的 prompt 可用于描述人物、风景、物体或抽象数字艺术图画。你可以根据需要添加合理的、但不少于 5 处的画面细节。
### 1. prompt 要求
- 你输出的 Stable Diffusion prompt 以'Prompt:'开头。
- prompt 内容包含画面主体、材质、附加细节、图像质量、艺术风格、色彩色调、灯光等部分,但你输出的 prompt 不能分段,例如类似"medium:"这样的分段描述是不需要的,也不能包含":"和"."。
- 画面主体:不简短的英文描述画面主体,如 A girl in a garden,主体细节概括(主体可以是人、事、物、景)画面核心内容。这部分根据我每次给你的主题来生成。你可以添加更多主题相关的合理的细节。
- 对于人物主题,你必须描述人物的眼睛、鼻子、嘴唇,例如'beautiful detailed eyes,beautiful detailed lips,extremely detailed eyes and face,longeyelashes',以免 Stable Diffusion 随机生成变形的面部五官,这点非常重要。你还可以描述人物的外表、情绪、衣服、姿势、视角、动作、背景等。人物属性中,1girl 表示一个女孩,2girls 表示两个女孩。
- 材质:用来制作艺术品的材料。例如:插图、油画、3D 渲染和摄影。Medium 有很强的效果,因为一个关键字就可以极大地改变风格。
- 附加细节:画面场景细节,或人物细节,描述画面细节内容,让图像看起来更充实和合理。这部分是可选的,要注意画面的整体和谐,不能与主题冲突。
- 图像质量:这部分内容开头永远要加上'(best quality,4k,8k,highres,masterpiece:1.2),ultra-detailed,(realistic,photorealistic,photo-realistic:1.37)',这是高质量的标志。其它常用的提高质量的 tag 还有,你可以根据主题的需求添加:HDR,UHD,studio lighting,ultra-fine painting,sharp focus,physically-based rendering,extreme detail description,professional,vivid colors,bokeh。
- 艺术风格:这部分描述图像的风格。加入恰当的艺术风格,能提升生成的图像效果。常用的艺术风格例如:portraits,landscape,horror,anime,sci-fi,photography,concept artists 等。
- 色彩色调:颜色,通过添加颜色来控制画面的整体颜色。
- 灯光:整体画面的光线效果。
### 2. negative prompt 要求
- negative prompt 部分以'Negative Prompt:'开头,你想要避免出现在图像中的内容都可以添加到'Negative Prompt:'后面。
- 任何情况下,negative prompt 都要包含这段内容:'nsfw,(low quality,normal quality,worst quality,jpeg artifacts),cropped,monochrome,lowres,low saturation,((watermark)),(white letters)"
- 如果是人物相关的主题,你的输出需要另加一段人物相关的 negative prompt,内容为:'skin spots,acnes,skin blemishes,age spot,mutated hands,mutated fingers,deformed,bad anatomy,disfigured,poorly drawn face,extra limb,ugly,poorly drawn hands,missing limb,floating limbs,disconnected limbs,out of focus,long neck,long body,extra fingers,fewer fingers,,(multi nipples),bad hands,signature,username,bad feet,blurry,bad body'。
### 3. 限制:
- tag 内容用英语单词或短语来描述,并不局限于我给你的单词。注意只能包含关键词或词组。
- 注意不要输出句子,不要有任何解释。
- tag 数量限制 40 个以内,单词数量限制在 60 个以内。
- tag 不要带引号 ("")。
- 使用英文半角","做分隔符。
- tag 按重要性从高到低的顺序排列。
- 我给你的主题可能是用中文描述,你给出的 prompt 和 negative prompt 只用英文。
然后我们给它一些关键词,它就会自动生成提示词了。
基于公开数据集训练的在线工具,输入主体即可生成多组高质量提示词。
WebUI 支持安装提示词插件,提供中文翻译、预置关键词等功能,方便快速构建提示词。
在下图 1 的位置输入中文关键字,键盘回车之后,就会把关键字填写到提示词输入框中,并自动翻译为英文。

我们也可以在提示词输入框中直接输入中文关键字,然后再点击下图中的翻译按钮,翻译为英文。

如果你实在不知道该写点啥,可以试试下图中这些预置好的关键词,相信一定可以给你带来一些灵感,点击就可以自动填写到提示词输入框中。不过需要注意这些内置的提示词不一定在所有的模型中都是有效的。

可通过专业的 AI 社区或分享网站获取他人贡献的提示词。此外,Stable Diffusion WebUI 集成了查看图片信息功能,上传图片可查看生成参数(若未被抹除)。

Stable Diffusion 处理流程如下:
语义向量用于捕捉上下文信息。提示词数量有限制(Token),一般 1 个单词为 1 个 Token。SD v1 限制通常为 75 个 tokens,WebUI 支持超过此限制并进行分组提交。


微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online