Stable Diffusion 提示词(Prompt)终极指南
#
Stable Diffusion(SD)是一种强大的文本生成图像(Text-to-Image, T2I)AI模型,其生成质量高度依赖**提示词(Prompt)**的编写方式。本指南将全面解析提示词的原理、语法、优化策略及高级技巧,帮助你掌握精准控制AI绘画的方法。
1. 提示词的核心原理
#
(1) 文本如何影响图像生成?
#
- Stable Diffusion 使用 CLIP(Contrastive Language-Image Pretraining) 模型将文本编码为潜在向量(Latent Vector),该向量指导扩散模型逐步去噪并生成图像。
- 提示词越精准,生成的图像越符合预期;模糊或冲突的提示词可能导致不理想的结果。
(2) 正向提示词 vs. 负向提示词
#
类型 |
作用 |
示例 |
正向提示词 |
描述希望出现在图像中的内容 |
"a beautiful sunset, 4K, ultra-detailed" |
负向提示词 |
排除不希望出现的内容 |
"blurry, deformed hands, low quality" |
(3) 注意力机制(Attention)
#
- 越靠前的词权重越高(如
"A cat on a sofa"
,"cat"
比 "sofa"
更重要)。
- 可通过
(word:weight)
手动调整权重(如 (cat:1.3)
让猫更突出)。
2. 提示词的基本语法
#
(1) 标准格式
#
- 用英文逗号
,
分隔不同概念(SD 会解析为多个独立 token):
- ✅
"a cute cat, fluffy fur, sunny day, 8K, ultra-detailed"
- ❌
"a cute cat with fluffy fur on a sunny day"
(可能被解析为单一长句,效果较差)
(2) 权重控制
#
语法 |
效果 |
示例 |
(word:1.2) |
增强该词权重 20% |
(cat:1.2) |
[word] |
降低权重(≈0.9 ) |
[dog] |
(word) |
提高权重(≈1.1 ) |
(sunset) |
(3) 组合提示
#
[A|B]
:随机选择 A 或 B(如 [cat|dog]
)。
AND
(部分 SD 版本支持):强制同时渲染多个主体:
"cat AND dog"
→ 猫和狗同时出现
"cat:1.2 AND dog:0.8"
→ 调整权重
(4) 分阶段提示
#
- 用
:
控制不同生成阶段:
"a cat:0.5, a dog:1.5"
→ 前 50% 步数生成猫,后 50% 步数强化狗。
3. 提示词优化策略
#
(1) 结构化提示词(推荐顺序)
#
- 主体(
"a portrait of a woman"
)
- 细节(
"long hair, blue eyes, cinematic lighting"
)
- 风格(
"oil painting, by Greg Rutkowski"
)
- 质量(
"8K, ultra-detailed, sharp focus"
)
(2) 常用修饰词
#
类别 |
示例 |
画质 |
"4K, 8K, ultra-detailed, HDR" |
光照 |
"volumetric lighting, rim light, golden hour" |
风格 |
"cyberpunk, anime, watercolor" |
艺术家 |
"by Artgerm, by Alphonse Mucha" |
负面词 |
"blurry, deformed, extra limbs" |
(3) 负面提示词(必加)
#
"blurry, lowres, bad anatomy, extra fingers, mutated hands, poorly drawn face, deformed, watermark, signature, text"
- 可大幅提升图像质量,避免常见错误(如畸形手、模糊等)。
4. 高级技巧
#
(1) 使用 LoRA/Embedding 微调
#
- LoRA(Low-Rank Adaptation):小型适配模型,增强特定风格(如
"<lora:cyberpunk_style:0.8>"
)。
- Textual Inversion:自定义关键词(如
"<my-art-style>"
)。
(2) 动态提示(Wildcards)
#
- 用
__animal__
等占位符随机替换内容(需插件支持):
"a photo of a __animal__, 8K, National Geographic"
可能生成 "a photo of a lion"
或 "a photo of a eagle"
。
(3) 分步控制(Composable Diffusion)
#
- 用
[to:when]
控制不同阶段的生成:
"a cat [to:0.3], a dog [from:0.3]"
5. 经典提示词案例
#
(1) 高质量人像
#
"portrait of a beautiful woman, long flowing hair, detailed eyes, cinematic lighting, 8K, ultra-detailed, by Artgerm, (intricate details:1.2)"
Negative: "blurry, lowres, bad anatomy, extra fingers"
(2) 赛博朋克风格
#
"cyberpunk cityscape, neon lights, rainy night, futuristic, by Simon Stalenhag, 4K, ultra-detailed, (glowing effects:1.3)"
Negative: "bright, daytime, lowres, deformed"
(3) 奇幻场景
#
"fantasy castle on a floating island, magical atmosphere, glowing runes, by Greg Rutkowski, digital painting, 8K"
Negative: "blurry, lowres, modern buildings"
6. 总结
#
关键点 |
说明 |
清晰描述 |
主体 + 细节 + 风格 + 质量 |
权重调整 |
(word:1.2) 或 [word] |
负面提示 |
必加,避免低质量输出 |
高级控制 |
LoRA、Wildcards、Dynamic Prompts |
实验优化 |
多尝试不同组合 |
掌握这些技巧后,你可以更精准地控制 Stable Diffusion 生成高质量图像! 🚀