Skip to main content

prompt

·387 words·2 mins
😈long && 😻liang
Author
😈long && 😻liang
A IT worker with PHP/GO as the main technology stack
stable_diffusion - This article is part of a series.
Part 2: This Article

Stable Diffusion 提示词(Prompt)终极指南
#

Stable Diffusion(SD)是一种强大的文本生成图像(Text-to-Image, T2I)AI模型,其生成质量高度依赖**提示词(Prompt)**的编写方式。本指南将全面解析提示词的原理、语法、优化策略及高级技巧,帮助你掌握精准控制AI绘画的方法。


1. 提示词的核心原理
#

(1) 文本如何影响图像生成?
#

  • Stable Diffusion 使用 CLIP(Contrastive Language-Image Pretraining) 模型将文本编码为潜在向量(Latent Vector),该向量指导扩散模型逐步去噪并生成图像。
  • 提示词越精准,生成的图像越符合预期;模糊或冲突的提示词可能导致不理想的结果。

(2) 正向提示词 vs. 负向提示词
#

类型 作用 示例
正向提示词 描述希望出现在图像中的内容 "a beautiful sunset, 4K, ultra-detailed"
负向提示词 排除不希望出现的内容 "blurry, deformed hands, low quality"

(3) 注意力机制(Attention)
#

  • 越靠前的词权重越高(如 "A cat on a sofa""cat""sofa" 更重要)。
  • 可通过 (word:weight) 手动调整权重(如 (cat:1.3) 让猫更突出)。

2. 提示词的基本语法
#

(1) 标准格式
#

  • 用英文逗号 , 分隔不同概念(SD 会解析为多个独立 token):
    • "a cute cat, fluffy fur, sunny day, 8K, ultra-detailed"
    • "a cute cat with fluffy fur on a sunny day"(可能被解析为单一长句,效果较差)

(2) 权重控制
#

语法 效果 示例
(word:1.2) 增强该词权重 20% (cat:1.2)
[word] 降低权重(≈0.9 [dog]
(word) 提高权重(≈1.1 (sunset)

(3) 组合提示
#

  • [A|B]:随机选择 A 或 B(如 [cat|dog])。
  • AND(部分 SD 版本支持):强制同时渲染多个主体:
    • "cat AND dog" → 猫和狗同时出现
    • "cat:1.2 AND dog:0.8" → 调整权重

(4) 分阶段提示
#

  • : 控制不同生成阶段:
    • "a cat:0.5, a dog:1.5" → 前 50% 步数生成猫,后 50% 步数强化狗。

3. 提示词优化策略
#

(1) 结构化提示词(推荐顺序)
#

  1. 主体"a portrait of a woman"
  2. 细节"long hair, blue eyes, cinematic lighting"
  3. 风格"oil painting, by Greg Rutkowski"
  4. 质量"8K, ultra-detailed, sharp focus"

(2) 常用修饰词
#

类别 示例
画质 "4K, 8K, ultra-detailed, HDR"
光照 "volumetric lighting, rim light, golden hour"
风格 "cyberpunk, anime, watercolor"
艺术家 "by Artgerm, by Alphonse Mucha"
负面词 "blurry, deformed, extra limbs"

(3) 负面提示词(必加)
#

"blurry, lowres, bad anatomy, extra fingers, mutated hands, poorly drawn face, deformed, watermark, signature, text"
  • 可大幅提升图像质量,避免常见错误(如畸形手、模糊等)。

4. 高级技巧
#

(1) 使用 LoRA/Embedding 微调
#

  • LoRA(Low-Rank Adaptation):小型适配模型,增强特定风格(如 "<lora:cyberpunk_style:0.8>")。
  • Textual Inversion:自定义关键词(如 "<my-art-style>")。

(2) 动态提示(Wildcards)
#

  • __animal__ 等占位符随机替换内容(需插件支持):
    "a photo of a __animal__, 8K, National Geographic"
    
    可能生成 "a photo of a lion""a photo of a eagle"

(3) 分步控制(Composable Diffusion)
#

  • [to:when] 控制不同阶段的生成:
    "a cat [to:0.3], a dog [from:0.3]"
    
    • 前 30% 步数生成猫,后 70% 步数生成狗。

5. 经典提示词案例
#

(1) 高质量人像
#

"portrait of a beautiful woman, long flowing hair, detailed eyes, cinematic lighting, 8K, ultra-detailed, by Artgerm, (intricate details:1.2)"
Negative: "blurry, lowres, bad anatomy, extra fingers"

(2) 赛博朋克风格
#

"cyberpunk cityscape, neon lights, rainy night, futuristic, by Simon Stalenhag, 4K, ultra-detailed, (glowing effects:1.3)"
Negative: "bright, daytime, lowres, deformed"

(3) 奇幻场景
#

"fantasy castle on a floating island, magical atmosphere, glowing runes, by Greg Rutkowski, digital painting, 8K"
Negative: "blurry, lowres, modern buildings"

6. 总结
#

关键点 说明
清晰描述 主体 + 细节 + 风格 + 质量
权重调整 (word:1.2)[word]
负面提示 必加,避免低质量输出
高级控制 LoRA、Wildcards、Dynamic Prompts
实验优化 多尝试不同组合

掌握这些技巧后,你可以更精准地控制 Stable Diffusion 生成高质量图像! 🚀

stable_diffusion - This article is part of a series.
Part 2: This Article