1. 经典 ODE 求解器(确定性采样器) #
这些采样器基于数值积分方法,通常收敛稳定,适合需要可重复结果的场景。
(1) Euler(欧拉) #
- 优点:
- 计算速度快,适合快速测试和简单图像生成。
- 在 20-30 步内即可获得不错的结果。
- 缺点:
- 精度较低,细节表现一般,不适合高精度需求。
- 适配场景:
- 快速概念验证、草图生成、低计算资源环境。
(2) Heun(改进欧拉) #
- 优点:
- 比 Euler 更精确,图像质量更高。
- 适合需要平衡速度与质量的场景。
- 缺点:
- 计算时间比 Euler 长(约 2 倍)。
- 适配场景:
- 中等质量需求,如插画、概念艺术。
(3) LMS(线性多步法) #
- 优点:
- 比 Euler 更稳定,收敛性更好。
- 适用于写实风格图像。
- 缺点:
- 计算成本略高。
- 适配场景:
- 需要稳定输出的写实图像生成。
2. 祖先采样器(随机性采样器) #
名称带 a
的采样器(如 Euler a
、DPM++ 2S a
)会在每一步添加噪声,导致结果不可复现。
(1) Euler a #
- 优点:
- 生成速度快,适合创意探索。
- 能产生更多样化的结果。
- 缺点:
- 不收敛,相同参数可能生成不同图像。
- 适配场景:
- 艺术创作、风格实验,不要求稳定输出的情况。
(2) DPM++ 2S a / DPM++ 2S a Karras #
- 优点:
- 比 Euler a 更精细,适合复杂场景。
- 结合 Karras 噪声调度,质量更高。
- 缺点:
- 计算成本较高,仍具有随机性。
- 适配场景:
- 需要一定随机性的高质量艺术创作。
3. DPM 系列(高质量采样器) #
DPM(Diffusion Probabilistic Model)系列采样器在 2022 年后成为主流,尤其适合高质量图像生成。
(1) DPM++ 2M Karras #
- 优点:
- 高质量、稳定,适合写实风格。
- 在 20-30 步内即可获得优秀结果。
- 缺点:
- 计算时间比 Euler 长。
- 适配场景:
- 写实照片、商业级图像生成。
(2) DPM++ SDE Karras #
- 优点:
- 细节丰富,适合复杂纹理(如毛发、布料)。
- 在 8-12 步即可获得高质量结果。
- 缺点:
- 计算成本高,可能不稳定。
- 适配场景:
- 高质量艺术创作、CG 渲染。
(3) DPM adaptive #
- 优点:
- 自适应调整步长,适合复杂任务。
- 能自动优化计算效率。
- 缺点:
- 速度较慢,不适合快速迭代。
- 适配场景:
- 高精度需求,如科研图像生成。
4. 其他现代采样器 #
(1) UniPC(统一预测校正器) #
- 优点:
- 在 5-10 步内即可生成高质量图像。
- 平衡速度与质量。
- 缺点:
- 较新,稳定性待验证。
- 适配场景:
- 快速高质量生成,如广告设计。
(2) DDIM(去噪扩散隐式模型) #
- 优点:
- 早期经典采样器,适合低步数(10-15 步)生成。
- 缺点:
- 已过时,细节表现不如 DPM++。
- 适配场景:
- 历史模型测试,低计算需求场景。
(3) Restart #
- 优点:
- 避免局部最优,增加多样性。
- 缺点:
- 可能不稳定,计算成本高。
- 适配场景:
- 创意实验,避免重复模式。
5. 推荐选择指南 #
需求 | 推荐采样器 | 步数范围 |
---|---|---|
快速测试 | Euler / Euler a | 10-20 |
高质量写实 | DPM++ 2M Karras | 20-30 |
高细节艺术 | DPM++ SDE Karras | 8-12 |
稳定可重现 | LMS / DPM++ 2M (非祖先) | 20-40 |
创意多样性 | Euler a / DPM++ 2S a | 15-25 |
超快高质量 | UniPC | 5-10 |
总结 #
- 速度优先:Euler、UniPC、DPM fast。
- 质量优先:DPM++ 2M Karras、DPM++ SDE Karras。
- 稳定可重现:避免祖先采样器(带
a
的),选择 LMS、DPM++ 2M。 - 艺术多样性:Euler a、DPM++ 2S a Karras。