主题

扩散模型

通过迭代去噪合成数据的生成模型。

层叠波纹与柔和纹理,暗示迭代图像生成

扩散模型通过把生成问题变成迭代去噪,改变了图像生成。模型不是一步生成像素,而是学习如何反转加噪过程,因此更容易兼顾真实感、多样性、条件控制和后续编辑。

这个主题的关键区别是:扩散不只是文生图技巧。Latent Diffusion 把去噪移到压缩潜空间,让高分辨率生成变得实用。Imagen 说明文本理解会显著影响提示词对齐。DALL-E 2 则把语言-图像表征和生成连接起来。它们共同解释了现代创意 AI 为什么同时依赖去噪模型和强条件控制。

从这里开始

奠基论文

近期解读