作者: 引线小白-本文永久链接:httpss://www.limoncc.com/post/1c60669bbe56769f/
知识共享许可协议: 本博客采用署名-非商业-禁止演绎4.0国际许可证
一、基本介绍
扩散模型大放异彩,从原理上搞清楚运作机制非常关键。下面我们定义一些符号:对于观测变量
下面我们来解释一下这么做的动机:我们认为上帝是这么来生成一张图片的。先掷骰子(对,没错我们又假设上帝投骰子),然后慢慢画出图像(先色块,再形状,再细节,就像美术的厚涂法一样)。这对应着解码过程(decode),反过来就是编码过程(encode)。
也就是说有三个关键分布
1、编码分布
2、生成分布(解码分布)
3、先验分布
二、损失函数
考虑到编码分布的复杂性,我们一般使用易于计算的分布
令
考虑到
于是有
所以有损失函数:
这里需要注意一点,我们是根据马尔可夫假设,推导出了损失函数。如果我们仔细观察损失函数的构成,其实我们很容易发现,马尔可夫假设不是必须的。这也为之后的模型提供了优化空间。
三、模型构建的细节
3.1、编码模型的实现
我们首先来考察一个损失函数
最终得到噪声
这样有:
对于
考察均值与方差
我们希望最终的
令
我们只要设计合理的
3.2、生成模型的实现
3.2.1、
考虑逆过程
根据高斯分布,我们配平方
均值有
方差有
也就是说:
在编码过程(变成噪声)中,我们有
我们知道
注意到损失函数
变形神经网络形式如下:
3.2.2、
接下来我们考察最后一项
由于
3.2.3、
对于
于是有损失函数:
这样,我们有算法:
对于采样生成有:
四、评述
1、推理中的一些关键动机,视乎没有加以说明。一些想法视乎是从天而降。
2、在逆向生成中
3、最终的结果是简单,一定还有更加显然的推理方式,论文DDPM的推理总觉得还是太过迂回,与不显然。接下我们将使用宋大神SDE的思想来解读这个模型。
4、DDPM以后有一系列的改进,也将一一解读,敬请关注。
Ho, J., Jain, A., & Abbeel, P. (2020, December 16). Denoising Diffusion Probabilistic Models. arXiv. http://arxiv.org/abs/2006.11239. Accessed 22 March 2023
Kingma, D. P., & Welling, M. (2022, December 10). Auto-Encoding Variational Bayes. arXiv. http://arxiv.org/abs/1312.6114. Accessed 18 April 2023
版权声明 | ![]() |
![]() | 由引线小白创作并维护的柠檬CC博客采用署名-非商业-禁止演绎4.0国际许可证。 本文首发于柠檬CC [ https://www.limoncc.com ] , 版权所有、侵权必究。 |
本文永久链接 | httpss://www.limoncc.com/post/1c60669bbe56769f/ |
如果您需要引用本文,请参考: |
引线小白. (May. 16, 2023). 《扩散模型研究一:去噪扩散概率模型DDPM》[Blog post]. Retrieved from https://www.limoncc.com/post/1c60669bbe56769f |
@online{limoncc-1c60669bbe56769f, title={扩散模型研究一:去噪扩散概率模型DDPM}, author={引线小白}, year={2023}, month={May}, date={16}, url={\url{https://www.limoncc.com/post/1c60669bbe56769f}}, } |