Skip to content

Commit

Permalink
Update 2024-07-04-GAMES001-NOTES-14.md
Browse files Browse the repository at this point in the history
  • Loading branch information
peng00bo00 committed Jul 4, 2024
1 parent 75b0362 commit 6372e9d
Showing 1 changed file with 39 additions and 2 deletions.
41 changes: 39 additions & 2 deletions _posts/2024-07-04-GAMES001-NOTES-14.md
Original file line number Diff line number Diff line change
Expand Up @@ -169,17 +169,54 @@ $$

<div align=center>
<img src="https://search.pstatic.net/common?src=https://i.imgur.com/lU1FNvf.png" width="100%">
<img src="https://search.pstatic.net/common?src=https://i.imgur.com/B3ObRkt.jpg" width="100%">
</div>

VAE模型的一个缺陷在于它很难生成高质量的数据。对于图像生成任务,这表现为生成的图片大多比较"糊"。

<div align=center>
<img src="https://search.pstatic.net/common?src=https://i.imgur.com/ptH05lR.jpg" width="100%">
<img src="https://search.pstatic.net/common?src=https://i.imgur.com/B3ObRkt.jpg" width="100%">
</div>

## Diffusion Model

目前火热的**扩散模型(diffusion model)**是最新一代的生成式模型。与VAE相比,扩散模型能够生成更高清、更高质量的图像。

<div align=center>
<img src="https://search.pstatic.net/common?src=https://i.imgur.com/ptH05lR.jpg" width="100%">
</div>

从数学上来说,扩散模型和VAE之间有许多相通之处。根据上一节的推导,VAE的核心在于建立数据分布和隐变量空间之间的双向映射关系。扩散模型也有类似的思想,不过在扩散模型中,随机噪声分布和数据分布是通过一系列双向映射来实现的。通过这样多步的映射,扩散模型具有更强的表达能力,生成的数据质量也更高。

<div align=center>
<img src="https://search.pstatic.net/common?src=https://i.imgur.com/IaG3yxU.png" width="100%">
</div>

### 前向过程

扩散模型包括前向和反向两个过程,其中前向过程表示对一张给定的图片添加噪声直至它完全变成无法用肉眼识别的噪声图像。这里每一步添加噪声可以表示为一个马尔科夫链,即第$$t$$步的结果只与上一步$$t-1$$的状态有关。假设在每一步中图像都服从正态分布,则添加噪声的过程可以表示为

$$
q(x_t \vert x_{t-1}) = N(\sqrt{1 - \beta_t} x_{t-1}, \beta_t I)
$$

<div align=center>
<img src="https://search.pstatic.net/common?src=https://i.imgur.com/WFghg2M.png" width="100%">
<img src="https://search.pstatic.net/common?src=https://i.imgur.com/ZzsdESr.png" width="100%">
</div>

利用重参数化的技巧,添加噪声的过程可以表示为

$$
x_t = \sqrt{\alpha_t} x_{t-1} + \sqrt{1 - \alpha_t} \varepsilon_{t-1}
$$

其中$$\varepsilon$$表示来自于标准正态分布的随机噪声。

<div align=center>
<img src="https://search.pstatic.net/common?src=https://i.imgur.com/BcrDPPV.png" width="100%">
</div>

### 反向过程

## Reference

Expand Down

0 comments on commit 6372e9d

Please sign in to comment.