3. Diffusion Model
➢ 2020年ごろから急速に注目された生成モデル (初出は2015年)
○ 生成品質が高い
○ 多様なデータが生成できる(画像、音楽、条件づけ、自然言語)
○ 安定した学習
○ 生成に時間がかかるのが難点
“Diffusion Models Beat GANs on Image Synthesis” (Prafulla Dhariwal and Alex Nichol, NeurIPS 2021, arXiv: 2112.10741)
4. Textから画像生成: GLIDE
Text to image Image editing by text
“GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models” (Alex Nichol and et al., 2021, arXiv: 2112.10741)
5. ➢ ノイズからデータへの変換を学習
○ GAN, VAE
➢ データからノイズへの変換の逆変換を学習
○ Diffusion model
他の生成モデルとの違い
❖ “Deep Unsupervised Learning using Nonequilibrium Thermodynamics” (Sohl-Dickstein and et al., 2015, arXiv: 1503.03585) : 初出
❖ “Denoising diffusion probabilistic models” (Ho and et al., 2020, NeurIPS, arXiv: 2006.11239): 多くの論文のベースライン
❖ “Understanding Diffusion Models: A Unified Perspective” (Calvin Luo, 2022, arXiv: 2208.11970) : 最近の解説
本スライドは以下の論文をベースに解説
GAN