SlideShare a Scribd company logo
Suche senden
Hochladen
Einloggen
Registrieren
【論文読み会】Analytic-DPM_an Analytic Estimate of the Optimal Reverse Variance in Diffusion Probabilistic Models.pptx
Melden
ARISE analytics
Folgen
ARISE analytics
31. Oct 2022
•
0 gefällt mir
•
434 views
1
von
17
【論文読み会】Analytic-DPM_an Analytic Estimate of the Optimal Reverse Variance in Diffusion Probabilistic Models.pptx
31. Oct 2022
•
0 gefällt mir
•
434 views
Jetzt herunterladen
Downloaden Sie, um offline zu lesen
Melden
Technologie
社内で行った「International Conference on Learning Represantation (ICLR)2022読み会」でまとめた資料です。
ARISE analytics
Folgen
ARISE analytics
Recomendados
【論文読み会】Signing at Scale: Learning to Co-Articulate Signs for Large-Scale Pho...
ARISE analytics
153 views
•
32 Folien
Hierarchical Metadata-Aware Document Categorization under Weak Supervision (...
ARISE analytics
112 views
•
24 Folien
教師なしGNNによるIoTデバイスの異常通信検知の検討
ARISE analytics
825 views
•
21 Folien
【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...
ARISE analytics
529 views
•
18 Folien
【論文読み会】Autoregressive Diffusion Models.pptx
ARISE analytics
5.1K views
•
27 Folien
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
ARISE analytics
484 views
•
29 Folien
Más contenido relacionado
Más de ARISE analytics
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)
ARISE analytics
2.4K views
•
22 Folien
【論文読み会】On the Expressivity of Markov Reward
ARISE analytics
556 views
•
20 Folien
【論文読み会】MAUVE: Measuring the Gap Between Neural Text and Human Text using Dive...
ARISE analytics
651 views
•
20 Folien
【論文読み会】Moser Flow: Divergence-based Generative Modeling on Manifolds
ARISE analytics
649 views
•
39 Folien
Counterfaual Machine Learning(CFML)のサーベイ
ARISE analytics
27.4K views
•
104 Folien
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
ARISE analytics
7.7K views
•
33 Folien
Más de ARISE analytics
(8)
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)
ARISE analytics
•
2.4K views
【論文読み会】On the Expressivity of Markov Reward
ARISE analytics
•
556 views
【論文読み会】MAUVE: Measuring the Gap Between Neural Text and Human Text using Dive...
ARISE analytics
•
651 views
【論文読み会】Moser Flow: Divergence-based Generative Modeling on Manifolds
ARISE analytics
•
649 views
Counterfaual Machine Learning(CFML)のサーベイ
ARISE analytics
•
27.4K views
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
ARISE analytics
•
7.7K views
【論文読み会】Self-Attention Generative Adversarial Networks
ARISE analytics
•
5.2K views
【論文読み会】Universal Language Model Fine-tuning for Text Classification
ARISE analytics
•
1.9K views
Último
画像生成AIの問題点
iPride Co., Ltd.
10 views
•
9 Folien
20230921_IoTLT_vol103_kitazaki_v1.pdf
Ayachika Kitazaki
164 views
•
16 Folien
遠隔お酌IoTLT2309.pptx
Yoshiaki Ito
145 views
•
12 Folien
2023情報処理学会関西支部大会-G12.pdf
KoseiShimoda1
7 views
•
11 Folien
IGDA Japan SIG Audio #20-1 室内・野外でのマイク収録と整音.pdf
IGDA Japan SIG-Audio
115 views
•
31 Folien
MLOps Course Slides_JP(配布用).pdf
Yuya Yamamoto
118 views
•
31 Folien
Último
(14)
画像生成AIの問題点
iPride Co., Ltd.
•
10 views
20230921_IoTLT_vol103_kitazaki_v1.pdf
Ayachika Kitazaki
•
164 views
遠隔お酌IoTLT2309.pptx
Yoshiaki Ito
•
145 views
2023情報処理学会関西支部大会-G12.pdf
KoseiShimoda1
•
7 views
IGDA Japan SIG Audio #20-1 室内・野外でのマイク収録と整音.pdf
IGDA Japan SIG-Audio
•
115 views
MLOps Course Slides_JP(配布用).pdf
Yuya Yamamoto
•
118 views
インフラチームとCCoEの関係.pptx
ssuser5c7ee4
•
20 views
磁石内臓イヤリングによる磁力変化を利用したジェスチャ識別
sugiuralab
•
7 views
GraphQLはどんな時に使うか
Yutaka Tachibana
•
14 views
CatBoost on GPU のひみつ
Takuji Tahara
•
548 views
拡散する画像生成.pdf
NTTDOCOMO-ServiceInnovation
•
44 views
CCoE実践者コミュニティ#1_CCoEが進めるセキュリティカイゼンの旅.pptx
Tomoaki Tada
•
57 views
ヒアラブルデバイスにおける音漏れ信号を用いた空中ジェスチャ認識
sugiuralab
•
5 views
テスト自動化.pdf
ssuserf8ea02
•
29 views
【論文読み会】Analytic-DPM_an Analytic Estimate of the Optimal Reverse Variance in Diffusion Probabilistic Models.pptx
1.
[公開情報] Analytic-DPM An Analytic Estimate
of The Optimal Reverse Variance in Diffusion Probabilistic Models 株式会社ARISE analytics Marketing Solution Div. OMO Marketing Unit. 伊藤光祐 2022/07/07 ©2022 ARISE analytics Reserved.
2.
[公開情報] どんな論文? ©2022 ARISE analytics
Reserved. 1 画像生成などで注目されているDiffusion Probabilistic Modelに2つの工夫を組み込 むことで、精度を向上させつつ20~80倍高速化することができた 概要 1 2 各計算ステップで推定する正規分布の分散をモデルの出力か ら解析的に計算 サンプリング時の計算ステップの省略方法を最適化 上記の工夫は既存手法に簡単に組み込むことが可能
3.
[公開情報] アジェンダ ©2022 ARISE analytics
Reserved. 2 1 Diffusion Probabilistic Model(DPM)とは 2 各計算ステップでの分散の推定 3 サンプリング方法の最適化 4 実験結果
4.
[公開情報] アジェンダ ©2022 ARISE analytics
Reserved. 3 1 Diffusion Probabilistic Model(DPM)とは 2 各計算ステップでの分散の推定 3 サンプリング方法の最適化 4 実験結果
5.
[公開情報] Diffusion Probabilistic Model(DPM)とは ©2022
ARISE analytics Reserved. データにノイズをかけていく処理を逆向きにして、ノイズからデータを作成す るモデル。画像生成分野で注目されている手法の一つ。 4 ? ? ノイズ付与 (順過程) ノイズ除去 (逆過程) 元データに順番に少しずつガウスノイズをかけていく 最終的にはデータがただのガウスノイズになる ただのノイズから少しずつガウスノイズを除去していくことでデータを生成 この過程をニューラルネットなどで学習する データ 処理の途中 ノイズ 今回はAnalytic-DPMの説明にフォーカスするため、基本的な学習方法などの詳細は他の資料を参考にしてくだ さい
6.
[公開情報] DPMの課題 ©2022 ARISE analytics
Reserved. 5 課 題 1 課 題 2 分散の推定が難しい 分散は固定パラメータとするのが一般的 分散を学習パラメータとすると精度が上がる可能性があるが 学習が不安定になることもある サンプリング時の反復計算に時間がかかる ノイズを除去するステップが数千になることもありとても時 間がかかる ノイズ除去のステップをいくつか省略することで解決する方 法が提案されているが、省略する場所をうまく調整する必要 がある
7.
[公開情報] アジェンダ ©2022 ARISE analytics
Reserved. 6 1 Diffusion Probabilistic Model(DPM)とは 2 各計算ステップでの分散の推定 3 サンプリング方法の最適化 4 実験結果
8.
[公開情報] 各ステップで推定する分布の分散の最適解 ©2022 ARISE analytics
Reserved. ※数式は論文の式から変形して掲載 この論文において、各ステップで最適となる正規分布の平均と分散がモデルの 出力から解析的に求められるということが証明された。(証明は省略) 7 ステップ𝒏で の最適な平 均※ ステップ𝒏で の最適な分 散 𝜇𝑛 ∗ 𝑥𝑛 = 𝛼𝑛−1 𝛼𝑛 𝑥𝑛 + 𝛽𝑛 𝛼𝑛−1 𝛼𝑛 + 𝛽𝑛−1 − 𝜆𝑛 2 ∙ 𝛽𝑛 ∇𝑥𝑛 log 𝑞𝑛(𝑥𝑛) 𝜎𝑛 ∗ = 𝜆𝑛 2 + 𝛽𝑛 𝛼𝑛 − 𝛽𝑛−1 − 𝜆𝑛 2 2 1 − 𝛽𝑛𝔼𝑞𝑛 𝑥𝑛 ∇𝑥𝑛 log 𝑞𝑛 𝑥𝑛 2 𝑑 補足 ∇𝑥𝑛 log 𝑞𝑛(𝑥𝑛)はデータの周辺分布の スコア関数 ニューラルネットなどで学習す る 𝛼𝑛は各ステップごとのハイパーパラ メータ 𝛼𝑛 = Π𝑖=1 𝑛 𝛼𝑖 𝛽𝑛 = 1 − 𝛼𝑛 𝜆𝑛 2 = 𝛽𝑛−1 𝛽𝑛 𝛽𝑛 𝑑はデータの次元数
9.
[公開情報] 実際の分散の算出方法 ©2022 ARISE analytics
Reserved. 最適な分散を計算するにはモデル出力の2乗ノルムの平均が必要となる。実際 に計算するときには、モンテカルロ法で2乗ノルムを計算することで分散を導 出することができる。 8 実際の分散 モデル出力 の2乗ノルム の平均 Γ𝑛 = 1 𝑀 𝑚=1 𝑀 𝑠𝑛(𝑥𝑛,𝑚) 2 𝑑 𝜎𝑛 ∗ = 𝜆𝑛 2 + 𝛽𝑛 𝛼𝑛 − 𝛽𝑛−1 − 𝜆𝑛 2 2 1 − 𝛽𝑛Γ𝑛 補足 𝑠𝑛(𝑥𝑛,𝑚)はモデルの出力 𝑀はモンテカルロ法のサンプル数 10~100回ほどで十分 一度そのステップの分散を計算したら、あとの同じステップの計算では結果 を使いまわすことができる
10.
[公開情報] 分散の下限と上限 ©2022 ARISE analytics
Reserved. モデルの近似誤差によっては分散に大きなバイアスがかかる。解析的に求まる 分散の上限値・下限値でクリッピングすることでDPMの精度が向上する。(証 明は省略) 9 分散の上限 と下限 元データの 値の範囲が 𝒂, 𝒃 の場合 𝜆𝑛 2 ≤ 𝜎𝑛 ∗ ≤ 𝜆𝑛 2 + 𝛽𝑛 𝛼𝑛 − 𝛽𝑛−1 − 𝜆𝑛 2 2 𝜎𝑛 ∗ ≤ 𝜆𝑛 2 + 𝛼𝑛−1 − 𝛽𝑛−1 − 𝜆𝑛 2 ∙ 𝛼𝑛 𝛽𝑛 2 𝑏 − 𝑎 2 2
11.
[公開情報] アジェンダ ©2022 ARISE analytics
Reserved. 10 1 Diffusion Probabilistic Model(DPM)とは 2 各計算ステップでの分散の推定 3 サンプリング方法の最適化 4 実験結果
12.
[公開情報] 推論過程の最適化 ©2022 ARISE analytics
Reserved. 学習時のステップ数から推論時のステップ数を適切に減らすことで精度を保ち つつ計算を高速化できる。適切なステップは動的計画法で求めることができる。 11 ステップ数を減らし た時の逆過程 適切なステップを選 択する際に最小化す る式 𝒩 𝑥𝜏𝐾 Πk=1 𝐾 𝒩(𝑥𝜏𝑘−1 |𝜇𝜏𝑘−1|𝜏𝑘 (𝑥𝜏𝐾 ), 𝜎𝜏𝑘−1|𝜏𝑘 2 𝐼) min 𝜏1,…,𝜏𝐾 𝑑 2 𝑘=2 𝐾 log 𝜎∗ 𝜏𝑘−1|𝜏𝑘 2 /𝜆𝜏𝑘−1|𝜏𝑘 2 + 𝑐 𝜏𝑘は元のステップのうちどれか(ただし、𝜏1 = 1) 𝜇𝜏𝑘−1|𝜏𝑘 (𝑥𝜏𝐾 )、 𝜎𝜏𝑘−1|𝜏𝑘 2 はP7の𝑥𝑛を𝑥𝜏𝐾 にしたもの 最小化は動的計画法の一種で解ける(ここでは解き方は省略) ステップ数を𝑵から𝑲にする場合 補足
13.
[公開情報] アジェンダ ©2022 ARISE analytics
Reserved. 12 1 Diffusion Probabilistic Model(DPM)とは 2 各計算ステップでの分散の推定 3 サンプリング方法の最適化 4 実験結果
14.
[公開情報] 指標の比較結果 ©2022 ARISE analytics
Reserved. 既存手法とAnalytic-DPMを様々なシチュエーションで評価。ほとんどの場合 においてAnalytic-DPMが最も優れた結果に。 13 ②FIDでの評価 ①負の対数尤度での評価 サンプリングの方法が確率的 (DDPM)・決定的(DDIM)どち らの場合でも、基本的に Analytic-DPMの方が優れてい た。 既存手法で(ET)と本論文の手 法(OT)でステップを減らした 場合の両方においてAnalytic- DPMの性能が最も高かった。 1 2
15.
[公開情報] 生成した画像の例(もう少し大きい画像が欲しかっ た。。。) ©2022 ARISE analytics
Reserved. 14
16.
[公開情報] 実験用コード(GitHubで公開中) ©2022 ARISE analytics
Reserved. 15 https://github.com/baofff/Analytic-DPM
17.
[公開情報] Best Partner for
innovation, Best Creator for the future.