SlideShare ist ein Scribd-Unternehmen logo
1 von 23
Downloaden Sie, um offline zu lesen
CycleGAN について
Unpaired Image-to-Image Translation using
Cycle-Consistent Adversarial Networks
2018.02.13
hei4
概要
●
論文の紹介
●
GAN の発展
●
CycleGAN の概要
●
実装について
論文の紹介
●
著者: ジュンヤン・ジュー(カリフォルニア大学バークレー校)
●
タイトル:  Unpaired Image-to-Image Translation using
Cycle-Consistent Adversarial Networks
●
カンファレンス:  ICCV (2017)
GANの発展 〜ベーシック
ドメイン Xドメイン Z
x∈X
G(z)=^x∈Xz∈Z
generator
G discriminator
D
D
real / fake
D(G(z))=D( ^x)
D(x)
real / fake
GANの発展 〜DCGAN
笑った女性
(の元の z )
女性
(の元の z )
男性
(の元の z )
笑った男性
(の元の z )
Unsupervised Representation Learning with
Deep Convolutional Generative Adversarial Networks (2015)
●
CNNを導入して安定した画像生成に成功
●
入力 z を指定することで任意の画像を生成可能
●
z の演算によって生成画像の種類を選択可能
GANの発展 〜pix2pix
変換系へのモチベーション
●
生成画像の構図を指定したい
●
画像のコンテンツ(内容)を保ったままスタイル(細部)を変化させたい
●
高精度なスタイル変換に成功
●
学習データは、変換前後のペアであることが必要
●
タスクによっては、学習データをペアで準備することは困難
Image-to-Image Translation with Conditional Adversarial Networks (2016) 著者らの一人に、CycleGANのジュンヤン・ジューも
CycleGANの概要
generator
G
generator
F
generator
G
generator
G
discriminator
DY
discriminator
DX domain
X
domain
Y
●
学習データは、ペアである必要なし
●
生成器と判別器が2組ある構造
CycleGANの概要
DY
X YG
x
y
G(x)
real
fake
CycleGANの概要
X YG
x G(x)
F(G(x))
F
|F(G(x))−x|
reconstruct
reconstruct real
realcycle consistency loss
CycleGANの概要
F
DY
DX
X YG
ハイパーパラメータ:  10
CycleGANの概要
F
DY
DX
X YG
×
×
lossGAN
によって抑制
losscyc
によって抑制
X 以外
CycleGANの概要
F
DY
DX
X YG
●
loss の最小化によって、 CycleGAN は X→Y 、 Y→X の写像および、
X→Y→X 、 Y→X→Y の循環性を持つ
CycleGANの概要
fakereal reconstruct
CycleGANによる変換の一例
CycleGANの概要
CycleGANの概要
ターゲットドメインに
遷移できていない
遷移しているが構図が変化している
モードコラプスに
陥っている
CycleGANの概要
CycleGANの概要
アマゾン・メカニカル・タークでの人による判別
CycleGANの概要
Photo→labels
labels→Photo
CycleGANの概要
Neural Style Transfer
CycleGANの概要
Neural Style Transfer
実装について
CNN CNN Res
Net
Res
Net
CNN CNN... ... ...image image
ダウンサンプリング アップサンプリングResidual-Net
CNN CNN
ダウンサンプリング
image scalar・・・・・・・・・・・・
Generator
Discriminator
実装について
●
loss 中の負対数尤度計算を、誤差二乗和に
●
Adam ソルバー バッチサイズ「1」 (!)
●
学習係数  0.002 @ epoch0 〜 100
   零に向かって徐々に減衰 @ epoch100 〜 200
●
loss の発振を防ぐために、生成画像をバッファリング
 →  Discriminator の学習にはバッファ画像を使用 
まとめ
●
CycleGANは、非ペアの教師データから画像変換を実現
●
他の、非ペア学習の手法に比べて高精度
●
画風変換、彩色変換、写真のフォーカス効果など
 様々なアプリケーションに応用が可能

Weitere ähnliche Inhalte

Was ist angesagt?

[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...Deep Learning JP
 
Deep Learningによる超解像の進歩
Deep Learningによる超解像の進歩Deep Learningによる超解像の進歩
Deep Learningによる超解像の進歩Hiroto Honda
 
敵対的生成ネットワーク(GAN)
敵対的生成ネットワーク(GAN)敵対的生成ネットワーク(GAN)
敵対的生成ネットワーク(GAN)cvpaper. challenge
 
画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイcvpaper. challenge
 
深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについて
深層生成モデルと世界モデル,深層生成モデルライブラリPixyzについて深層生成モデルと世界モデル,深層生成モデルライブラリPixyzについて
深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについてMasahiro Suzuki
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Yusuke Uchida
 
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)Takuma Yagi
 
機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明Satoshi Hara
 
PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門tmtm otm
 
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Yamato OKAMOTO
 
[DL輪読会]Transframer: Arbitrary Frame Prediction with Generative Models
[DL輪読会]Transframer: Arbitrary Frame Prediction with Generative Models[DL輪読会]Transframer: Arbitrary Frame Prediction with Generative Models
[DL輪読会]Transframer: Arbitrary Frame Prediction with Generative ModelsDeep Learning JP
 
【論文読み会】Self-Attention Generative Adversarial Networks
【論文読み会】Self-Attention Generative  Adversarial Networks【論文読み会】Self-Attention Generative  Adversarial Networks
【論文読み会】Self-Attention Generative Adversarial NetworksARISE analytics
 
[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習Deep Learning JP
 
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -tmtm otm
 
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
[DL輪読会]Learning Transferable Visual Models From Natural Language SupervisionDeep Learning JP
 
畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向Yusuke Uchida
 
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...Deep Learning JP
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向Motokawa Tetsuya
 
Bayesian Neural Networks : Survey
Bayesian Neural Networks : SurveyBayesian Neural Networks : Survey
Bayesian Neural Networks : Surveytmtm otm
 

Was ist angesagt? (20)

[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
 
Deep Learningによる超解像の進歩
Deep Learningによる超解像の進歩Deep Learningによる超解像の進歩
Deep Learningによる超解像の進歩
 
敵対的生成ネットワーク(GAN)
敵対的生成ネットワーク(GAN)敵対的生成ネットワーク(GAN)
敵対的生成ネットワーク(GAN)
 
画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ
 
深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについて
深層生成モデルと世界モデル,深層生成モデルライブラリPixyzについて深層生成モデルと世界モデル,深層生成モデルライブラリPixyzについて
深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについて
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
 
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
 
機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明
 
PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門
 
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)
 
[DL輪読会]Transframer: Arbitrary Frame Prediction with Generative Models
[DL輪読会]Transframer: Arbitrary Frame Prediction with Generative Models[DL輪読会]Transframer: Arbitrary Frame Prediction with Generative Models
[DL輪読会]Transframer: Arbitrary Frame Prediction with Generative Models
 
【論文読み会】Self-Attention Generative Adversarial Networks
【論文読み会】Self-Attention Generative  Adversarial Networks【論文読み会】Self-Attention Generative  Adversarial Networks
【論文読み会】Self-Attention Generative Adversarial Networks
 
[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習
 
実装レベルで学ぶVQVAE
実装レベルで学ぶVQVAE実装レベルで学ぶVQVAE
実装レベルで学ぶVQVAE
 
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
 
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
 
畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向
 
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向
 
Bayesian Neural Networks : Survey
Bayesian Neural Networks : SurveyBayesian Neural Networks : Survey
Bayesian Neural Networks : Survey
 

Mehr von yohei okawa

Explainable predictions pattern
Explainable predictions patternExplainable predictions pattern
Explainable predictions patternyohei okawa
 
Model versioning pattern
Model versioning patternModel versioning pattern
Model versioning patternyohei okawa
 
Workflow pipeline pattern
Workflow pipeline patternWorkflow pipeline pattern
Workflow pipeline patternyohei okawa
 
Transform pattern
Transform patternTransform pattern
Transform patternyohei okawa
 
Keyed predictions pattern
Keyed predictions patternKeyed predictions pattern
Keyed predictions patternyohei okawa
 
Batch serving pattern
Batch serving patternBatch serving pattern
Batch serving patternyohei okawa
 
Distribution Strategy pattern
Distribution Strategy patternDistribution Strategy pattern
Distribution Strategy patternyohei okawa
 
Useful Overfitting pattern
Useful Overfitting patternUseful Overfitting pattern
Useful Overfitting patternyohei okawa
 
Multilabel pattern
Multilabel patternMultilabel pattern
Multilabel patternyohei okawa
 
Reframing パターン
Reframing パターンReframing パターン
Reframing パターンyohei okawa
 
はじめての方向け GANチュートリアル
はじめての方向け GANチュートリアルはじめての方向け GANチュートリアル
はじめての方向け GANチュートリアルyohei okawa
 
semantic segmentation サーベイ
semantic segmentation サーベイsemantic segmentation サーベイ
semantic segmentation サーベイyohei okawa
 
Attention-Guided GANについて
Attention-Guided GANについてAttention-Guided GANについて
Attention-Guided GANについてyohei okawa
 
SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎yohei okawa
 

Mehr von yohei okawa (15)

Explainable predictions pattern
Explainable predictions patternExplainable predictions pattern
Explainable predictions pattern
 
Model versioning pattern
Model versioning patternModel versioning pattern
Model versioning pattern
 
Workflow pipeline pattern
Workflow pipeline patternWorkflow pipeline pattern
Workflow pipeline pattern
 
Transform pattern
Transform patternTransform pattern
Transform pattern
 
Keyed predictions pattern
Keyed predictions patternKeyed predictions pattern
Keyed predictions pattern
 
Batch serving pattern
Batch serving patternBatch serving pattern
Batch serving pattern
 
Distribution Strategy pattern
Distribution Strategy patternDistribution Strategy pattern
Distribution Strategy pattern
 
Useful Overfitting pattern
Useful Overfitting patternUseful Overfitting pattern
Useful Overfitting pattern
 
Multilabel pattern
Multilabel patternMultilabel pattern
Multilabel pattern
 
Reframing パターン
Reframing パターンReframing パターン
Reframing パターン
 
20190630_VoVNet
20190630_VoVNet20190630_VoVNet
20190630_VoVNet
 
はじめての方向け GANチュートリアル
はじめての方向け GANチュートリアルはじめての方向け GANチュートリアル
はじめての方向け GANチュートリアル
 
semantic segmentation サーベイ
semantic segmentation サーベイsemantic segmentation サーベイ
semantic segmentation サーベイ
 
Attention-Guided GANについて
Attention-Guided GANについてAttention-Guided GANについて
Attention-Guided GANについて
 
SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎
 

CycleGANについて