SlideShare ist ein Scribd-Unternehmen logo
1 von 16
Downloaden Sie, um offline zu lesen
DeepSDF: Learning Continuous Signed Distance
Functions for Shape Representation
著者: J. J. Park, P. Florence, J. Straub,
R. Newcombe, S. Lovegrove
資料作成:千葉直也(東北大)
1
http://xpaperchallenge.org/cv
DeepSDF
• Signed Distance Function (SDF)を
直接学習することで三次元形状を
取り扱うネットワーク
– 形状をコード化して形状ごとのSDFを学習
– モデルサイズが小さい
– Codeの決め方に工夫(Auto-decoder)
三次元形状の記述手法
3
• 点群
– PointNet系が爆発的に普及
– トポロジーを維持しない
• メッシュ
– データ構造が比較的複雑であるため,
NNでの取り扱いが難しい
• ボクセル
– 解像度に対するメモリ効率が悪い
(高解像度なデータが扱えない)
SDFとは
4
• Signed Distance Function
𝑓 𝒙 ቐ
> 0(物体の外側)
= 0(物体の表面)
< 0(物体の内側)
画像: Wikipediaより
物体の形
SDF=0
SDFとは
5
• Signed Distance Function
– 各点での,表面までの距離と内側か外側かの
情報のみを扱うため,3Dでもそのまま定義可能
– レイキャスティング,マーチングキューブなどで
可視化が可能
SDFの嬉しさ
6
• 軽量なネットワークで高精度な3D表現が可能
– 任意の点での「表面までの距離」が得られるので,
理想的にはいくらでも高解像な形状を得られる
それぞれ左: 入力形状,右: DeepSDFによって再構築された形状
DeepSDF
7
• 基本的なアイデア
=形状を関数+パラメータで表現・記述
単一物体の場合
𝜽: NNのパラメータ
𝑓𝜽 𝒙 = 𝑆𝐷𝐹(𝒙) : 単一形状を表すSDF
ある点𝒙でのSDFを返す関数になるよう, 𝜽を学習
DeepSDF
8
• 基本的なアイデア
=形状を関数+パラメータで表現・記述
複数形状の場合: 形状に対応するCodeも入力
𝜽: NNのパラメータ
𝒛𝑖: 形状𝑖を表すCode
𝑓𝜽 𝒛𝑖, 𝒙 = 𝑆𝐷𝐹 𝑖(𝒙) : 形状𝑖を表すSDF
DeepSDF
9
• 基本的なアイデア
=形状を関数+パラメータで表現・記述
複数形状の場合: 形状に対応するCodeも入力
𝜽: NNのパラメータ
𝒛𝑖: 形状𝑖を表すCode
𝑓𝜽 𝒛𝑖, 𝒙 = 𝑆𝐷𝐹 𝑖(𝒙) : 形状𝑖を表すSDF
要するに,形状そのものではなくSDFとして
三次元形状を陰的に保持するように学習
DeepSDF
ネットワークの構成
– SDF自体を学習するため,ネットワークの構造は
シンプル
– 基本的には単純なMLP
形状を表現するコード
三次元点 SDFの出力値
Representation Learning
11
• GANs
– 幅広い応用例,特に2D画像
– 敵対的学習であるため不安定
• AEs, VAEs
– 3Dでの応用例が多数
• Auto-decoder
– まずデータセットでDecoderと
Latent Vectorを同時に学習
– 新たなデータに対しては,Decoderを固定し
Latent Vectorを最適化
DeepSDF
コードの決め方: Auto-decoder
– エンコーダーを置かず,直接コードを最適化
(Backprop.)
– 推論時はMAP推定で形状からコードに変換できる
形状を表現する
コード
SDF
学習
13
• 大量のSDFのサンプル点を生成
– ある一つの形状に対して500,000点サンプリング
– 表面付近で特にサンプル密度が高くなるように
– 中外の区別をするため,等間隔の仮想カメラで
レンダリングして表側を判定
実験
14
• 結果として示されている実験
– 学習したデータを表現できるか
– 未知形状を表現できるか
– 全周形状の推定
• 片面の深度画像からコードを推定して形状を再構築
– Latent Spaceでの形状補間
形状補間の例
実験結果の例
15
• 片面点群からの全周形状推定
入力点群 推定結果 正解データ 比較手法
関連論文
16
• CVPR2019
– DeepSDF: Learning Continuous Signed Distance Functions for
Shape Representation
• Jeong Joon Park, Peter Florence, Julian Straub, Richard Newcombe,
Steven Lovegrove
– Occupancy Networks: Learning 3D Reconstruction in Function
Space
• Lars Mescheder, Michael Oechsle, Michael Niemeyer, Sebastian
Nowozin, Andreas Geiger
– Learning Implicit Fields for Generative Shape Modeling
• Zhiqin Chen, Hao Zhang
同時多発的に近いアイデアが出てきた
皆川さんの発表でも同じ論文をピックアップ
(いつも良質な資料をありがとうございます)
https://www.slideshare.net/takmin/20190706cvpr20193dshaperepresentation-153989245

Weitere ähnliche Inhalte

Was ist angesagt?

画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量
takaya imai
 

Was ist angesagt? (20)

SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
 
20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation
 
[DL輪読会]Dream to Control: Learning Behaviors by Latent Imagination
[DL輪読会]Dream to Control: Learning Behaviors by Latent Imagination[DL輪読会]Dream to Control: Learning Behaviors by Latent Imagination
[DL輪読会]Dream to Control: Learning Behaviors by Latent Imagination
 
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
 
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
 
「世界モデル」と関連研究について
「世界モデル」と関連研究について「世界モデル」と関連研究について
「世界モデル」と関連研究について
 
[DL輪読会] マルチエージェント強化学習と心の理論
[DL輪読会] マルチエージェント強化学習と心の理論[DL輪読会] マルチエージェント強化学習と心の理論
[DL輪読会] マルチエージェント強化学習と心の理論
 
3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)
 
Transformer メタサーベイ
Transformer メタサーベイTransformer メタサーベイ
Transformer メタサーベイ
 
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)
 
EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monoc...
EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monoc...EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monoc...
EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monoc...
 
Visual slam
Visual slamVisual slam
Visual slam
 
[DL輪読会]Neural Radiance Flow for 4D View Synthesis and Video Processing (NeRF...
[DL輪読会]Neural Radiance Flow for 4D View Synthesis and Video  Processing (NeRF...[DL輪読会]Neural Radiance Flow for 4D View Synthesis and Video  Processing (NeRF...
[DL輪読会]Neural Radiance Flow for 4D View Synthesis and Video Processing (NeRF...
 
画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ
 
画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量
 
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
 
[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision
 
Direct Sparse Odometryの解説
Direct Sparse Odometryの解説Direct Sparse Odometryの解説
Direct Sparse Odometryの解説
 
[DL輪読会]A Higher-Dimensional Representation for Topologically Varying Neural R...
[DL輪読会]A Higher-Dimensional Representation for Topologically Varying Neural R...[DL輪読会]A Higher-Dimensional Representation for Topologically Varying Neural R...
[DL輪読会]A Higher-Dimensional Representation for Topologically Varying Neural R...
 
[DL輪読会]BANMo: Building Animatable 3D Neural Models from Many Casual Videos
[DL輪読会]BANMo: Building Animatable 3D Neural Models from Many Casual Videos[DL輪読会]BANMo: Building Animatable 3D Neural Models from Many Casual Videos
[DL輪読会]BANMo: Building Animatable 3D Neural Models from Many Casual Videos
 

Kürzlich hochgeladen

Kürzlich hochgeladen (12)

Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 

【CVPR 2019】DeepSDF: Learning Continuous Signed Distance Functions for Shape Representation