Start
Entdecken
Suche senden
Hochladen
Einloggen
Registrieren
Anzeige
【DL輪読会】HexPlaneとK-Planes
Melden
Deep Learning JP
Folgen
Deep Learning JP
17. Feb 2023
•
0 gefällt mir
0 gefällt mir
×
Sei der Erste, dem dies gefällt
Mehr anzeigen
•
928 Aufrufe
Aufrufe
×
Aufrufe insgesamt
0
Auf Slideshare
0
Aus Einbettungen
0
Anzahl der Einbettungen
0
Check these out next
[DL輪読会]Transframer: Arbitrary Frame Prediction with Generative Models
Deep Learning JP
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
Deep Learning JP
【DL輪読会】ViT + Self Supervised Learningまとめ
Deep Learning JP
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
Deep Learning JP
StyleGAN解説 CVPR2019読み会@DeNA
Kento Doi
【DL輪読会】WIRE: Wavelet Implicit Neural Representations
Deep Learning JP
Introduction to YOLO detection model
Takamitsu Oomasa
畳み込みニューラルネットワークの高精度化と高速化
Yusuke Uchida
1
von
20
Top clipped slide
【DL輪読会】HexPlaneとK-Planes
17. Feb 2023
•
0 gefällt mir
0 gefällt mir
×
Sei der Erste, dem dies gefällt
Mehr anzeigen
•
928 Aufrufe
Aufrufe
×
Aufrufe insgesamt
0
Auf Slideshare
0
Aus Einbettungen
0
Anzahl der Einbettungen
0
Jetzt herunterladen
Downloaden Sie, um offline zu lesen
Melden
Technologie
2023/2/17 Deep Learning JP http://deeplearning.jp/seminar-2/
Deep Learning JP
Folgen
Deep Learning JP
Anzeige
Anzeige
Anzeige
Recomendados
【メタサーベイ】Neural Fields
cvpaper. challenge
1.5K Aufrufe
•
46 Folien
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
Deep Learning JP
930 Aufrufe
•
12 Folien
[DL輪読会]A Higher-Dimensional Representation for Topologically Varying Neural R...
Deep Learning JP
1K Aufrufe
•
24 Folien
画像生成・生成モデル メタサーベイ
cvpaper. challenge
7.7K Aufrufe
•
118 Folien
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII
3.3K Aufrufe
•
40 Folien
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
Deep Learning JP
3.6K Aufrufe
•
23 Folien
Más contenido relacionado
Presentaciones para ti
(20)
[DL輪読会]Transframer: Arbitrary Frame Prediction with Generative Models
Deep Learning JP
•
1.1K Aufrufe
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
Deep Learning JP
•
1K Aufrufe
【DL輪読会】ViT + Self Supervised Learningまとめ
Deep Learning JP
•
3.1K Aufrufe
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
Deep Learning JP
•
791 Aufrufe
StyleGAN解説 CVPR2019読み会@DeNA
Kento Doi
•
8.2K Aufrufe
【DL輪読会】WIRE: Wavelet Implicit Neural Representations
Deep Learning JP
•
385 Aufrufe
Introduction to YOLO detection model
Takamitsu Oomasa
•
60.2K Aufrufe
畳み込みニューラルネットワークの高精度化と高速化
Yusuke Uchida
•
63.5K Aufrufe
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
Yusuke Uchida
•
9K Aufrufe
High-impact Papers in Computer Vision: 歴史を変えた/トレンドを創る論文
cvpaper. challenge
•
5.4K Aufrufe
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜
SSII
•
5.9K Aufrufe
点群深層学習 Meta-study
Naoya Chiba
•
10.3K Aufrufe
【DL輪読会】EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Pointsfor...
Deep Learning JP
•
593 Aufrufe
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Yusuke Uchida
•
13.9K Aufrufe
【DL輪読会】Decoupling Human and Camera Motion from Videos in the Wild (CVPR2023)
Deep Learning JP
•
401 Aufrufe
[DL輪読会]相互情報量最大化による表現学習
Deep Learning JP
•
7.1K Aufrufe
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
Deep Learning JP
•
3.5K Aufrufe
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
Deep Learning JP
•
926 Aufrufe
近年のHierarchical Vision Transformer
Yusuke Uchida
•
12K Aufrufe
Semi supervised, weakly-supervised, unsupervised, and active learning
Yusuke Uchida
•
6.1K Aufrufe
Más de Deep Learning JP
(20)
【DL輪読会】Flow Matching for Generative Modeling
Deep Learning JP
•
656 Aufrufe
【DL輪読会】GPT-4Technical Report
Deep Learning JP
•
800 Aufrufe
【DL輪読会】Emergent World Representations: Exploring a Sequence ModelTrained on a...
Deep Learning JP
•
184 Aufrufe
【DL輪読会】Reward Design with Language Models
Deep Learning JP
•
542 Aufrufe
【DL輪読会】Foundation Models for Decision Making: Problems, Methods, and Opportun...
Deep Learning JP
•
233 Aufrufe
【DL輪読会】One-Shot Domain Adaptive and Generalizable Semantic Segmentation with ...
Deep Learning JP
•
161 Aufrufe
【DL輪読会】DiffRF: Rendering-guided 3D Radiance Field Diffusion [N. Muller+ CVPR2...
Deep Learning JP
•
320 Aufrufe
【DL輪読会】Hyena Hierarchy: Towards Larger Convolutional Language Models
Deep Learning JP
•
741 Aufrufe
【DL輪読会】Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Mo...
Deep Learning JP
•
1K Aufrufe
【DL輪読会】Segment Anything
Deep Learning JP
•
1.7K Aufrufe
【DL輪読会】Is Conditional Generative Modeling All You Need For Decision-Making?
Deep Learning JP
•
232 Aufrufe
【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCH
Deep Learning JP
•
226 Aufrufe
【DL輪読会】Bridge-Prompt: Toward Ordinal Action Understanding in Instructional Vi...
Deep Learning JP
•
316 Aufrufe
【DL輪読会】SDEdit: Guided Image Synthesis and Editing with Stochastic Differentia...
Deep Learning JP
•
330 Aufrufe
【DL輪読会】Diffusion Policy: Visuomotor Policy Learning via Action Diffusion
Deep Learning JP
•
445 Aufrufe
【DL輪読会】Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Mo...
Deep Learning JP
•
587 Aufrufe
【DL輪読会】Toolformer: Language Models Can Teach Themselves to Use Tools
Deep Learning JP
•
1.1K Aufrufe
【DL輪読会】DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Dri...
Deep Learning JP
•
698 Aufrufe
【DL輪読会】HyperTree Proof Search for Neural Theorem Proving
Deep Learning JP
•
286 Aufrufe
【DL輪読会】StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-I...
Deep Learning JP
•
384 Aufrufe
Anzeige
Último
(20)
①【麦吉尔大学毕业证文凭学位证书|工艺完美复刻】
love445ds
•
2 Aufrufe
Oracle Cloud Infrastructure:2023年5月度サービス・アップデート
オラクルエンジニア通信
•
25 Aufrufe
UAV写真・レーザー測量test.pptx
ssuserb48d2b1
•
13 Aufrufe
SoftwareControl.pdf
ssusercd9928
•
15 Aufrufe
CDLEハッカソン2022参加報告.pdf
SHOIWA1
•
0 Aufrufe
①【戴尔豪斯大学毕业证文凭学位证书|工艺完美复刻】
love445ds
•
2 Aufrufe
PCベース制御による集中制御.pdf
ssusercd9928
•
19 Aufrufe
Omnis
DaisukeFujita10
•
11 Aufrufe
統計学の攻略_統計的仮説検定の9パターン.pdf
akipii Oga
•
27 Aufrufe
①【威斯康星大学麦迪逊分校毕业证文凭学位证书|工艺完美复刻】
C25lokh12
•
3 Aufrufe
統計学の攻略_推測統計学の考え方.pdf
akipii Oga
•
28 Aufrufe
JSTQB_テストプロセスの概念モデル.pdf
akipii Oga
•
28 Aufrufe
Üslup ve tercüme.pdf
1Hmmtks
•
2 Aufrufe
☀️【卡尔顿大学毕业证成绩单留学生首选】
15sad
•
2 Aufrufe
【2023年5月】平成生まれのためのUNIX&IT歴史講座
法林浩之
•
16 Aufrufe
ChatGPT以後の時代をどう生きるか PWA Night vol.51
hedachi
•
57 Aufrufe
☀️【杜兰大学毕业证成绩单留学生首选】
2125nuh
•
2 Aufrufe
第2回Matlantis User Conference_20230421_久間薫先生
Matlantis
•
281 Aufrufe
20230523_IoTLT_vol99_kitazaki_v1.pdf
Ayachika Kitazaki
•
99 Aufrufe
GitHub Copilotとともに次の開発体験へ
Kazumi IWANAGA
•
15 Aufrufe
【DL輪読会】HexPlaneとK-Planes
DEEP LEARNING JP [DL
Papers] 論文紹介: HexPlaneとK-Planes Ryosuke Ohashi, bestat Inc. http://deeplearning.jp/
書誌情報① 2 - arxivプレプリント (2023/1/23) -
matrix-vector分解を(3+1)Dに応用&改良 - 動画のRF化時間短縮
書誌情報② 3 - arxivプレプリント (2023/1/24) -
tri-plane表現を(3+1)Dに応用&改良 - 動画のRF化時間短縮
背景:場,信号 4 空間・時空間に広がる何らかの物理量のこと 場や信号は,空間Xから物理量の値域Yへの関数として書ける 平面上の磁場 https://en.wikipedia.org/wiki/Vector_field M: R^2 →
R^2 M(x, y) = (M_x, M_y)
背景:場,信号の例 5 RGB画像 I: R^2 →
R^3 I(u, v) = (I_R, I_G, I_B) 輝度場 (Radiance Field,以下RF) c: R^3 x S^2 → R^3 c(r, d) = (c_R, c_G, c_B) https://www.matthewtancik.com/nerf 謎のガスが各方向にいろんな色の光を発しているイメージ
背景:DyNeRF 6 “Neural 3D Video
Synthesis from Multi-view Video” T. Li et al. (CVPR2022) 動画のRF化に関する論文 綺麗に作れるが,最適化にとても時間がかかる
背景:パラメトリック関数 vs グリッド 7 場・信号の関数近似方法 ①パラメトリック関数 -
パラメーター数が少ない - 遅い - 扱いが難しい ②グリッド(ルックアップテーブル) - パラメーター数が多い - 高速 - 扱いが簡単 https://mathworld.wolfram.com/FourierSeries.html Fourier級数展開 vs 折れ線グラフ
8 静的シーンのRF化では,グリッドベース手法が主流化している DVGO, Plenoxels, EG3D,
Instant-NGP, TensoRF, ... → 動画のRF化もグリッドベースでやりたい!! 背景:グリッドベースでやりたい
問題:N^4 9 とはいえ,時空間のグリッド化はメモリ消費量が非現実的 - 空間方向を512分割(5mの範囲を1cm刻み) - 時間方向を512分割(60sec
* 10FPS) → 512^4 * 4byte = 256GB
解決方法:テンソル分解 10 HexPlaneやK-Planesでは,テンソル分解を使うアプローチが採用 されている 直観的には,高次元の量を低次元の量の積で分解表示する,というイメージ
K-Planes 11 ①動画の場合,XY, YZ, ZX,
XT, YT, ZT平面に特徴グリッドを設ける → 512分割の場合,6 * 512^2 * 4byte = 6MB ②(x, y, z, t)に対し,各平面に射影した点から特徴を拾ってきて要素 毎積をとり,MLPに流す
K-Planes:積をとるのが大事 12 各平面から拾ってきた特徴の和をとると,局在するシグナルの表現が難しい 積をとれば容易に表現可能
K-Planes:積をとるのが大事 13 特徴の積をとる方式だと,MLPを線形にしても高い性能がでる
K-Planes:実験結果 14 ←特定データセットでの値のため,全データセット平均ならもっと高いはず,らしい 短時間で良い感じに動画をRF化できている ↓マルチビュー動画 ↑旅行者が撮った時間・天気が違う多視点画像
HexPlane 15 最終的に提案しているアーキテクチャはK-Planesと本質的には同じ TensoRFに基づき,matrix-vector分解を出発点にいろいろ考察・比 較実験している
HexPlane:matrix-vector分解 16 matrix-vector分解 XY平面上の特徴とZ軸上の特徴の積 YZ … X
… ZX … Y … を使ってXYZ空間上の特徴をつくる “TensoRF: Tensorial Radiance Fields” A. Chen et al. https://arxiv.org/abs/2203.09517
HexPlane:アーキテクチャ 17 交差が0次元になる平面ペアでのみ積をとっている
HexPlane:やはり積をとるのが大事 18 Fusion-Two(左図の+のとこ)で積をとると,平面 の交差が1次元になり局在化しきらないので,Fusion- Oneで積をとるより弱い?
HexPlane:実験結果 19 短時間で良い感じに動画をRF化できている
まとめ・雑感 20 まとめ - テンソル分解することで動画のときでもグリッドベース手法が使える - 現実的な時間でいい感じに動画をRF化できて嬉しい 雑感 -
積をとるとシグナルを局在化しやすくて良い,という気付きはパラメトリック関数を使うとき にも有用そう - ハッシュグリッドを使う場合に,2Dハッシュグリッドに分解したほうがコリジョンが緩和され ないか? - ほぼ同じタイミングで根本的に同じアイデアの論文が出てたのが面白かった
Hinweis der Redaktion
Beyond Reward Based End-to-End RL: Representation Learning and Dataset Optimization Perspective
Anzeige