3Dマップを活用したVisual Localization

3Dマップを活用した
Visual Localization
2020.6.12
田平創（東京工業大学）

Visual Localizationとは
単眼画像を用いた自己位置 (+姿勢) 情報の推定
自動運転補助ナビゲーションシステム・AR
2

位置候補選択
Visual Localizationとは
データベース (マップ) との照合による段階的な位置・姿勢特定
Given: 位置情報つき画像DB等
3
Given: 近傍の3D構造情報 (SfMモデル等)
位置・姿勢推定位置・姿勢の検証

3Dセンシングによるマップ構築
高精細3Dマップの構築:
4
＋
カラー (RGB) 画像深度 (Depth) 画像局所的な3Dマップ
- LIDAR等により得られるRGBD画像をDBとして収集
- 屋内環境で特に有効
[https://www.google.com/maps, https://velodynelidar.com, https://www.faro.com/]

- 地図情報とのレジストレーション
によるマップ構築
- 10,000,000 points/scan程度の
高精細な3Dマップ
3Dスキャンを活用したマップ構築
5フロアマップ
高精細3Dマップの構築
[E. Wijman and Y. Furukawa, 2017]

- 地図情報とのレジストレーション
によるマップ構築
- 10,000,000 points/scan程度の
高精細な3Dマップ
3Dスキャンを活用したマップ構築
6
高精細3Dマップの構築
- 規模性: 複数フロア・複数建物を内包

Contents
3Dマップを活用した
Visual Localization
- Indoor Visual Localization
- 屋内環境における高精細3Dマップの活用例
- 従来アプローチへの3Dマップの段階的な導入
- 最先端研究と今後の展望
- 深層学習的なアプローチの導入
?
7

Indoor Visual Localization
8
Reference:
- "InLoc: Indoor visual localization with dense matching and view synthesis." In Proc. CVPR, 2018.
- 〃. IEEE Trans. PAMI, 2019 (Early access).
- 大規模屋内環境における3Dマップを用いた自己位置推定. In Proc. SSII2019 (オーディエンス賞・優秀学術賞)

InLoc [H. Taira et al., CVPR2018]
9
大規模屋内環境における自己位置・姿勢推定
Given: RGBD画像群
Input: RGB画像

位置候補選択
InLoc [H. Taira et al., 2018]
Approach: 古典的手法への高精細な3Dマップの導入
10
Given: 位置情報つき画像DB等 Given: 近傍の3D構造情報 (SfMモデル等)

位置候補選択
InLoc [H. Taira et al., 2018]
Approach: 古典的手法への高精細な3Dマップの導入
11
Given: 高精細3Dマップ
- RGBD画像群で構成
- 高粒度の3D構造情報

InLoc pipeline
Input: single RGB image
Output: 6DoF pose in the 3D map
12

InLoc pipeline
NetVLAD (画像検索)
[Arandjelović CVPR 2016]
Image retrieval
…
Top 100 retrieved database images
13
RGBD image database

InLoc pipeline
Image retrieval
Geometric verification: 特徴マッチングを用いたre-ranking
…
14
RGBD image database

InLoc pipeline
Image retrieval
…
15
RGBD image database

InLoc pipeline
Image retrieval
10 candidate images
16
RGBD image database

InLoc pipeline
Image retrieval
3Dマップと特徴マッチングを利用した6自由度姿勢推定
Pose estimation
17
10 candidate poses
RGBD image database

InLoc pipeline
Pose verification
高精細3Dマップを活用した位置・姿勢の決定
Pose estimationImage retrieval
18
RGBD image database

InLoc pipeline
Pose verification
Error mapRendered views
Original image
Candidate poses
19

InLoc pipeline
Image retrieval
Input: single RGB image
Pose estimation Pose verification
Output: 6DoF pose in the 3D map
20

Evaluation Pose verification
(高精細3Dマップ)
画像検索 (RGB画像)
姿勢推定 (RGBD画像)
Sparse feature baseline
[Arandjelović, ACCV2014]
InLoc (ours)
21
Validation:
累積誤差分布 @InLoc dataset
[田平ら、SSII2018]
3Dマップを段階的に導入して効果を確認:
- 画像検索を用いた位置特定
- 密な特徴マッチングによる3Dマップの効率的な活用
- 高精細な3Dマップを活用した姿勢検証

従来手法提案手法
(InLoc)
16.37𝑚, 92.22° 𝟎. 𝟏𝟑𝒎, 𝟏. 𝟕𝟑°
Evaluation
Visualization: 推定結果を用いた3Dモデル投影
入力画像
(InLoc)
3.23𝑚, 140.32° 𝟎. 𝟏𝟔𝒎, 𝟏. 𝟓𝟗°
DB画像 (姿勢推定)
合成画像 (投影)
位置・姿勢誤差
(InLoc)
9.92𝑚, 114.03° 𝟎. 𝟎𝟖𝒎, 𝟏. 𝟓𝟐°
●: 姿勢推定時の対応点

最先端研究と今後の展望
23

Visual Localizationへの深層学習導入
古典的手法: 各ステップごとにデザインされた手順を活用
24
Given: 位置情報つき画像DB等 Given: 近傍の3D構造情報 (SfMモデル等)
位置候補選択位置・姿勢推定位置・姿勢の検証

Visual Localizationへの深層学習導入
学習ベースのアプローチ: 全ステップまたは一部ステップを
学習可能なモデルに置き換え
25
姿勢抽出器 (Convolutional Neural Networkモデル等)
Given: 学習用データベース
- 画像 + 真値情報 (姿勢情報等)
Input Output: 推定姿勢
勾配計算
位置候補選択位置・姿勢推定位置・姿勢の検証

深層学習を導入したVisual Localization
PoseNet [A. Kendall et al., 2015]
3Dマップを学習DBとしてCNN姿勢推定器 (GoogleNet) を学習
26
- 画像 + 真値情報 (姿勢情報等)
…
GoogleNet
勾配計算:
姿勢パラメータL2ロス
Input (学習): 単眼画像

PoseNet [A. Kendall et al., 2015]
3Dマップを学習DBとしてCNN姿勢推定器 (GoogleNet) を学習
27
姿勢推定器ベンチマーク [A. kendall and R. Cipolla, 2017]
古典的手法

DSAC [E. Brachmann et al., 2017]
3Dマップの姿勢情報+局所3Dマップを利用して3Dマップ再現器と姿勢検証器を学習
28
- 画像 + 真値情報 (姿勢情報+局所3Dマップ)
① 入力画像に対する3Dマップ再現 ② 姿勢候補の検証
勾配計算 (局所3Dマップ) 勾配計算 (姿勢情報)

DSAC [E. Brachmann et al., 2017]
3Dマップの姿勢情報+局所3Dマップを利用して3Dマップ再現器と姿勢検証器を学習
29
姿勢推定器ベンチマーク [E. Brachmann and C. Rother, 2018]
古典的手法
古典的手法に対して精度面でも
同程度の性能を達成

InLoc++ [H. Taira et al., 2019]
学習済み深層学習モデルから得られるマルチドメインの情報をPose verificationに活用
30
InLoc: 74.2%@2m
InLoc++: 80.6%@2m
高精細3Dマップ
InLoc: カラー画像 (RGB) との整合性評価
Surface normal
Semantic label

まとめ・今後の展望
• 古典的Visual Localizationへの3Dマップの導入
• InLoc [Taira et al., 2018]: 3つのステップで段階的に3Dマップを活用
• 3Dマップを利用した仮想視点生成等で頑健な自己位置・姿勢推定を実現
• 深層学習モデル学習時の3Dマップ活用
• End-to-endでのブラックボックス化: [Kendall et al., 2015]
• 追加情報活用による精度向上 [Brahmbhatt et al., 2018]
• 姿勢初期値としての応用？
• 単一ステップのCNNモデル構成: コンパクトな問題設定で高精度な推定を実現
• 古典的姿勢推定手法との結合 [Brachmann et al., 2017]
• 局所3Dマップと姿勢の同時推定・整合性評価 [Ummenhofer et al., 2017]
• 未学習シーンへの一般化、大規模シーンへの対応、頑健性向上 etc.
31

References
[1] Taira, Hajime, et al. "InLoc: Indoor visual localization with dense matching and view synthesis." Proceedings
of the IEEE Conference on Computer Vision and Pattern Recognition. 2018.
[2] 田平創, 荻野凌, 岩田健太郎, Torsten Sattler, Josef Sivic, Tomas Pajdla, 鳥居秋彦, 奥富正敏. 大規模visual
localization の実用化に向けた評価用データセットの作成. 第24回画像センシングシンポジウム, 2018.
[3] 田平創, Torsten Sattler, Josef Sivic, Tomas Pajdla, 鳥居秋彦, 奥富正敏. 大規模屋内環境における3Dマップを用い
た自己位置推定. 第25回画像センシングシンポジウム, 2019.
[4] Kendall, Alex, Matthew Grimes, and Roberto Cipolla. "Posenet: A convolutional network for real-time 6-dof
camera relocalization." Proceedings of the IEEE international conference on computer vision. 2015.
[5] Kendall, Alex, and Roberto Cipolla. "Geometric loss functions for camera pose regression with deep
learning." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017.
[6] Brachmann, Eric, et al. "Dsac-differentiable ransac for camera localization." Proceedings of the IEEE
Conference on Computer Vision and Pattern Recognition. 2017.
[7] Brachmann, Eric, and Carsten Rother. "Learning less is more-6d camera localization via 3d surface
regression." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018.
[8] Brahmbhatt, Samarth, et al. "Geometry-aware learning of maps for camera localization." Proceedings of the
IEEE Conference on Computer Vision and Pattern Recognition. 2018.
[9] Ummenhofer, Benjamin, et al. "Demon: Depth and motion network for learning monocular
stereo." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017.
32

3Dマップを活用したVisual Localization

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (20)

Ähnlich wie 3Dマップを活用したVisual Localization

Ähnlich wie 3Dマップを活用したVisual Localization (20)

Kürzlich hochgeladen

Kürzlich hochgeladen (12)

3Dマップを活用したVisual Localization

Hinweis der Redaktion