SlideShare ist ein Scribd-Unternehmen logo
1 von 24
立体音響とインタラクション 
コンピュータ科学専攻五十嵐研究室 
鈴木良平
Basics of Spatial Audio Technologies 
立体音響の基本事項
立体音響とは 
3次元的な音の方向・距離・広がりを 
録音・再生時に再現する手法
通常の録音再生との差異 
モノラル録音では音源定位性が失われる 
∵ マイク一点での振動は空間情報を含まない
通常の録音再生との差異 
ステレオ録音でも音源定位性は完全には再現できない 
∵ マイクと耳の音響特性差, クロストーク, etc.
再現の必要な要素 
鼓膜の振動を完全に再現すること 
• 両耳間強度差 
• 両耳間時間差 
• 周波数特性 
• 位相変化 
• 残響変化 
両耳間の位置差に由来 
⇒ ステレオ録音で得られる 
頭部形状・物性に由来 
⇒ ダミーヘッドまたは計算で再現 
主にホール環境に由来 
⇒ スタジオ構築または計算で再現
方式1:ステレオ/サラウンド 
• 複数スピーカーを用いた立体音響環境 
– 複数本のマイクで収録、それぞれの音声を対応する 
スピーカーから別個に出力する。 
– クロストークおよび周波数特性補償が必要 
※ 家庭用では2-7ch、映画館では5-6ch程度
方式2:バイノーラル再生 
• ステレオヘッドフォンを用いた立体音響環境 
– 両耳の鼓膜に届くべき信号を直接出力する 
– 頭部を模したダミーヘッドを用いた録音が一般的 
• 耳介や頭内、肩などでの反射・回折が反映される 
– 信号合成時にはダミーヘッドに相当する音響特性を 
反映した信号処理を行う
基礎技術:頭部伝達関数(HRTF) 
• 空間中のある位置で発した音の左右鼓膜への 
伝達を特徴付けるインパルス応答関数 
– 頭部や耳介、肩などが原因として関与 
– 事前にモデル化することで、音源配置から 
ヘッドフォン信号への変換関数を構成できる 
引用元:http://en.wikipedia.org/wiki/Head-related_transfer_function
基礎技術:トランスオーラル再生 
• HRTFと同様の発想をスピーカー環境で行う 
1. スピーカーから左右耳への伝達関数を測定(HRTF) 
2. スピーカー間のクロストークを計算 
3. 各耳に聞こえるべき音のみが聞こえるよう 
キャンセリング信号を重畳 
• 商品化の事例あり 
引用元: 
NTT DoCoMoテクニカルジャーナルVol.11 No.1, pp. 55-62, 2003.
Wave-field Synthesis 
• 多数のスピーカー(e.g., >50)を用いて、 
空間内の音場を「まるごと」合成する技術 
– リスナが移動しても正しい聴こえが維持される 
– ホイヘンスの原理の応用 
• 高コストで無響環境が必要、二次元への制約
Applications of Spatial Audio Technologies 
立体音響技術の応用分類
立体音響の応用 
分類軸の設定 
• 立体化は静的に行われるか、動的か 
• コンテンツは実音声か、合成音声か 
Recorded 
① 
Static Dynamic 
② ③ 
Generated 
④
① 静的/ 録音 
• 既存の立体音響コンテンツの大半 
– ドルビーデジタル映画、バイノーラルCDなど 
• 複数のマイクやダミーヘッドで録音、信号処理 
を行い、コンテンツとして提供 
• 5.1chオーディオやヘッドフォン再生に対応
② 静的/ 生成 
• 立体音響レンダリング技術 
– 音源からの伝達をシミュレーションして信号を生成 
– OpenAL, 3DCGソフトウェアなどから利用可能 
• レイトレーシング、特徴予測等による計算 
SoundScape Renderer http://www.explauralisation.org/
③ 動的/ 生成 
• Interactive Sound Propagation Computation 
[Raghuvanshi & Snyder 2014] 
(SIGGRAPH 2014) 
[Schissler et al., 2014] 
(SIGGRAPH 2014)
④ 動的/ 録音 
• ステージ音響シミュレーション 
– コンサートホールのリアルタイムシミュレーション 
東京大学生産研・坂本研究室(応用音響工学)
メディアアートでの利用事例 
大きな耳をもったキツネ(2013) 
evala+鈴木昭男 
8.1ch立体音響を用いた 
実験音楽インスタレーション 
Filmachine (2006) 
渋谷慶一郎+池上高志 
24chのスピーカーによる 
サウンドスケープの自動生成
第三の軸:移動性 
• ユーザーが移動しても音場を正しく表現する 
• 複数のユーザーへのconsistentな音場呈示 
• 実世界内でのモバイルインタラクション 
Mobility
実世界音響インタラクション 
The BoomRoom [Muller et al., 2014] 
(CHI 2014) 
Walk this Way [Hazzard et al., 2014] 
(CHI 2014) 
音楽情報呈示による 
空間ナビゲーション 
Wave Field Synthesis 
+ Tangible Interaction
Discussions 
問題提起
1. 立体音響の今後の応用先 
• コンテンツ制作の現場では、すでに枯れた技術 
– ゲームなどインタラクティブな応用もほぼ確立 
• ユーザーが激しく動く場合、技術的困難がある 
– 携帯端末を用いたモバイルアプリ 
• 極めて多くのスピーカーを用いる場合 
– e.g., 公衆環境でのスマートフォン
2. 立体音響から認知できる情報 
• 音源定位(sound localization)の精度 
• 空間の拡がりや種類 
– 木質の小部屋、コンクリートのトンネルなど 
• 立体音響の認知を適切に記述する言葉とは 
– Physically-correct ⇒ Cognitively-correct 
(cf. Gibson’s 
Ambient Optic Array)
3. 光の再現史との比較 
Still camera Stereo camera Light-field camera 
Primitive arts Perspective Multi-view (cubism)

Weitere ähnliche Inhalte

Was ist angesagt?

Rでisomap(多様体学習のはなし)
Rでisomap(多様体学習のはなし)Rでisomap(多様体学習のはなし)
Rでisomap(多様体学習のはなし)
Kohta Ishikawa
 
パターン認識 第12章 正則化とパス追跡アルゴリズム
パターン認識 第12章 正則化とパス追跡アルゴリズムパターン認識 第12章 正則化とパス追跡アルゴリズム
パターン認識 第12章 正則化とパス追跡アルゴリズム
Miyoshi Yuya
 

Was ist angesagt? (20)

Reinforcement Learning: An Introduction 輪読会第1回資料
Reinforcement Learning: An Introduction 輪読会第1回資料Reinforcement Learning: An Introduction 輪読会第1回資料
Reinforcement Learning: An Introduction 輪読会第1回資料
 
強化学習1章
強化学習1章強化学習1章
強化学習1章
 
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
 
強化学習と逆強化学習を組み合わせた模倣学習
強化学習と逆強化学習を組み合わせた模倣学習強化学習と逆強化学習を組み合わせた模倣学習
強化学習と逆強化学習を組み合わせた模倣学習
 
グラフニューラルネットワーク入門
グラフニューラルネットワーク入門グラフニューラルネットワーク入門
グラフニューラルネットワーク入門
 
ブラックリッターマン法による リスクベースポートフォリオの拡張 ~リスクベースポートフォリオの課題と拡張への取り組み~
ブラックリッターマン法による リスクベースポートフォリオの拡張 ~リスクベースポートフォリオの課題と拡張への取り組み~ブラックリッターマン法による リスクベースポートフォリオの拡張 ~リスクベースポートフォリオの課題と拡張への取り組み~
ブラックリッターマン法による リスクベースポートフォリオの拡張 ~リスクベースポートフォリオの課題と拡張への取り組み~
 
RIC-NN: A Robust Transferable Deep Learning Framework for Cross-sectional Inv...
RIC-NN: A Robust Transferable Deep Learning Framework for Cross-sectional Inv...RIC-NN: A Robust Transferable Deep Learning Framework for Cross-sectional Inv...
RIC-NN: A Robust Transferable Deep Learning Framework for Cross-sectional Inv...
 
【DL輪読会】SUMO: Unbiased Estimation of Log Marginal Probability for Latent Varia...
【DL輪読会】SUMO: Unbiased Estimation of Log Marginal Probability for Latent Varia...【DL輪読会】SUMO: Unbiased Estimation of Log Marginal Probability for Latent Varia...
【DL輪読会】SUMO: Unbiased Estimation of Log Marginal Probability for Latent Varia...
 
マインドフルネスと人工知能
マインドフルネスと人工知能マインドフルネスと人工知能
マインドフルネスと人工知能
 
スパースモデリング
スパースモデリングスパースモデリング
スパースモデリング
 
Rでisomap(多様体学習のはなし)
Rでisomap(多様体学習のはなし)Rでisomap(多様体学習のはなし)
Rでisomap(多様体学習のはなし)
 
SVMについて
SVMについてSVMについて
SVMについて
 
SHAP値の考え方を理解する(木構造編)
SHAP値の考え方を理解する(木構造編)SHAP値の考え方を理解する(木構造編)
SHAP値の考え方を理解する(木構造編)
 
因果探索: 観察データから 因果仮説を探索する
因果探索: 観察データから因果仮説を探索する因果探索: 観察データから因果仮説を探索する
因果探索: 観察データから 因果仮説を探索する
 
ファクター投資と機械学習
ファクター投資と機械学習ファクター投資と機械学習
ファクター投資と機械学習
 
コンピュータービジョンのためのグレブナー基底入門1
コンピュータービジョンのためのグレブナー基底入門1コンピュータービジョンのためのグレブナー基底入門1
コンピュータービジョンのためのグレブナー基底入門1
 
決定木・回帰木に基づくアンサンブル学習の最近
決定木・回帰木に基づくアンサンブル学習の最近決定木・回帰木に基づくアンサンブル学習の最近
決定木・回帰木に基づくアンサンブル学習の最近
 
A summary on “On choosing and bounding probability metrics”
A summary on “On choosing and bounding probability metrics”A summary on “On choosing and bounding probability metrics”
A summary on “On choosing and bounding probability metrics”
 
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
 
パターン認識 第12章 正則化とパス追跡アルゴリズム
パターン認識 第12章 正則化とパス追跡アルゴリズムパターン認識 第12章 正則化とパス追跡アルゴリズム
パターン認識 第12章 正則化とパス追跡アルゴリズム
 

Andere mochten auch

心臓超音波
心臓超音波心臓超音波
心臓超音波
s1180197
 
馬;一次診療における超音波画像診断
馬;一次診療における超音波画像診断馬;一次診療における超音波画像診断
馬;一次診療における超音波画像診断
Tsuda Tomonori
 
超音波通信という怪しい技術 In html5minutes 7 #tritonjs
超音波通信という怪しい技術 In html5minutes 7 #tritonjs超音波通信という怪しい技術 In html5minutes 7 #tritonjs
超音波通信という怪しい技術 In html5minutes 7 #tritonjs
K Kinzal
 

Andere mochten auch (13)

フィルタの世界観
フィルタの世界観フィルタの世界観
フィルタの世界観
 
Jsum87ki016(abus)
Jsum87ki016(abus)Jsum87ki016(abus)
Jsum87ki016(abus)
 
Acoustic Modeling using Deep Belief Networks
Acoustic Modeling using Deep Belief NetworksAcoustic Modeling using Deep Belief Networks
Acoustic Modeling using Deep Belief Networks
 
心臓超音波
心臓超音波心臓超音波
心臓超音波
 
馬;一次診療における超音波画像診断
馬;一次診療における超音波画像診断馬;一次診療における超音波画像診断
馬;一次診療における超音波画像診断
 
[CM2015] Chapter 3 - AGCM
[CM2015] Chapter 3 - AGCM[CM2015] Chapter 3 - AGCM
[CM2015] Chapter 3 - AGCM
 
馬のお産 自然なお産と助産の方法 
馬のお産 自然なお産と助産の方法 馬のお産 自然なお産と助産の方法 
馬のお産 自然なお産と助産の方法 
 
超音波通信という怪しい技術 In html5minutes 7 #tritonjs
超音波通信という怪しい技術 In html5minutes 7 #tritonjs超音波通信という怪しい技術 In html5minutes 7 #tritonjs
超音波通信という怪しい技術 In html5minutes 7 #tritonjs
 
[CM2015] Chapter 2 - Numerical Method
[CM2015] Chapter 2 - Numerical Method[CM2015] Chapter 2 - Numerical Method
[CM2015] Chapter 2 - Numerical Method
 
iOS7アプリ同士の近距離通信どれがいい?
iOS7アプリ同士の近距離通信どれがいい?iOS7アプリ同士の近距離通信どれがいい?
iOS7アプリ同士の近距離通信どれがいい?
 
機器人齊步走 V5 m_bot_mblock
機器人齊步走 V5 m_bot_mblock機器人齊步走 V5 m_bot_mblock
機器人齊步走 V5 m_bot_mblock
 
集束超音波でできること
集束超音波でできること集束超音波でできること
集束超音波でできること
 
超音波を利用した先端研究 ~集束超音波による非接触作用力の応用展開について~
超音波を利用した先端研究 ~集束超音波による非接触作用力の応用展開について~超音波を利用した先端研究 ~集束超音波による非接触作用力の応用展開について~
超音波を利用した先端研究 ~集束超音波による非接触作用力の応用展開について~
 

Ähnlich wie 立体音響とインタラクション

Ähnlich wie 立体音響とインタラクション (6)

多重解像度時間周波数表現に基づく独立低ランク行列分析,
多重解像度時間周波数表現に基づく独立低ランク行列分析,多重解像度時間周波数表現に基づく独立低ランク行列分析,
多重解像度時間周波数表現に基づく独立低ランク行列分析,
 
空気/体内伝導マイクロフォンを用いた雑音環境下における自己発声音強調/抑圧法
空気/体内伝導マイクロフォンを用いた雑音環境下における自己発声音強調/抑圧法空気/体内伝導マイクロフォンを用いた雑音環境下における自己発声音強調/抑圧法
空気/体内伝導マイクロフォンを用いた雑音環境下における自己発声音強調/抑圧法
 
CTCに基づく音響イベントからの擬音語表現への変換
CTCに基づく音響イベントからの擬音語表現への変換CTCに基づく音響イベントからの擬音語表現への変換
CTCに基づく音響イベントからの擬音語表現への変換
 
VR音響のための鏡像法による距離減衰の再現
VR音響のための鏡像法による距離減衰の再現VR音響のための鏡像法による距離減衰の再現
VR音響のための鏡像法による距離減衰の再現
 
楽器音色の主観評価 —多次元尺度法を用いた研究例の紹介—
楽器音色の主観評価 —多次元尺度法を用いた研究例の紹介—楽器音色の主観評価 —多次元尺度法を用いた研究例の紹介—
楽器音色の主観評価 —多次元尺度法を用いた研究例の紹介—
 
Kameoka2016 miru08
Kameoka2016 miru08Kameoka2016 miru08
Kameoka2016 miru08
 

Mehr von Ryohei Suzuki

アナログとはなんだろう。―古くて新しい、もう一つの計算―
アナログとはなんだろう。―古くて新しい、もう一つの計算―アナログとはなんだろう。―古くて新しい、もう一つの計算―
アナログとはなんだろう。―古くて新しい、もう一つの計算―
Ryohei Suzuki
 
Overview of User Interfaces
Overview of User InterfacesOverview of User Interfaces
Overview of User Interfaces
Ryohei Suzuki
 

Mehr von Ryohei Suzuki (20)

Transformer based approaches for visual representation learning
Transformer based approaches for visual representation learningTransformer based approaches for visual representation learning
Transformer based approaches for visual representation learning
 
Paper memo: persistent homology on biological problems
Paper memo: persistent homology on biological problemsPaper memo: persistent homology on biological problems
Paper memo: persistent homology on biological problems
 
Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...
Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...
Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...
 
Basic Concepts of Entanglement Measures
Basic Concepts of Entanglement MeasuresBasic Concepts of Entanglement Measures
Basic Concepts of Entanglement Measures
 
Disentangled Representation Learning of Deep Generative Models
Disentangled Representation Learning of Deep Generative ModelsDisentangled Representation Learning of Deep Generative Models
Disentangled Representation Learning of Deep Generative Models
 
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
 
Report: "MolGAN: An implicit generative model for small molecular graphs"
Report: "MolGAN: An implicit generative model for small molecular graphs"Report: "MolGAN: An implicit generative model for small molecular graphs"
Report: "MolGAN: An implicit generative model for small molecular graphs"
 
等号と不等号の物理学
等号と不等号の物理学等号と不等号の物理学
等号と不等号の物理学
 
Wolf et al. "Graph abstraction reconciles clustering with trajectory inferen...
Wolf et al. "Graph abstraction reconciles clustering with trajectory inferen...Wolf et al. "Graph abstraction reconciles clustering with trajectory inferen...
Wolf et al. "Graph abstraction reconciles clustering with trajectory inferen...
 
コンピュータは知恵熱を出すか?
コンピュータは知恵熱を出すか?コンピュータは知恵熱を出すか?
コンピュータは知恵熱を出すか?
 
身体の中の小宇宙:免疫研究の最前線
身体の中の小宇宙:免疫研究の最前線身体の中の小宇宙:免疫研究の最前線
身体の中の小宇宙:免疫研究の最前線
 
Single-cell pseudo-temporal ordering 近年の技術動向
Single-cell pseudo-temporal ordering 近年の技術動向Single-cell pseudo-temporal ordering 近年の技術動向
Single-cell pseudo-temporal ordering 近年の技術動向
 
Collaborative 3D Modeling by the Crowd
Collaborative 3D Modeling by the CrowdCollaborative 3D Modeling by the Crowd
Collaborative 3D Modeling by the Crowd
 
汝は計算機なりや?
汝は計算機なりや?汝は計算機なりや?
汝は計算機なりや?
 
アナログとはなんだろう。―古くて新しい、もう一つの計算―
アナログとはなんだろう。―古くて新しい、もう一つの計算―アナログとはなんだろう。―古くて新しい、もう一つの計算―
アナログとはなんだろう。―古くて新しい、もう一つの計算―
 
AnnoTone (CHI 2015)
AnnoTone (CHI 2015)AnnoTone (CHI 2015)
AnnoTone (CHI 2015)
 
色字共感覚と書記素学習
色字共感覚と書記素学習色字共感覚と書記素学習
色字共感覚と書記素学習
 
AnnoTone: 高周波音の映像収録時 埋め込みによる編集支援
AnnoTone: 高周波音の映像収録時埋め込みによる編集支援AnnoTone: 高周波音の映像収録時埋め込みによる編集支援
AnnoTone: 高周波音の映像収録時 埋め込みによる編集支援
 
SIGGRAPH 2014 Preview -"Shape Collection" Session
SIGGRAPH 2014 Preview -"Shape Collection" SessionSIGGRAPH 2014 Preview -"Shape Collection" Session
SIGGRAPH 2014 Preview -"Shape Collection" Session
 
Overview of User Interfaces
Overview of User InterfacesOverview of User Interfaces
Overview of User Interfaces
 

立体音響とインタラクション

Hinweis der Redaktion

  1. ヘッドフォンを使っても頭内定位する
  2. ----- 会議メモ (2014/11/12 11:15) ----- 音と物体 口の動き