【文献紹介】Predictive regression modeling with MEG

研究室輪読第12回
“Predictive regression modeling with MEG/EEG:
from source power to signals and cognitive states”
2023/2/17
仲井佑友輔

論⽂概要
• EEG/MEG で⽪質電流源推定を⾏わずに回帰問題を解くための⼿法を⽐較した論⽂
• 観測信号から適切な説明変数を⽣成する⼿法に焦点を当てる（回帰⼿法やパラメータ探索にはフォーカスしない）
• 従来⼿法：各観測信号のパワーを説明変数とする⼿法 (“diag”)
❌ 観測信号間の相関を考慮できていない
• 提案⼿法：観測信号が統計的に無相関なソース信号の線形和で表せると仮定したモデル
① Upper: 観測信号の共分散⾏列の上三⾓成分を説明変数とする（線形モデルに対応）
② Riemann: 観測信号の共分散⾏列をリーマン平⾯上で⽩⾊化する（対数モデルに対応）
③ SPoC: 説明変数との相関係数を最⼤化するような重み付けで観測信号を線形変換（任意のモデルに対応）
• 実験：シミュレーション + EEG/MEG データによる 3 種類の実験
• 結果：提案⼿法が概して従来⼿法を上回る推定精度に
• SPoC は被験者内の回帰に強く，少ない特徴量で推定が可能
• Riemann は被験者間のばらつきやランク落ちに頑健
2
*図などは基本的に元論⽂から引⽤している．

⽬的：EEG/MEG 観測データ 𝑿 から⽬的変数 𝑦 を推定
• 観測信号：𝑿! = 𝒙! 1 , 𝒙! 2 , …, 𝒙! 𝑡 , …, 𝒙! 𝑇
• 𝑃 チャンネル数 × 𝑇 次元，𝑖 = 1, … , 𝑁
• ⽬的変数：𝑦!（連続スカラー値）
• 脳内の電流源強度：𝒛!(𝑡)
⽪質電流源推定を⽤いた推定⽅法
1. マクスウェル⽅程式を満たすようなリードフィールド⾏列を MRI から取得し，⽪質電流源推定を⾏う
2. 𝒛!(𝑡) から 𝑦! を最⼩ノルム推定 (Minimum Norm Estimates: MNE)
❌ ⽪質電流源推定は劣決定問題，⼀般に解くことが難しい
❌ コストのかかる MRI でのデータ取得や EEG/MEG の専⾨的な知識に基づいた前処理が必要
→ ⽣物物理学的なモデリングを⾏うことなく回帰モデルを設定したい
以降では⽪質電流源を⾏わない回帰モデルについて，複数の⼿法を⽐較する
Introduction & A priori knowledge
3

観測信号が統計的に無相関な 𝑄(< 𝑃) 個のソース信号の重ね合わせとする
• 観測信号：𝑿! = 𝒙! 1 , 𝒙! 2 , …, 𝒙! 𝑡 , …, 𝒙! 𝑇
• ⽬的変数：𝑦!（連続スカラー値）
• ソース信号：𝒔! 𝑡 = 𝑠!,# 𝑡 , …, 𝑠!,$ 𝑡
%
• 𝑄 次元ベクトル， 𝑄 個のソース信号は互いに無相関
• ソース信号のパワー：𝒑! = 𝑝!,#, …, 𝑝!,$
&
=
1
𝑇
2
!'#
&
𝒔! 𝑡 (
⽬的変数はソース信号のパワーで以下のような回帰モデルで表せると仮定
(𝑓 = 𝑖𝑑𝑒𝑛𝑡𝑖𝑡𝑦, log )
ソース信号は直接観測できないため，観測信号を使って近似的な回帰モデルを作る
問題設定
4

① “diag”
各観測信号のパワー
+
,
∑-.+
,
𝒙/ (𝑡)0
を説明変数 𝒗/ とする⼿法
𝒗/ = 𝑓
1
𝑇
+
-.+
,
𝒙/ (𝑡)0
(𝑓 = 𝑖𝑑𝑒𝑛𝑡𝑖𝑡𝑦)
🤔 観測信号の相関が考慮されていない？
Baseline
5

観測信号の相関を考慮，統計的に無相関な 𝑄 個のソース信号の重ね合わせで定式化
• 観測信号：𝑿! = 𝒙! 1 , 𝒙! 2 , …, 𝒙! 𝑡 , …, 𝒙! 𝑇
• ソース信号：𝒔! 𝑡 = 𝑠!,# 𝑡 , …, 𝑠!,$ 𝑡
%
• 𝑄 次元ベクトル， 𝑄 個のソース信号は互いに無相関
• チャンネルノイズ：𝒏!(𝑡)
このとき，観測信号とソース信号は以下のように表せる
𝒙! 𝑡 = 𝑨𝒔 𝒔! 𝑡 + 𝒏! 𝑡
さらに，チャンネルノイズを複数 (𝑃 − 𝑄 個) のノイズ* の重ね合わせと仮定すると
𝒙! 𝑡 = 𝑨𝒔 𝒔! 𝑡 + 𝑨𝜻 𝜻! 𝑡
= 𝑨 𝜼!(𝑡)
と変形できる（𝑨 を混合⾏列と呼ぶ）
Generative models
6
*ノイズは無相関とは限らない．
𝑨 𝜼!(𝑡)

異なる試⾏や時間変化でソース信号と観測信号の関係に変化がない* と仮定すると
𝑿! = 𝒙! 1 , 𝒙! 2 , … , 𝒙! 𝑡 , … , 𝒙! 𝑇 = 𝑨[ 𝜼! 1 , … , 𝜼! 𝑡 , … , 𝜼! 𝑇 ]
ここで，観測信号の共分散⾏列** は
𝑪# = 𝑨 𝑨𝑻
= 𝑨 𝑨𝑻
関⼼のあるソース信号のパワー 𝒑! = 𝑝!,%, … , 𝑝!,&
'
と観測信号との関係が線形であることが⽰された
Generative models
7
* 後者の仮定は例えば，MEG における頭部位置の経時的な変化がないという仮定と⾔い換えられる．
** 観測信号は平均が 0 である仮定をおいている.
/𝑇
𝑬!
:=

前提となる回帰モデル：𝑦/ = 𝜷,𝑓 𝒑/ + 𝜀/ ( 𝑓: 𝑖𝑑𝑒𝑛𝑡𝑖𝑡𝑦)
② “upper”
前スライドで 𝑪/ とソース信号のパワー 𝒑/ が線形関係にあることが⽰せた
さらに， 𝑪/ は対⾓なので上三⾓成分*のみを説明変数とおける
𝒗/ = 𝑓 Upper(𝑪/) (𝑓 = 𝑖𝑑𝑒𝑛𝑡𝑖𝑡𝑦)
① “diag”（再考）
𝒗/ = 𝑓 9
-.+
,
𝒙/ (𝑡)0 (𝑓 = 𝑖𝑑𝑒𝑛𝑡𝑖𝑡𝑦)
= 𝑓 diag(𝑪/)
※ 𝑓 = log の時
log 𝒑/ = log 𝐴𝑪/𝐴, ≠ 𝐴 log 𝑪/ 𝐴,
なので 𝑓(𝒑/) と線形の関係にならない
提案⼿法: Upper regression model
8
*正確には，対⾓成分以外を 2 倍したもの． 𝒗! のノルムと 𝑪! のフロベニウスノルムが⼀致するために補正されている．

提案⼿法: Riemann regression model
前提となる回帰モデル：𝑦/ = 𝜷,𝑓 𝒑/ + 𝜀/ 𝑓: log
③ “Riemann”
ソース信号 𝒔! 𝑡 の対数パワーを説明変数としたい場合に適した⼿法
（D
𝑪 は 𝑪! の幾何平均)
とおくと，𝒗! とソース信号の対数パワー log 𝒑! は線形の関係にある*
• ⾏列の幾何平均はリーマン幾何でいう重⼼に対応しており，上式はリーマン平⾯上の⽩⾊化に対応している
9
*証明略．線形代数の知識で導出が可能．
** https://iopscience.iop.org/article/10.1088/1741-2552/aab2f2/meta より引⽤．
**

前提となる回帰モデル：𝑦/ = 𝜷,𝑓 𝒑/ + 𝜀/ 𝑓: 任意
④ “SPoC” (Source Power Correlation)
𝑦! を 𝒙! 𝑡 の線形和で近似することを考える:
4
𝑦! ∶= 𝒘&
𝒙! 𝑡
ラグランジュの未定乗数法を⽤いると， 𝑦! と 4
𝑦!の相関を最⼤化させるような 𝒘 は以下の式を満たす*
1
𝑁
2
!'#
)
𝑦!𝑪! 𝒘 = 𝝀
1
𝑁
2
!'#
)
𝑪! 𝒘
これは固有値問題に読み替えることができ，このような 𝒘 は 𝑃 個存在する．これらを並べた⾏列を 𝑾*+,- とおく
とおくと，𝒗! と 𝑓 𝒑! は線形の関係にある**
提案⼿法: SPoC regression model
10
*証明略．SPoC の論⽂にて証明あり．
**証明略．線形代数の知識で導出が可能．

回帰
• 各⼿法で設定した 𝒗! を説明変数とし，⽬的変数 𝑦! を推定する回帰モデルを作成
• 線形カーネルによるリッジ回帰，Nested Cross validation を⾏う
• ベースライン (”diag”) での説明変数のパラメータ数 𝑃 に⽐べて，”upper” と “Riemann” はパラメータ数
が増加している (𝑃(𝑃 + 1)/2 )
11

Model violations
• 今までの前提を満たさないケース
I. 混合⾏列 𝑨 がデータごとに異なる場合: 𝒙/ 𝑡 = 𝑨/ 𝜼/(𝑡)
• 被験者間でデコーディングを⾏う場合
I. 混合⾏列がフルランクでない場合: rank 7
𝑪 : = 𝑅 < 𝑃
• データのクリーニングによりノイズ成分が除去されている場合
• サンプル数が少なく，共分散⾏列の推定が⼗分でない場合*
7
𝑪 の 𝑅 個の固有ベクトルを concat したを⽤いて 𝑪/ の次元を削減
SPoC についても同様に次元を落とせる(?)
12
*T< 𝑃 ⟹ rank 𝑪 < 𝑃

実験
13
実験タスク 𝑓
Model violations I.
混合⾏列のばらつき
Model violations II.
混合⾏列のランク落ち
数値シミュレーション
乱数を⽤いたシミュレー
ション
𝑙𝑖𝑛𝑒𝑎𝑟 or
log
あり（可変）あり（可変）
実験①
Cortico-muscular
coherence
未知なし（単⼀被験者）あり
実験②
Age prediction
using MEG
未知ありあり
実験③
Age prediction
using EEG
未知ありなし

14
次元 𝑃, 𝑄, 𝑁 = (5, 2, 100)
𝑨
𝑨 = exp(𝜇𝑩)
𝑩 はランダムに⽣成，𝜇 は単位⾏列との乖離をコントロールするパラメータ
𝑓 𝑓 = 𝑙𝑖𝑛𝑒𝑎𝑟 𝑓 = log
説明変数
𝑺𝟏, … , 𝑺𝑵 ∈ 𝑺𝑷
++
𝒙!(𝑡) を直接⽣成せず，ソース信号 𝜼!(𝑡) の共分散⾏列をランダムに⽣成
(𝒙! 𝑡 = 𝑨 𝜼!(𝑡))
⽬的変数 𝑦! = V
,
𝛼,𝑓(𝑝!,) + 𝜀!, (𝜀! ~ 𝒩(0, 𝜎-
))
ノイズ
Distance from identity 𝜇 の値を増加（単位⾏列から離す）
Noise on target 𝜀! の分散 𝜎-
を増加（S/N ⽐を下げる）
Noise on mixing matrix 𝑨𝒊: = 𝑨 + 𝑬𝒊, (𝑬! ~ 𝒩(0, 𝜎-
)) ，𝜎-
を増加（被験者・試⾏間のばらつき）

15
𝑓 = 𝑙𝑖𝑛𝑒𝑎𝑟 の結果
• Diag と⽐べ，Upper・SPoC は⾏列の値に関係なく良い推定を与える
• Riemann は 𝜇 の変化に影響を受けない（アフィン不変）が， 𝑓 = 𝑙𝑖𝑛𝑒𝑎𝑟 での理論保証はないため精度は悪い
• Riemann はノイズに頑健

16
𝑓 = log の結果
• Diag と⽐べ，Riemann・SPoC は⾏列の値に関係なく良い推定を与える
• この場合でも Riemann はノイズに頑健
• データごとに 𝑨 がばらつく場合，Riemann が望ましい？

実験①
17
ortico-muscular coherence: 筋収縮を MEG データで予測するタスク
• 被験者は１名，観測チャンネルは 151 (Gradiometer)
• 共分散⾏列のクロスタームを⽤いた⼿法が良い結果に
• SPoC と Riemann での最適な次元は SPoC: 4, Riemann: 42
• SPoC の第１成分はソース信号と⽬的変数の相関を最⼤化させるようなフィルタになっていることが理由

実験②
18
Age prediction: MEG データを⽤いた被験者年齢の予測
• Cam-CAN データセット
• 被験者は643名，観測チャンネルは 102 (Magnetometer)
• 信号空間分離法 (signal space separation: SSS) によりランク落ち (65 次元の独⽴信号に分離可能と推定)
• Upper の精度が diag より悪い（⾮線形モデルの可能性）
• Riemann, SPoC 共に最適な次元は SSS による推定結果に⽭盾せず

実験②（ソース信号分析）
19
データセットに含まれた解剖学データを⽤いてソース信号を推定，ソース信号について同様の回
帰問題を解く
• Diag が最も良い結果に
• 各要素が無相関なソース信号ではクロスタームを含まないモデルが有効

実験③
20
Age prediction: EEG データを⽤いた被験者年齢の予測
• テンプル⼤学 (TUH) による EEG コーパス
• 被験者は1385名，観測チャンネルは 21
• シミュレーションでの結果通り，混合⾏列がばらつく場合は Riemann が最も頑健

まとめ
• EEG/MEG で観測信号を説明変数とした回帰問題を解くための⼿法を⽐較
• 従来⼿法：各観測信号のパワーを説明変数とする⼿法 (“diag”)
❌ 観測信号間の相関を考慮できていない
• 提案⼿法：観測信号が統計的に無相関なソース信号の線形和で表せると仮定したモデル
① Upper: 観測信号の共分散⾏列の上三⾓成分を説明変数とする（𝑓 = 𝑙𝑖𝑛𝑒𝑎𝑟）
② Riemann: 観測信号の共分散⾏列をリーマン平⾯上で⽩⾊化する（𝑓 = log ）
③ SPoC: 説明変数との相関係数を最⼤化するような重み付けで観測信号を線形変換（𝑓 = 𝑎𝑛𝑦）
• 結果
• 提案⼿法が概して従来⼿法を上回る推定精度に
• SPoC は被験者内の回帰に強く，少ない特徴量で推定が可能
• Riemann は被験者間のばらつきやランク落ちに頑健
21

【文献紹介】Predictive regression modeling with MEG

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Ähnlich wie 【文献紹介】Predictive regression modeling with MEG

Ähnlich wie 【文献紹介】Predictive regression modeling with MEG (9)

【文献紹介】Predictive regression modeling with MEG