SlideShare ist ein Scribd-Unternehmen logo
1 von 44
Downloaden Sie, um offline zu lesen
九州数学教育会第 6 回算数数学教育研修会 (於. 福岡県立修猷館高等学校)




                    行列計算を利用したデータ解析技術
                        主成分分析・多次元尺度構成法


                                    溝口佳寛

                        九州大学 マス・フォア・インダストリ研究所
                                           
                    http://www.slideshare.net/yoshihiromizoguchi/

                               2012 年 4 月 15 日 (日)




    溝口佳寛 (九大 IMI)              行列計算を利用したデータ解析技術                     2012/04/15   1 / 44
目次



                1    ..
                    自己紹介
                2   はじめに
                3    ..
                    最初の例
                4   準備
                5    ..
                    特異値分解 (SVD)
                6   主成分分析 (PCA)
                7    ..
                    多次元尺度構成法 (MDS)
                8   まとめ
                9    ..
                    参考文献

                     ..

                     ..

                     ..
溝口佳寛 (九大 IMI)             行列計算を利用したデータ解析技術   2012/04/15   2 / 44
マス・フォア・インダストリ研究所 (正式名称)




     http://www.imi.kyushu-u.ac.jp/ (産業数学研究所 (俗称))

溝口佳寛 (九大 IMI)      行列計算を利用したデータ解析技術             2012/04/15   3 / 44
研究者情報 (ResearchMap)




           http://researchmap.jp/yoshihiro/
                「Yoshihiro Mizoguchi」で検索.



溝口佳寛 (九大 IMI)       行列計算を利用したデータ解析技術          2012/04/15   4 / 44
プロフィール
 計算について論理的・数学的に考察する研究を行っています. 1930 年代 Alan Turing は「チューリ
ング機械」と呼ばれる形式的な計算モデルを構成し, 計算可能性, 万能性に関する計算理論の礎を築
きました. 数の計算の実現に計算モデルのテープ上に記述された文字列が重要な役割を果たしました.
計算モデル「有限オートマトン」の研究では 1950 年代に入り文字列集合の認識機械としての考察が
始まり言語との重要な関係が導かれました. その後, 形式言語の研究は「自然言語の機械翻訳」        「文献
データベース」 「人工知能」などの研究へと発展しています.
 数学 (代数学) は「群」
             「環」
               「体」などの一種の集合上の演算を持つ代数系を対象とします. 代数系
はモナドと呼ばれる圏の間の関手たちにより多種の集合間の関数を演算として持つ系に一般化され
ます. 多種代数系は「スタック」 「木」
                   「グラフ」などのプログラミングに必要なデー タ構造を含みま
すので, 多種代数系やモナドの研究成果は計算の性質を考察するための強力な武器になります.
 近年の計算機の発展と普及により, 社会システムは計算機 (プログラム) にますます依存して来てい
ます. システムに要求される仕様をプログラムで実現し計算機で実行します. プログラムが仕様を正
しく実現していることは, 数理論理学において証明が定理を正しく導いていることに対応します. 論
理的に誤りがないプログラムのための仕様記述, 開発, 検証の技術は形式手法と呼ばれます. 証券取
引, 交通網, 航空宇宙工学, マイクロプロセッサなどプログラムの誤りにより多大な損失が生じるシス
テムに形式手法は活用されています.

 最近は論理的・数学的な考察そのものにも計算機が利用され, 形式手法のための数学理論の構築と
実現がますます重要になっています. 数の取り扱いのための文字列の研究のように, 計算に必要な数
学概念の計算モデルの研究を続けています. 最近では, デジタル映像分野における計算のための新し
い計算モデルも模索しています.

   溝口佳寛 (九大 IMI)    行列計算を利用したデータ解析技術           2012/04/15   5 / 44
デジタル映像数学の構築と表現技術の革新




CREST 研究プロジェクト (2010-2015): CG 固有の問題を数学的に解く
         (MCG: Mathematics & Computer Graphics)
    チーム HP は 5 月公開予定 http://mcg.imi.kyushu-u.ac.jp/


  溝口佳寛 (九大 IMI)   行列計算を利用したデータ解析技術         2012/04/15   6 / 44
はじめに




FFT, RSA, DCT は知っている (聞いたことがある).
 
PCA, MDS, SVD って何だろう?




溝口佳寛 (九大 IMI)   行列計算を利用したデータ解析技術   2012/04/15   7 / 44
デジタルデータの話題


デジタル機器で利用される数学技術の例:
 
  FFT (高速フーリエ変換)
  J.W.Cooley and T.W.Turkey (1965).
  信号処理 (通信や放送, 医療計測), 多倍精度数値計算などで利用
  RSA (公開鍵暗号方式)
  R.Rivest, A.Shamir, L.Adleman (1977).
  インターネット・オンラインショ                 ッピング等で利用
  DCT (離散コサイン変換)
  N.Ahmed, T.Natarajan and K.R.Rao (1974).
  デジタルカメラ等の画像ファイル圧縮 (JPEG) で利用




  溝口佳寛 (九大 IMI)    行列計算を利用したデータ解析技術          2012/04/15   8 / 44
大量データの話題

「ビッグデータ」と呼ばれる大量データ処理で利用されている技術.
(cf. ギガ (106 ) バイト (G), テラ (1012 ) バイト (T), ペタ (1015 ) バ イト (P))  

    PCA (主成分分析)
    K.Pearson (1901).
    高次元データをデータ間の特徴を表す低次元データに圧縮する方法
    MDS (多次元尺度構成法)
    W.S.Torgerson (1952)[3]
    距離の関係がわかっているデータたちを表現する多次元データ座標
    を構成する.
    SVD (特異値分解)
    PCA や MDS の基礎となる線形代数の定理 (行列の対角化の一般化).
    C.Eckard and G.Young (1936)[1].
    The approximation of one matrix by another of lower rank,
    Psychometrika, 1(3). ⇐ 心理学の雑誌


    溝口佳寛 (九大 IMI)           行列計算を利用したデータ解析技術                    2012/04/15   9 / 44
最初の例 (成績処理)

        国語      数学       英語                          f (x1 , x2 , x3 )
         x1      x2       x3     f (x)
                                                 = a1 x1 + a2 x2 + a3 x3
A        40         40   52     f ( A)
B        40         46   52     f (B)     とするとき, a1 , a2 , a3 の値を
C        46         52   52     f (C)     どのようにすれば f (x) の標準
D        46         58   52     f ( D)    偏差 (点数のばらつき) を最大
E        40         64   40     f (E)     にすることが出来るか?
F        40         70   40     f (F)     但し, a2 + a2 + a2 = 1 の条件
G        46         76   40     f (G)          1    2    3
                                          を加える.
H        46         82   40     f (H)
平均       43      61       46
標準偏差    3.21    14.7     6.41   最大化
                                          a1 = a2 = a3 =        1
                                                                √
                                                                 3
                                          が単純な合計値に対応する.

注意: ばらつきを大きくすることと成績の善し悪しの評価とは無関係!
(例: ai の符号を全て反転しても, ばらつきは同じ.)
    溝口佳寛 (九大 IMI)             行列計算を利用したデータ解析技術                       2012/04/15   10 / 44
成績処理 (2)
                   国語        数学     英語
                    x1        x2     x3    f (x)   g(x)   h(x)
         A           40       40     52    76.2    21.3   46.4
         B           40       46     52    79.7    26.9   49.8
         C           46       52     52    86.6    32.9   55.6
         D           46       58     52    90.1    38.5   59.0
         E           40       64     40    83.1    48.0   58.1
         F           40       70     40    86.6    53.5   61.6
         G           46       76     40    93.5    59.5   67.3
         H           46       82     40    96.9    65.1   70.7
         平均         43        61     46    86.6    43.2   58.6
         標準偏差      3.21      14.7   6.41   6.93    15.8   8.16

                             1
      f (x1 , x2 , x3 ) =    √ (x1 + x2 + x3 )
                               3
      g(x1 , x2 , x3 ) =    0.0795457x1 + 0.927542x2 − 0.365156x3
      h(x1 , x2 , x3 ) =    0.395067x1 + 0.565842x3 + 0.154093x3
溝口佳寛 (九大 IMI)               行列計算を利用したデータ解析技術                     2012/04/15   11 / 44
成績処理 (3)

A, B, · · · , H を座標 (g(x), h(x)) でプロットしたもの.
             85



                               C D
             80


                                                  G H
        hx




             75

                    A B
                                            E F
             70


             65
                    20    30      40        50    60      70
                                       gx




※ 3 科目の成績の特徴を 2 次元平面に上手にプロットする方法は?

3 次元データの特徴を維持しつつ, 2 次元データに圧縮する方法は?


    溝口佳寛 (九大 IMI)         行列計算を利用したデータ解析技術              2012/04/15   12 / 44
記号と基礎統計量の復習
x = (x1 , x2 , · · · , x n), y = (y1 , y2 , · · · , y n), 1 = (1, 1, · · · , 1) とする.
                                                                                                   
                                                                                       
                                                                                       
                                                                                       
                                                                                             y1     
                                                                                                    
                                                                                                    
                                                                                                   
                          ∑
                          n                                 (                       ) 
                                                                                       
                                                                                            y2     
                                                                                                    
                                                                                                    
                                                                                                    
     内積             s=          xi yi = x, y = x · y t =        x1   x2    ···    xn · 
                                                                                       
                                                                                       
                                                                                             .     
                                                                                                    
                                                                                                    
                                                                                                    
                                                                                       
                                                                                       
                                                                                             .
                                                                                              .     
                                                                                                    
                                                                                                    
                          i=1                                                          
                                                                                                   
                                                                                                    
                                                                                             yn
                                        ∑
                                        n
     ノルム            ||x|| = x, x =        (xi )2
                                        i=1
                          ∑
                          n
     合計             s=          xi = 1, x
                          i=1
                        1
     平均             x=
                    ¯      1, x
                        nn
                         ∑
     分散             σ2 =      (xi − x)2 = x − x1, x − x1
                                    ¯         ¯       ¯
                         √i=1
     標準偏差           σ=      x − x1, x − x1
                                  ¯      ¯

データの分析, 数列 (Σ), 行列, ベクトル, · · · の勉強が必要.
       溝口佳寛 (九大 IMI)                  行列計算を利用したデータ解析技術                                 2012/04/15       13 / 44
データ行列 · 距離行列 · 内積行列

n 個のデータ oi = (xi1 , xi2 , · · · , xip) (i = 1, · · · , n) を考える. ここで
は, p ≤ n としておく. n × p 行列, X = (xi j ) (i = 1, · · · , n,
j = 1, · · · , p) に対して, n × n 行列 M と B を

                    M = (||oi − o j ||),
                    B = ( oi , o j ) = (oi · (o j ) t ) = X · X t

とする.
M を距離行列, B を内積行列, X をデータ行列と呼ぶことにする.
n × 1 の列ベクトルを xi = (x1i , x2i , · · · , x ni ) (i = 1, · · · , p) と書き,
X = (x1 , x2 , · · · , x p) と書くこともある.

X が n × p 行列のとき, B = X · X t は n × n 行列, X t · X は p × p 行列.


    溝口佳寛 (九大 IMI)              行列計算を利用したデータ解析技術                     2012/04/15   14 / 44
B と X の関係

問題
n × n 行列 B = (bi j ) が与えられ, X がわからないときに, 適当な次元 p を
                                                                  .
定め, bi j = oi , o j (i = 1, · · · , n, j = 1, · · · , n), すなわち, B = X · X t とな
るような, n 個のベクトル oi = (xi1 , xi2 , · · · , xip) を求めよ.

B を直交対角化して UBU t = Λ と対角行列に出来たとする. このとき, B
                                                    .
は半正定値行列であり固有値は 0 または正であることが知られていて,
√
  Λ (行列 Λ の対角成分に全て平方根を施した行列) を作ることが出来る.
               √           √      √                   √
そして, B = U t ( Λ)2 U = (U t Λ)(U t Λ) t であり, X c = U t Λ とすると
B = X c X c となる. このときの X c は n × n 行列である.
          t

  b               ···          u           ···         λ           ···         u              ···             
  11
 
 
            b12          b1n    11
                               
                               
                                        u21         u n1   11
                                                                 0           0     11
                                                                                            u12            u1n     
                                                                                                                     
 
  b21
 
           b22          b2n    u12
                               
                               
                                      u22         u n2
                                                         
                                                          0
                                                         
                                                         
                                                                λ22          0
                                                                                   
                                                                                     u21
                                                                                   
                                                                                   
                                                                                            u22            u2n
                                                                                                                     
                                                                                                                     
                                                                                                                     
                                                                                                                     
                                                                                                                     
 
                              
                                                                                                               
  .
 
 
  .                           
                           . = .
                               
                                                         
                                                      .  .
                                                         
                                                         
                                                                                   
                                                                                .  .
                                                                                   
                                                                                                             .
                                                                                                                     
                                                                                                                     
                                                                                                                     
                                                                                                                     
 
 
  .                       .   .
                               
                               
                                                    .  .
                                                         
                                                                              .  .
                                                                                   
                                                                                                             .     
                                                                                                                     
                                                                                                                     
 
 
 
                          .   .
                               
                               
                                                    .  .
                                                         
                                                         
                                                         
                                                                              .  .
                                                                                   
                                                                                   
                                                                                   
                                                                                                             .     
                                                                                                                     
                                                                                                                     
                                                                                                                     
                                                                                                                     
   b n1     b n2   ···   b nn     u1n   u2n   ···   u nn     0     0    ···   λ nn     u n1   u n2   ···     u nn




          溝口佳寛 (九大 IMI)                  行列計算を利用したデータ解析技術                                       2012/04/15          15 / 44
アルゴリズム 1

B を作ったもとのデータ行列 X を探す:
X = (xi j ) のランクが p であるとき, rank(B) は p であることが知られてお
り, Λ の対角成分は λ1 ≥ λ2 ≥ · · · ≥ λ p で, λ p+1 = · · · = λn = 0 と考えて
良い. Λ = (λi j ), u = (ui j ) とし, r ≤ p とするとき, r × r 行列 Λ r = (λi j )
(i, j = 1, · · · , r), n × r 行列 U r = (ui j ) (i = 1, · · · , n, j = 1, · · · , p) とする
                                       √
と B = U pΛ pU p となる. X c = U p Λ p とすると X c は n × p 行列で,
                     t

B = X c X c となる.
            t

  b               ···          u              ···          λ                   ···               u               ···             
  11
 
 
            b12          b1n    11
                               
                               
                                         u21            u p1   11
                                                                          0                    0     11
                                                                                                               u12            u1n     
                                                                                                                                        
 
  b21
 
           b22          b2n    u12
                               
                               
                                       u22            u p2  0
                                                             
                                                             
                                                             
                                                                         λ22                   0     u21
                                                                                                     
                                                                                                     
                                                                                                     
                                                                                                               u22            u2n
                                                                                                                                        
                                                                                                                                        
                                                                                                                                        
                                                                                                                                        
                                                                                                                                        
 
                              
                                                                                                                                  
  .
 
 
  .                           
                           . = .
                               
                                                             
                                                          .  .
                                                             
                                                             
                                                                                                     
                                                                                                  .  .
                                                                                                     
                                                                                                                                .
                                                                                                                                        
                                                                                                                                        
                                                                                                                                        
                                                                                                                                        
 
 
  .                       .   .
                               
                               
                                                        .  .
                                                             
                                                                                                .  .
                                                                                                     
                                                                                                                                .     
                                                                                                                                        
                                                                                                                                        
 
 
 
                          .   .
                               
                               
                                                        .  .
                                                             
                                                             
                                                             
                                                                                                .  .
                                                                                                     
                                                                                                     
                                                                                                     
                                                                                                                                .     
                                                                                                                                        
                                                                                                                                        
                                                                                                                                        
                                                                                                                                        
   b n1     b n2   ···   b nn     u1n    u p2    ···    u pn     0          0       ···         λ pp     u p1    u2 p   ···     u pn

                                                                    √
                                u                                                                         
                                11
                               
                               
                                        u21     ···    u p1    
                                                               
                                                               
                                                                
                                                                     λ11
                                                                            √
                                                                             0            ···         0      
                                                                                                             
                                                                                                             
                                                                                                             
                                u
                                12
                               
                                       u22            u p2    
                                                               
                                                               
                                                                   0       λ22                      0
                                                                                                             
                                                                                                             
                                                                                                             
                                                                                                             
                               
                                                              
                                                               
                                                               
                                                                                                             
                                                                                                             
                                                                                                             
                          XC =  .
                               
                               
                               
                                                       .      
                                                               
                                                               
                                                                   .                                 .
                                                                                                             
                                                                                                             
                                                                                                             
                                                                                                             
                                .
                                                       .       
                                                               
                                                                   .                                 .     
                                                                                                             
                                                                                                             
                                .
                               
                                                       .      
                                                               
                                                                   .                                 .     
                                                                                                             
                                                              
                                                                                                    √       
                                                                                                             
                                                                                                             
                                 u n1   u n2    ···    u pn          0          0         ···         λ pp




          溝口佳寛 (九大 IMI)                    行列計算を利用したデータ解析技術                                                        2012/04/15          16 / 44
特異値分解

定理 (Singular Value Decomposition[1])
n × p 行列 X に対して, n × n 直交行列 U, p × p 直交行列 V が存在し,
X = U · L · V t とすることが出来る. 但し, n × p 行列 L = (li j ) は対角行列
li j = 0 (i j, i = 1, · · · , n, j = 1, · · · , p) である.
そして, このとき次の条件が満たされる.
   X · X t は, U で直交対角化され 0 でない固有値の集合は
   {l2 | lii 0, i = 1, · · · , p}.
     ii
   UU t = E n で, U(XX t )U t が対角行列になる.
   X t · X は, V で直交対角化され 0 でない固有値の集合は
   {l2 | lii 0, i = 1, · · · , p}.
     ii
   VV t = E n で, V(X t X)V が対角行列になる.
   rank(X) = #{lii | lii
                       0, i = 1, · · · , p}. (0 でない特異値の数)
                                                       .
                             ∑ p
   Tr(X · X ) = Tr(X · X) =
           t        t               2
                                   lii
                              i=1


    溝口佳寛 (九大 IMI)          行列計算を利用したデータ解析技術            2012/04/15   17 / 44
特異値分解 (例)

8 個の 3 次元ベクトルのデータ, すなわち, 8 × 3 行列 X を考える.
                 6
                                    7
                                                                  
                                                 
                                                 
                                                 
                                                     0   0     0   
                                                                   
                                                                   
5                                                
                                                 
                                                 
                                                    0   1     0
                                                                   
                                                                   
                                                                   
                                                                   
                                                 
                                                 
                                                                  
                                                                   
                                                                   
                                                 
                                                 
                                                    1   1     0   
                                                                   
                                                                   
                                                 
                                                 
                                                                  
                                                                   
                                                                   
                  2     8                        
                                                    1   0     0   
                                                                   
                                               X=
                                                 
                                                 
                                                 
                                                                   
                                                                   
                                                                   
                                                                   
                                                 
                                                 
                                                    0   0     1   
                                                                   
                                                                   
                                                 
                                                 
                                                                  
                                                                   
                                                                   
                                3                
                                                 
                                                 
                                                 
                                                 
                                                     0   1     1   
                                                                   
                                                                   
                                                                   
                                                                   
                                                 
                                                 
                                                    1   1     1   
                                                                   
                                                                   
                                                                  
    1                                                1   0     1


                        4
        溝口佳寛 (九大 IMI)       行列計算を利用したデータ解析技術                 2012/04/15   18 / 44
行列 X の特異値分解



行列 X の特異値分解 X = U · L · V t を計算する.
      0     0        0      0      0       0          0        1   
  
  
                                                                   
                                                                    
                                                                    
  
  
  
       1
       √     0      1
                    √
                             1    − √1    − √3         1
                                                       √        0   
                                                                    
                                                                    
  
  
                            2                                      
                                                                    
                                                                    
  
  
  
      2 6             3            2 2      2 10     2 10           
                                                                    
                                                                    
                                                                     2 √2
                                                                    
       1     −1     1       −1      1
                                  − √        1       − √1
  
  
  
       √            √                        √                  0   
                                                                                        
  
  
       6     2    2 3        2    2 2     2 10       √ 10          
                                                                    
                                                                             0
                                                                               √
                                                                                    0    
                                                                                         
                                                                                         
  
  
                                                                   
                                                                    
                                                                                        
                                                                                         
  
  
  
  
                                                         5
                                                                    
                                                                    
                                                                    
                                                                    
                                                                          0     2   0
                                                                                    √
                                                                                         
                                                                                         
                                                                                         
                                                                                         
                                                                                            1       1
                                                                                                     −√          1
                                                                                                                −√
                                                                                                                        
                                                                                                                        
  
      1                                                 2          
                                                                                       
                                                                                            √                         
                                                                                                                        
  
      √     −1     1
                  − √        0      0        0                  0   
                                                                        0    0     2   
                                                                                                              √6      
                                                                                                                        
  
  
     2 6     2     2 3                                2            
                                                                    
                                                                                       
                                                                                         
                                                                                         
                                                                                               3           2            
                                                                                                                        
                                                                                                                        
  
X=
      1     1        1                      3                      
                                                                    
                                                                        0    0    0    
                                                                                         
                                                                                            1                  2      
                                                                                                                        
                                                                                                                        
  
  
      √          − √       −1      1
                                  − √     − √          1
                                                       √        0   
                                                                    
                                                                                       
                                                                                         
                                                                                         
                                                                                              √        0         3      
                                                                                                                        
                                                                                                                        
  
  
     2 6    2      2 3      2     2 2     √ 10
                                           2         2 10           
                                                                    
                                                                        0    0    0    
                                                                                         
                                                                                         
                                                                                               3                        
                                                                                                                        
                                                                                                                        
  
  
                                                                   
                                                                    
                                                                                       
                                                                                         
                                                                                         
                                                                                              1
                                                                                              √
                                                                                                      1
                                                                                                      √
                                                                                                                 1
                                                                                                                −√      
  
  
  
       1
       √
             1       1
                     √       0      0            2
                                                      √
                                                       1        0   
                                                                    
                                                                    
                                                                          0    0    0    
                                                                                         
                                                                                         
  
  
     √6
             2     2 3                           5      10          
                                                                    
                                                                        0    0    0    
                                                                                         
                                                                                         
                                                                                               3       2         6
  
  
                                                                   
                                                                    
                                                                                        
  
  
        3                                                          
                                                                    
                                                                         0    0    0
  
  
        2                                                          
                                                                    
                                                                    
  
  
            0        0      0     √
                                    1      − √1        1
                                                     − √        0   
                                                                    
                                                                    
  
  
      2                                                            
                                                                    
                                                                    
  
      1              1      1
                                     2
                                     1       1
                                               10     2 10          
                                                                    
       √     0    −   √      2
                                  − √       √        − √1       0
        6               3          2 2     2 10            10




      溝口佳寛 (九大 IMI)                      行列計算を利用したデータ解析技術                                          2012/04/15        19 / 44
X · X t の対角化
特異値分解の行列 U は X · X t を直交対角化する.
(※ 対称行列 X · X t は直交行列で対角化可能).
                                  0        0            0          0      0         0               0        1   
                        
                        
                                                                                                                 
                                                                                                                  
                                                                                                                  
                        
                        
                        
                                   1
                                   √       −1             1
                                                          √
                                                                    1    − √1      − √3            1
                                                                                                   √          0   
                                                                                                                  
                                                                                                                  
                        
                        
                                            2                      2                                             
                                                                                                                  
                                                                                                                  
                        
                        
                        
                                  2 6                   2 3               2 2        2 10        2 10             
                                                                                                                  
                                                                                                                  
                        
                        
                        
                                   1
                                   √       −1          − √ 1       −1      1
                                                                         − √          1
                                                                                      √          − √1         0   
                                                                                                                  
                                                                                                                  
                        
                        
                                   6       2            2 3         2    2 2       2 10          √ 10
                                                                                                                  
                                                                                                                  
                                                                                                                  
                        
                        
                                                                                                                 
                                                                                                                  
                                                                                                                  
                        
                        
                                                                                                    5            
                                                                                                                  
                                                                                                                  
                        
                        
                                                                                                    2            
                                                                                                                  
                                                                                                                  
                        
                        
                        
                                   1
                                   √           0        1
                                                       −√           0      0         0                        0   
                                                                                                                  
                                                                                                                  
                        
                        
                                 2 6                      3                                       2              
                                                                                                                  
                                                                                                                  
                        
                      U=
                                  1           1         1                            3                           
                                                                                                                  
                                                                                                                  
                        
                        
                                  √                     √         −1    − √1      − √             1
                                                                                                   √          0   
                                                                                                                  
                                                                                                                  
                        
                        
                                 2 6          2        2 3         2        2 2    √ 10
                                                                                    2            2 10             
                                                                                                                  
                                                                                                                  
                        
                        
                                                                                                                 
                                                                                                                  
                                                                                                                  
                        
                        
                        
                                   1
                                   √           0         1
                                                         √          0        0          2
                                                                                                  √
                                                                                                   1          0   
                                                                                                                  
                                                                                                                  
                        
                        
                                 √6                      3                             5           10            
                                                                                                                  
                                                                                                                  
                        
                        
                                                                                                                 
                                                                                                                  
                                                                                                                  
                        
                        
                                    3                                                                            
                                                                                                                  
                                                                                                                  
                        
                        
                                    2                                                                            
                                                                                                                  
                                                                                                                  
                        
                        
                                              0         0          0     √
                                                                           1       − √1            1
                                                                                                 − √          0   
                                                                                                                  
                                                                                                                  
                        
                        
                                  2                                                                              
                                                                                                                  
                                                                                                                  
                        
                                  1           1         1          1
                                                                            2
                                                                            1         1
                                                                                        10        2 10            
                                                                                                                  
                                   √           2
                                                       − √          2
                                                                         − √         √           − √1         0
                                    6                   2 3               2 2       2 10                 10



                             0        0   0       0    0      0     0   0        8        0   0        0   0       0   0   0   
                          
                          
                                                                            
                                                                             
                                                                                 
                                                                                  
                                                                                   0                                             
                                                                                                                                  
                                                                                                                                  
                          
                          
                             0        1   1       0    0      1     1   0   
                                                                             
                                                                                 
                                                                                  
                                                                                            2   0        0   0       0   0   0   
                                                                                                                                  
                                                                                                                                  
                          
                          
                                                                            
                                                                             
                                                                                 
                                                                                   0
                                                                                                                                 
                                                                                                                                  
                                                                                                                                  
                          
                          
                             0        1   2       1    0      1     2   1   
                                                                             
                                                                                 
                                                                                  
                                                                                            0   2        0   0       0   0   0   
                                                                                                                                  
                                                                                                                                  
                          
                                                                            
                                                                                                                                
                          
      t (X · X t )U = U t 
                          
                          
                              0        0   1       1    0      0     1   1   U =  0
                                                                             
                                                                             
                                                                             
                                                                                  
                                                                                  
                                                                                  
                                                                                  
                                                                                             0   0        0   0       0   0   0   
                                                                                                                                  
                                                                                                                                  
                                                                                                                                  
                                                                                                                                  
    U                     
                          
                             0        0   0       0    1      1     1   1   
                                                                             
                                                                                  0
                                                                                  
                                                                                            0   0        0   0       0   0   0   
                                                                                                                                  
                                                                                                                                  
                          
                          
                                                                            
                                                                             
                                                                                 
                                                                                  
                                                                                   0                                             
                                                                                                                                  
                                                                                                                                  
                          
                          
                             0        1   1       0    1      2     2   1   
                                                                             
                                                                                 
                                                                                  
                                                                                            0   0        0   0       0   0   0   
                                                                                                                                  
                                                                                                                                  
                          
                          
                                                                            
                                                                             
                                                                                 
                                                                                   0
                                                                                                                                 
                                                                                                                                  
                                                                                                                                  
                          
                             0        1   2       1    1      2     3   2   
                                                                                 
                                                                                            0   0        0   0       0   0   0   
                                                                                                                                  
                              0        0   1       1    1      1     2   2          0        0   0        0   0       0   0   0

注: 0 以外の固有値は特異値の平方になる.
   溝口佳寛 (九大 IMI)                                   行列計算を利用したデータ解析技術                                                       2012/04/15   20 / 44
X t · X の対角化


特異値分解の行列 V は X t · X を直交対角化する.
(※ 対称行列 X t · X は直交行列で対角化可能).
                                                        
                             
                             
                                  1
                                  √     −√
                                         1
                                                −√
                                                 1
                                                         
                                                         
                             
                             
                                   3       2   √6       
                                                         
                                                         
                             
                                                        
                                                         
                           V=
                             
                             
                             
                                  1
                                  √     0            2   
                                                         
                                                         
                                                         
                             
                             
                                   3                3   
                                                         
                                                         
                                 1
                                  √
                                        1
                                        √       −   1
                                                    √
                                                         
                                    3    2           6

                                                              
                              4 2 2 
                             
                                    
                                           8 0
                                           
                                                            0   
                                                                 
                                                                 
                                                              
              V (X · X)V = V  2 4 2  V =  0 2
                   t   t     
                             
                             
                              t      
                                     
                                          
                                           
                                                            0   
                                                                 
                                                                 
                                                                 
                                                              
                               2 2 4         0 0             2
注: 0 以外の固有値は特異値の平方になる.




   溝口佳寛 (九大 IMI)            行列計算を利用したデータ解析技術                         2012/04/15   21 / 44
中心化行列



定義 (中心化行列)
自然数 n に対して, E n を n × n 単位行列, 1 n を全成分が 1 の n 次元列ベク
トル, 1 n×n を全成分が 1 の n × n 行列とする. このとき, n × n 行列
J n = E n − 1 1 n×n を中心化行列という.
            n                               .

                                                     1∑
                                                         n
                                 1
n × p 行列 X に対して, J n X = (E n X − 1 n×n X) = (xi j −        x k j ) であ
                                 n                   n
                                                        k=1
                     ∑
                     n                                 .
り, J n X = (x ) とすると   xi j = 0 となる. すなわち, J n X はデータ列 X
             ij
                        i=1
の重心を原点に平行移動したデータ列になる.




    溝口佳寛 (九大 IMI)        行列計算を利用したデータ解析技術                    2012/04/15   22 / 44
主成分分析 (PCA)

定理 (Principal Component Analysis)
                                                1
n × p 行列 X の共分散行列を p × p 行列 S =                   (J n X) t (J n X) とする. S を直
                                                n
交対角化して VSV t = Λ となり, Λ = (λi j ) は, λi j = 0 (i                   j),
λ11 ≥ λ22 ≥ · · · ≥ λ pp ≥ 0 とする. n × p 行列 Y を Y = (J n X) · V t とする
と Y = (y1 , y2 , · · · , y p) = (yi j ) に対して, 次の性質が成り立つ.
     ∑n
  1     yi j = 0 ( j = 1, · · · , p), (yi の平均は 0)
      i=1
      1 t
  2     Y Y = Λ (Y の共分散行列は対角行列で対角成分 (yi の分散) は固有値),
      n                                    .
  3   Tr(Y t Y) = Tr(S),
  4   |Y t Y| = |S|.

変換されたデータ列 Y について, 次のことがわかる. (1) より各成分の平均は全て
0 である. (2) より各成分の分散は第 1 成分から順番に小さくなっている.

      溝口佳寛 (九大 IMI)         行列計算を利用したデータ解析技術                    2012/04/15   23 / 44
PCA (例)


8 個の 3 次元ベクトルのデータ, すなわち, 8 × 3 行列 X を考える.

                              8
                          7                                  
                      6                       
                                              
                                              
                                                  0   0   0   
                                                              
                                                              
                 5                            
                                              
                                                             
                                                              
                                                              
                                              
                                              
                                              
                                                  0   1   0   
                                                              
                                                              
                                              
                                              
                                                             
                                                              
                                                              
                                              
                                              
                                              
                                                  1   2   0   
                                                              
                                                              
                                              
                                              
                                                 1   3   0   
                                                              
                                                              
                                            X=
                                              
                                              
                                              
                                                              
                                                              
                                                              
                                                              
                                              
                                              
                                                 0   4   2   
                                                              
                                                              
                                              
                                              
                                                             
                                                              
                                                              
                      4                       
                                              
                                                 0   5   2   
                                                              
                                                              
                                              
                                              
                                                             
                                                              
                                                              
                 3                            
                                              
                                              
                                                  1   6   2   
                                                              
                                                              
        2                                         1   7   2
  1




      溝口佳寛 (九大 IMI)           行列計算を利用したデータ解析技術                    2012/04/15   24 / 44
中心化行列 (例)

データ X の重心は ( 1 , 7 , 1) である.
             2 2

              7    −1     1
                          −8   −1   −1   −1    −1   −1                      −1   −7      −1   
           
           
              8     8          8    8    8     8    8   
                                                         
                                                                          
                                                                            
                                                                                               
                                                                                                
                                                                                                
           
                                                        
                                                                          −1
                                                                               2    2           
                                                                                              
                                                           0   0   0
               −1                                                                             
                     7    −1   −1   −1   −1    −1   −1
                                                                                −5      −1
           
           
           
           
                8    8     8    8    8    8     8    8   
                                                         
                                                         
                                                            0   1   0    
                                                                            12
                                                                           
                                                                            
                                                                            
                                                                                    2           
                                                                                                
                                                                                                
                                                                                                
                                                                                                
           
           
              −1   −1    7    −1   −1   −1    −1   −1   
                                                         
                                                                         
                                                                            2
                                                                                 −3      −1   
                                                                                                
                                                                                                
           
           
               8     8   8     8    8    8     8    8   
                                                         
                                                            1   2   0     1
                                                                           
                                                                                  2           
                                                                                                
                                                                                                
           
           
              −1   −1     1
                          −8   7    −1   −1    −1   −1   
                                                         
                                                                         
                                                                           
                                                                            2    −1      −1   
                                                                                                
                                                                                                
           
    J8 X = 
               8     8        8     8    8     8    8   
                                                         
                                                         
                                                              1   3   0   =
                                                                           
                                                                                  2           
                                                                                                
                                                                                                
           
           
              −1   −1     1
                          −8   −1    7   −1    −1   −1   
                                                         
                                                            0   4   2     −1
                                                                           
                                                                                 1            
                                                                                                
                                                                                                
           
           
               8     8         8    8    8     8    8   
                                                         
                                                                         
                                                                           
                                                                             2   2
                                                                                           1    
                                                                                                
                                                                                                
           
           
                                                        
                                                         
                                                            0   5   2    
                                                                            −1
                                                                                 3            
                                                                                                
                                                                                                
           
              −1   −1     1
                          −8   −1   −1    7    −1   −1   
                                                                         
                                                                                         1    
           
           
           
                8     8         8    8    8     8    8   
                                                         
                                                            1   6   2    
                                                                            12
                                                                           
                                                                                   2            
                                                                                                
                                                                                                
                                                                                                
           
           
              −1   −1     1
                          −8   −1   −1   −1    7    −1   
                                                         
                                                                           
                                                                             2
                                                                            
                                                                                   5       1    
                                                                                                
                                                                                                
           
               8     8         8    8     8   8     8   
                                                             1   7   2     
                                                                             1    2            
                                                                                                
                                                                                   7
               −1
                8
                    −18
                           1
                          −8   −1
                                8
                                    −1
                                     8
                                         −18
                                               −1
                                                8
                                                    7
                                                    8                         2    2
                                                                                           1




原点を重心に平行移動したときの座標に変換することが行列
                                               1
                                     J 8 = E8 − 18×8
                                               8
を掛けることに対応する.


    溝口佳寛 (九大 IMI)                   行列計算を利用したデータ解析技術                                   2012/04/15   25 / 44
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術

Weitere ähnliche Inhalte

Was ist angesagt?

明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」  佐野正太郎明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」  佐野正太郎
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎Preferred Networks
 
数学で解き明かす深層学習の原理
数学で解き明かす深層学習の原理数学で解き明かす深層学習の原理
数学で解き明かす深層学習の原理Taiji Suzuki
 
PyMCがあれば,ベイズ推定でもう泣いたりなんかしない
PyMCがあれば,ベイズ推定でもう泣いたりなんかしないPyMCがあれば,ベイズ推定でもう泣いたりなんかしない
PyMCがあれば,ベイズ推定でもう泣いたりなんかしないToshihiro Kamishima
 
「統計的学習理論」第1章
「統計的学習理論」第1章「統計的学習理論」第1章
「統計的学習理論」第1章Kota Matsui
 
パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化Miyoshi Yuya
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介Naoki Hayashi
 
A summary on “On choosing and bounding probability metrics”
A summary on “On choosing and bounding probability metrics”A summary on “On choosing and bounding probability metrics”
A summary on “On choosing and bounding probability metrics”Kota Matsui
 
GAN(と強化学習との関係)
GAN(と強化学習との関係)GAN(と強化学習との関係)
GAN(と強化学習との関係)Masahiro Suzuki
 
パターン認識と機械学習6章(カーネル法)
パターン認識と機械学習6章(カーネル法)パターン認識と機械学習6章(カーネル法)
パターン認識と機械学習6章(カーネル法)Yukara Ikemiya
 
条件付き確率場の推論と学習
条件付き確率場の推論と学習条件付き確率場の推論と学習
条件付き確率場の推論と学習Masaki Saito
 
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process ModelsDeep Learning JP
 
グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知Yuya Takashina
 
機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門hoxo_m
 
第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知Chika Inoshita
 
PRML 1.5-1.5.5 決定理論
PRML 1.5-1.5.5 決定理論PRML 1.5-1.5.5 決定理論
PRML 1.5-1.5.5 決定理論Akihiro Nitta
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定Akira Masuda
 
敵対的学習に対するラデマッハ複雑度
敵対的学習に対するラデマッハ複雑度敵対的学習に対するラデマッハ複雑度
敵対的学習に対するラデマッハ複雑度Masa Kato
 
深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点Taiji Suzuki
 
レプリカ交換モンテカルロ法で乱数の生成
レプリカ交換モンテカルロ法で乱数の生成レプリカ交換モンテカルロ法で乱数の生成
レプリカ交換モンテカルロ法で乱数の生成Nagi Teramo
 

Was ist angesagt? (20)

明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」  佐野正太郎明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」  佐野正太郎
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎
 
数学で解き明かす深層学習の原理
数学で解き明かす深層学習の原理数学で解き明かす深層学習の原理
数学で解き明かす深層学習の原理
 
PyMCがあれば,ベイズ推定でもう泣いたりなんかしない
PyMCがあれば,ベイズ推定でもう泣いたりなんかしないPyMCがあれば,ベイズ推定でもう泣いたりなんかしない
PyMCがあれば,ベイズ推定でもう泣いたりなんかしない
 
「統計的学習理論」第1章
「統計的学習理論」第1章「統計的学習理論」第1章
「統計的学習理論」第1章
 
パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化パターン認識第9章 学習ベクトル量子化
パターン認識第9章 学習ベクトル量子化
 
Jokyokai
JokyokaiJokyokai
Jokyokai
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
 
A summary on “On choosing and bounding probability metrics”
A summary on “On choosing and bounding probability metrics”A summary on “On choosing and bounding probability metrics”
A summary on “On choosing and bounding probability metrics”
 
GAN(と強化学習との関係)
GAN(と強化学習との関係)GAN(と強化学習との関係)
GAN(と強化学習との関係)
 
パターン認識と機械学習6章(カーネル法)
パターン認識と機械学習6章(カーネル法)パターン認識と機械学習6章(カーネル法)
パターン認識と機械学習6章(カーネル法)
 
条件付き確率場の推論と学習
条件付き確率場の推論と学習条件付き確率場の推論と学習
条件付き確率場の推論と学習
 
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
 
グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知
 
機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門
 
第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知
 
PRML 1.5-1.5.5 決定理論
PRML 1.5-1.5.5 決定理論PRML 1.5-1.5.5 決定理論
PRML 1.5-1.5.5 決定理論
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
 
敵対的学習に対するラデマッハ複雑度
敵対的学習に対するラデマッハ複雑度敵対的学習に対するラデマッハ複雑度
敵対的学習に対するラデマッハ複雑度
 
深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点
 
レプリカ交換モンテカルロ法で乱数の生成
レプリカ交換モンテカルロ法で乱数の生成レプリカ交換モンテカルロ法で乱数の生成
レプリカ交換モンテカルロ法で乱数の生成
 

Ähnlich wie 行列計算を利用したデータ解析技術

K010 appstat201201
K010 appstat201201K010 appstat201201
K010 appstat201201t2tarumi
 
LET2011: Rによる教育データ分析入門
LET2011: Rによる教育データ分析入門LET2011: Rによる教育データ分析入門
LET2011: Rによる教育データ分析入門Yuichiro Kobayashi
 
データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習Seiichi Uchida
 
Datamining 5th knn
Datamining 5th knnDatamining 5th knn
Datamining 5th knnsesejun
 
Datamining 5th Knn
Datamining 5th KnnDatamining 5th Knn
Datamining 5th Knnsesejun
 
テーマ別勉強会(R言語)#3.pdf
テーマ別勉強会(R言語)#3.pdfテーマ別勉強会(R言語)#3.pdf
テーマ別勉強会(R言語)#3.pdfTakuya Kubo
 
機械学習を用いたWeb上の産学連携関連文書の抽出
機械学習を用いたWeb上の産学連携関連文書の抽出機械学習を用いたWeb上の産学連携関連文書の抽出
機械学習を用いたWeb上の産学連携関連文書の抽出National Institute of Informatics
 
Intoroduction of Pandas with Python
Intoroduction of Pandas with PythonIntoroduction of Pandas with Python
Intoroduction of Pandas with PythonAtsushi Hayakawa
 
2022年度秋学期 応用数学(解析) 第6回 変数分離形の変形 (2022. 10. 27)
2022年度秋学期 応用数学(解析) 第6回 変数分離形の変形 (2022. 10. 27) 2022年度秋学期 応用数学(解析) 第6回 変数分離形の変形 (2022. 10. 27)
2022年度秋学期 応用数学(解析) 第6回 変数分離形の変形 (2022. 10. 27) Akira Asano
 
データ解析13 線形判別分析
データ解析13 線形判別分析データ解析13 線形判別分析
データ解析13 線形判別分析Hirotaka Hachiya
 
TokyoWebmining統計学部 第1回
TokyoWebmining統計学部 第1回TokyoWebmining統計学部 第1回
TokyoWebmining統計学部 第1回Issei Kurahashi
 
R言語勉強会#4.pdf
R言語勉強会#4.pdfR言語勉強会#4.pdf
R言語勉強会#4.pdfTakuya Kubo
 
充足可能性問題のいろいろ
充足可能性問題のいろいろ充足可能性問題のいろいろ
充足可能性問題のいろいろHiroshi Yamashita
 
計算機を用いて数学の問題を解くということ
計算機を用いて数学の問題を解くということ計算機を用いて数学の問題を解くということ
計算機を用いて数学の問題を解くということYoshihiro Mizoguchi
 
圏論のモナドとHaskellのモナド
圏論のモナドとHaskellのモナド圏論のモナドとHaskellのモナド
圏論のモナドとHaskellのモナドYoshihiro Mizoguchi
 
クラシックな機械学習の入門 4. 学習データと予測性能
クラシックな機械学習の入門  4.   学習データと予測性能クラシックな機械学習の入門  4.   学習データと予測性能
クラシックな機械学習の入門 4. 学習データと予測性能Hiroshi Nakagawa
 
関数モデル 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第8回】
関数モデル 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第8回】関数モデル 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第8回】
関数モデル 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第8回】Tomoharu ASAMI
 
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII
 

Ähnlich wie 行列計算を利用したデータ解析技術 (20)

K010 appstat201201
K010 appstat201201K010 appstat201201
K010 appstat201201
 
LET2011: Rによる教育データ分析入門
LET2011: Rによる教育データ分析入門LET2011: Rによる教育データ分析入門
LET2011: Rによる教育データ分析入門
 
データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習
 
Datamining 5th knn
Datamining 5th knnDatamining 5th knn
Datamining 5th knn
 
Datamining 5th Knn
Datamining 5th KnnDatamining 5th Knn
Datamining 5th Knn
 
テーマ別勉強会(R言語)#3.pdf
テーマ別勉強会(R言語)#3.pdfテーマ別勉強会(R言語)#3.pdf
テーマ別勉強会(R言語)#3.pdf
 
機械学習を用いたWeb上の産学連携関連文書の抽出
機械学習を用いたWeb上の産学連携関連文書の抽出機械学習を用いたWeb上の産学連携関連文書の抽出
機械学習を用いたWeb上の産学連携関連文書の抽出
 
Intoroduction of Pandas with Python
Intoroduction of Pandas with PythonIntoroduction of Pandas with Python
Intoroduction of Pandas with Python
 
2022年度秋学期 応用数学(解析) 第6回 変数分離形の変形 (2022. 10. 27)
2022年度秋学期 応用数学(解析) 第6回 変数分離形の変形 (2022. 10. 27) 2022年度秋学期 応用数学(解析) 第6回 変数分離形の変形 (2022. 10. 27)
2022年度秋学期 応用数学(解析) 第6回 変数分離形の変形 (2022. 10. 27)
 
データ解析13 線形判別分析
データ解析13 線形判別分析データ解析13 線形判別分析
データ解析13 線形判別分析
 
TokyoWebmining統計学部 第1回
TokyoWebmining統計学部 第1回TokyoWebmining統計学部 第1回
TokyoWebmining統計学部 第1回
 
Tokyo r27
Tokyo r27Tokyo r27
Tokyo r27
 
R言語勉強会#4.pdf
R言語勉強会#4.pdfR言語勉強会#4.pdf
R言語勉強会#4.pdf
 
CG2013 02
CG2013 02CG2013 02
CG2013 02
 
充足可能性問題のいろいろ
充足可能性問題のいろいろ充足可能性問題のいろいろ
充足可能性問題のいろいろ
 
計算機を用いて数学の問題を解くということ
計算機を用いて数学の問題を解くということ計算機を用いて数学の問題を解くということ
計算機を用いて数学の問題を解くということ
 
圏論のモナドとHaskellのモナド
圏論のモナドとHaskellのモナド圏論のモナドとHaskellのモナド
圏論のモナドとHaskellのモナド
 
クラシックな機械学習の入門 4. 学習データと予測性能
クラシックな機械学習の入門  4.   学習データと予測性能クラシックな機械学習の入門  4.   学習データと予測性能
クラシックな機械学習の入門 4. 学習データと予測性能
 
関数モデル 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第8回】
関数モデル 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第8回】関数モデル 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第8回】
関数モデル 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第8回】
 
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
 

Mehr von Yoshihiro Mizoguchi

DockerでAlmaLinux(web, php, pukiwiki)環境構築
DockerでAlmaLinux(web, php, pukiwiki)環境構築DockerでAlmaLinux(web, php, pukiwiki)環境構築
DockerでAlmaLinux(web, php, pukiwiki)環境構築Yoshihiro Mizoguchi
 
DockerでCoq インストール
DockerでCoq インストールDockerでCoq インストール
DockerでCoq インストールYoshihiro Mizoguchi
 
Homebrewによるソフトウェアの実装 (3)
Homebrewによるソフトウェアの実装 (3)Homebrewによるソフトウェアの実装 (3)
Homebrewによるソフトウェアの実装 (3)Yoshihiro Mizoguchi
 
Homebrewによるソフトウェアの実装 (2)
Homebrewによるソフトウェアの実装 (2)Homebrewによるソフトウェアの実装 (2)
Homebrewによるソフトウェアの実装 (2)Yoshihiro Mizoguchi
 
Homebrewによるソフトウェアの実装(1)
Homebrewによるソフトウェアの実装(1)Homebrewによるソフトウェアの実装(1)
Homebrewによるソフトウェアの実装(1)Yoshihiro Mizoguchi
 
Overleafを使った文書作成
Overleafを使った文書作成Overleafを使った文書作成
Overleafを使った文書作成Yoshihiro Mizoguchi
 
Symbolic Computations in Conformal Geometric Algebra for Three Dimensional O...
Symbolic Computations in Conformal Geometric Algebra for Three Dimensional  O...Symbolic Computations in Conformal Geometric Algebra for Three Dimensional  O...
Symbolic Computations in Conformal Geometric Algebra for Three Dimensional O...Yoshihiro Mizoguchi
 
Theory of Relational Calculus and its Formalization
Theory of Relational Calculus and its FormalizationTheory of Relational Calculus and its Formalization
Theory of Relational Calculus and its FormalizationYoshihiro Mizoguchi
 
数式処理ソフトMathematicaで数学の問題を解く
数式処理ソフトMathematicaで数学の問題を解く数式処理ソフトMathematicaで数学の問題を解く
数式処理ソフトMathematicaで数学の問題を解くYoshihiro Mizoguchi
 
Verification of a brick wang tiling algorithm
Verification of a brick wang tiling algorithmVerification of a brick wang tiling algorithm
Verification of a brick wang tiling algorithmYoshihiro Mizoguchi
 
A Coq Library for the Theory of Relational Calculus
A Coq Library for the Theory of Relational CalculusA Coq Library for the Theory of Relational Calculus
A Coq Library for the Theory of Relational CalculusYoshihiro Mizoguchi
 
Algebras for programming languages
Algebras for programming languagesAlgebras for programming languages
Algebras for programming languagesYoshihiro Mizoguchi
 
定理証明支援系Coqについて
定理証明支援系Coqについて定理証明支援系Coqについて
定理証明支援系CoqについてYoshihiro Mizoguchi
 
Coq関係計算ライブラリの開発と写像の性質の証明
Coq関係計算ライブラリの開発と写像の性質の証明Coq関係計算ライブラリの開発と写像の性質の証明
Coq関係計算ライブラリの開発と写像の性質の証明Yoshihiro Mizoguchi
 
Mac bookでwebサーバーを起動する方法
Mac bookでwebサーバーを起動する方法Mac bookでwebサーバーを起動する方法
Mac bookでwebサーバーを起動する方法Yoshihiro Mizoguchi
 
有限オートマトンとスティッカー系に関するCoqによる形式証明について
有限オートマトンとスティッカー系に関するCoqによる形式証明について有限オートマトンとスティッカー系に関するCoqによる形式証明について
有限オートマトンとスティッカー系に関するCoqによる形式証明についてYoshihiro Mizoguchi
 

Mehr von Yoshihiro Mizoguchi (20)

DockerでAlmaLinux(web, php, pukiwiki)環境構築
DockerでAlmaLinux(web, php, pukiwiki)環境構築DockerでAlmaLinux(web, php, pukiwiki)環境構築
DockerでAlmaLinux(web, php, pukiwiki)環境構築
 
DockerでCoq インストール
DockerでCoq インストールDockerでCoq インストール
DockerでCoq インストール
 
Homebrewによるソフトウェアの実装 (3)
Homebrewによるソフトウェアの実装 (3)Homebrewによるソフトウェアの実装 (3)
Homebrewによるソフトウェアの実装 (3)
 
Homebrewによるソフトウェアの実装 (2)
Homebrewによるソフトウェアの実装 (2)Homebrewによるソフトウェアの実装 (2)
Homebrewによるソフトウェアの実装 (2)
 
Homebrewによるソフトウェアの実装(1)
Homebrewによるソフトウェアの実装(1)Homebrewによるソフトウェアの実装(1)
Homebrewによるソフトウェアの実装(1)
 
Overleafを使った文書作成
Overleafを使った文書作成Overleafを使った文書作成
Overleafを使った文書作成
 
Amazon AWSの使い方
Amazon AWSの使い方Amazon AWSの使い方
Amazon AWSの使い方
 
ShareLaTeXの使い方
ShareLaTeXの使い方ShareLaTeXの使い方
ShareLaTeXの使い方
 
Symbolic Computations in Conformal Geometric Algebra for Three Dimensional O...
Symbolic Computations in Conformal Geometric Algebra for Three Dimensional  O...Symbolic Computations in Conformal Geometric Algebra for Three Dimensional  O...
Symbolic Computations in Conformal Geometric Algebra for Three Dimensional O...
 
Theory of Relational Calculus and its Formalization
Theory of Relational Calculus and its FormalizationTheory of Relational Calculus and its Formalization
Theory of Relational Calculus and its Formalization
 
数式処理ソフトMathematicaで数学の問題を解く
数式処理ソフトMathematicaで数学の問題を解く数式処理ソフトMathematicaで数学の問題を解く
数式処理ソフトMathematicaで数学の問題を解く
 
Verification of a brick wang tiling algorithm
Verification of a brick wang tiling algorithmVerification of a brick wang tiling algorithm
Verification of a brick wang tiling algorithm
 
A Coq Library for the Theory of Relational Calculus
A Coq Library for the Theory of Relational CalculusA Coq Library for the Theory of Relational Calculus
A Coq Library for the Theory of Relational Calculus
 
Algebras for programming languages
Algebras for programming languagesAlgebras for programming languages
Algebras for programming languages
 
定理証明支援系Coqについて
定理証明支援系Coqについて定理証明支援系Coqについて
定理証明支援系Coqについて
 
Coq関係計算ライブラリの開発と写像の性質の証明
Coq関係計算ライブラリの開発と写像の性質の証明Coq関係計算ライブラリの開発と写像の性質の証明
Coq関係計算ライブラリの開発と写像の性質の証明
 
Coqチュートリアル
CoqチュートリアルCoqチュートリアル
Coqチュートリアル
 
Mac bookでwebサーバーを起動する方法
Mac bookでwebサーバーを起動する方法Mac bookでwebサーバーを起動する方法
Mac bookでwebサーバーを起動する方法
 
有限オートマトンとスティッカー系に関するCoqによる形式証明について
有限オートマトンとスティッカー系に関するCoqによる形式証明について有限オートマトンとスティッカー系に関するCoqによる形式証明について
有限オートマトンとスティッカー系に関するCoqによる形式証明について
 
計算可能実数とは
計算可能実数とは計算可能実数とは
計算可能実数とは
 

行列計算を利用したデータ解析技術

  • 1. 九州数学教育会第 6 回算数数学教育研修会 (於. 福岡県立修猷館高等学校) 行列計算を利用したデータ解析技術 主成分分析・多次元尺度構成法 溝口佳寛 九州大学 マス・フォア・インダストリ研究所   http://www.slideshare.net/yoshihiromizoguchi/ 2012 年 4 月 15 日 (日) 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 1 / 44
  • 2. 目次 1 .. 自己紹介 2 はじめに 3 .. 最初の例 4 準備 5 .. 特異値分解 (SVD) 6 主成分分析 (PCA) 7 .. 多次元尺度構成法 (MDS) 8 まとめ 9 .. 参考文献 .. .. .. 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 2 / 44
  • 3. マス・フォア・インダストリ研究所 (正式名称) http://www.imi.kyushu-u.ac.jp/ (産業数学研究所 (俗称)) 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 3 / 44
  • 4. 研究者情報 (ResearchMap) http://researchmap.jp/yoshihiro/ 「Yoshihiro Mizoguchi」で検索. 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 4 / 44
  • 5. プロフィール 計算について論理的・数学的に考察する研究を行っています. 1930 年代 Alan Turing は「チューリ ング機械」と呼ばれる形式的な計算モデルを構成し, 計算可能性, 万能性に関する計算理論の礎を築 きました. 数の計算の実現に計算モデルのテープ上に記述された文字列が重要な役割を果たしました. 計算モデル「有限オートマトン」の研究では 1950 年代に入り文字列集合の認識機械としての考察が 始まり言語との重要な関係が導かれました. その後, 形式言語の研究は「自然言語の機械翻訳」 「文献 データベース」 「人工知能」などの研究へと発展しています. 数学 (代数学) は「群」 「環」 「体」などの一種の集合上の演算を持つ代数系を対象とします. 代数系 はモナドと呼ばれる圏の間の関手たちにより多種の集合間の関数を演算として持つ系に一般化され ます. 多種代数系は「スタック」 「木」 「グラフ」などのプログラミングに必要なデー タ構造を含みま すので, 多種代数系やモナドの研究成果は計算の性質を考察するための強力な武器になります. 近年の計算機の発展と普及により, 社会システムは計算機 (プログラム) にますます依存して来てい ます. システムに要求される仕様をプログラムで実現し計算機で実行します. プログラムが仕様を正 しく実現していることは, 数理論理学において証明が定理を正しく導いていることに対応します. 論 理的に誤りがないプログラムのための仕様記述, 開発, 検証の技術は形式手法と呼ばれます. 証券取 引, 交通網, 航空宇宙工学, マイクロプロセッサなどプログラムの誤りにより多大な損失が生じるシス テムに形式手法は活用されています. 最近は論理的・数学的な考察そのものにも計算機が利用され, 形式手法のための数学理論の構築と 実現がますます重要になっています. 数の取り扱いのための文字列の研究のように, 計算に必要な数 学概念の計算モデルの研究を続けています. 最近では, デジタル映像分野における計算のための新し い計算モデルも模索しています. 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 5 / 44
  • 6. デジタル映像数学の構築と表現技術の革新 CREST 研究プロジェクト (2010-2015): CG 固有の問題を数学的に解く (MCG: Mathematics & Computer Graphics) チーム HP は 5 月公開予定 http://mcg.imi.kyushu-u.ac.jp/ 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 6 / 44
  • 7. はじめに FFT, RSA, DCT は知っている (聞いたことがある).   PCA, MDS, SVD って何だろう? 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 7 / 44
  • 8. デジタルデータの話題 デジタル機器で利用される数学技術の例:   FFT (高速フーリエ変換) J.W.Cooley and T.W.Turkey (1965). 信号処理 (通信や放送, 医療計測), 多倍精度数値計算などで利用 RSA (公開鍵暗号方式) R.Rivest, A.Shamir, L.Adleman (1977). インターネット・オンラインショ ッピング等で利用 DCT (離散コサイン変換) N.Ahmed, T.Natarajan and K.R.Rao (1974). デジタルカメラ等の画像ファイル圧縮 (JPEG) で利用 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 8 / 44
  • 9. 大量データの話題 「ビッグデータ」と呼ばれる大量データ処理で利用されている技術. (cf. ギガ (106 ) バイト (G), テラ (1012 ) バイト (T), ペタ (1015 ) バ イト (P))   PCA (主成分分析) K.Pearson (1901). 高次元データをデータ間の特徴を表す低次元データに圧縮する方法 MDS (多次元尺度構成法) W.S.Torgerson (1952)[3] 距離の関係がわかっているデータたちを表現する多次元データ座標 を構成する. SVD (特異値分解) PCA や MDS の基礎となる線形代数の定理 (行列の対角化の一般化). C.Eckard and G.Young (1936)[1]. The approximation of one matrix by another of lower rank, Psychometrika, 1(3). ⇐ 心理学の雑誌 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 9 / 44
  • 10. 最初の例 (成績処理) 国語 数学 英語 f (x1 , x2 , x3 ) x1 x2 x3 f (x) = a1 x1 + a2 x2 + a3 x3 A 40 40 52 f ( A) B 40 46 52 f (B) とするとき, a1 , a2 , a3 の値を C 46 52 52 f (C) どのようにすれば f (x) の標準 D 46 58 52 f ( D) 偏差 (点数のばらつき) を最大 E 40 64 40 f (E) にすることが出来るか? F 40 70 40 f (F) 但し, a2 + a2 + a2 = 1 の条件 G 46 76 40 f (G) 1 2 3 を加える. H 46 82 40 f (H) 平均 43 61 46 標準偏差 3.21 14.7 6.41 最大化 a1 = a2 = a3 = 1 √ 3 が単純な合計値に対応する. 注意: ばらつきを大きくすることと成績の善し悪しの評価とは無関係! (例: ai の符号を全て反転しても, ばらつきは同じ.) 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 10 / 44
  • 11. 成績処理 (2) 国語 数学 英語 x1 x2 x3 f (x) g(x) h(x) A 40 40 52 76.2 21.3 46.4 B 40 46 52 79.7 26.9 49.8 C 46 52 52 86.6 32.9 55.6 D 46 58 52 90.1 38.5 59.0 E 40 64 40 83.1 48.0 58.1 F 40 70 40 86.6 53.5 61.6 G 46 76 40 93.5 59.5 67.3 H 46 82 40 96.9 65.1 70.7 平均 43 61 46 86.6 43.2 58.6 標準偏差 3.21 14.7 6.41 6.93 15.8 8.16 1 f (x1 , x2 , x3 ) = √ (x1 + x2 + x3 ) 3 g(x1 , x2 , x3 ) = 0.0795457x1 + 0.927542x2 − 0.365156x3 h(x1 , x2 , x3 ) = 0.395067x1 + 0.565842x3 + 0.154093x3 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 11 / 44
  • 12. 成績処理 (3) A, B, · · · , H を座標 (g(x), h(x)) でプロットしたもの. 85 C D 80 G H hx 75 A B E F 70 65 20 30 40 50 60 70 gx ※ 3 科目の成績の特徴を 2 次元平面に上手にプロットする方法は? 3 次元データの特徴を維持しつつ, 2 次元データに圧縮する方法は? 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 12 / 44
  • 13. 記号と基礎統計量の復習 x = (x1 , x2 , · · · , x n), y = (y1 , y2 , · · · , y n), 1 = (1, 1, · · · , 1) とする.      y1      ∑ n ( )    y2     内積 s= xi yi = x, y = x · y t = x1 x2 ··· xn ·     .        . .    i=1     yn ∑ n ノルム ||x|| = x, x = (xi )2 i=1 ∑ n 合計 s= xi = 1, x i=1 1 平均 x= ¯ 1, x nn ∑ 分散 σ2 = (xi − x)2 = x − x1, x − x1 ¯ ¯ ¯ √i=1 標準偏差 σ= x − x1, x − x1 ¯ ¯ データの分析, 数列 (Σ), 行列, ベクトル, · · · の勉強が必要. 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 13 / 44
  • 14. データ行列 · 距離行列 · 内積行列 n 個のデータ oi = (xi1 , xi2 , · · · , xip) (i = 1, · · · , n) を考える. ここで は, p ≤ n としておく. n × p 行列, X = (xi j ) (i = 1, · · · , n, j = 1, · · · , p) に対して, n × n 行列 M と B を M = (||oi − o j ||), B = ( oi , o j ) = (oi · (o j ) t ) = X · X t とする. M を距離行列, B を内積行列, X をデータ行列と呼ぶことにする. n × 1 の列ベクトルを xi = (x1i , x2i , · · · , x ni ) (i = 1, · · · , p) と書き, X = (x1 , x2 , · · · , x p) と書くこともある. X が n × p 行列のとき, B = X · X t は n × n 行列, X t · X は p × p 行列. 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 14 / 44
  • 15. B と X の関係 問題 n × n 行列 B = (bi j ) が与えられ, X がわからないときに, 適当な次元 p を . 定め, bi j = oi , o j (i = 1, · · · , n, j = 1, · · · , n), すなわち, B = X · X t とな るような, n 個のベクトル oi = (xi1 , xi2 , · · · , xip) を求めよ. B を直交対角化して UBU t = Λ と対角行列に出来たとする. このとき, B . は半正定値行列であり固有値は 0 または正であることが知られていて, √ Λ (行列 Λ の対角成分に全て平方根を施した行列) を作ることが出来る. √ √ √ √ そして, B = U t ( Λ)2 U = (U t Λ)(U t Λ) t であり, X c = U t Λ とすると B = X c X c となる. このときの X c は n × n 行列である. t  b ···   u ···  λ ···  u ···   11   b12 b1n   11     u21 u n1   11  0 0   11  u12 u1n     b21   b22 b2n   u12       u22 u n2   0    λ22 0    u21    u22 u2n                .    .   . = .    .  .    .  .   .        . .   .       .  .   .  .   .        .   .       .  .     .  .     .      b n1 b n2 ··· b nn u1n u2n ··· u nn 0 0 ··· λ nn u n1 u n2 ··· u nn 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 15 / 44
  • 16. アルゴリズム 1 B を作ったもとのデータ行列 X を探す: X = (xi j ) のランクが p であるとき, rank(B) は p であることが知られてお り, Λ の対角成分は λ1 ≥ λ2 ≥ · · · ≥ λ p で, λ p+1 = · · · = λn = 0 と考えて 良い. Λ = (λi j ), u = (ui j ) とし, r ≤ p とするとき, r × r 行列 Λ r = (λi j ) (i, j = 1, · · · , r), n × r 行列 U r = (ui j ) (i = 1, · · · , n, j = 1, · · · , p) とする √ と B = U pΛ pU p となる. X c = U p Λ p とすると X c は n × p 行列で, t B = X c X c となる. t  b ···   u ···  λ ···  u ···   11   b12 b1n   11     u21 u p1   11  0 0   11  u12 u1n     b21   b22 b2n   u12       u22 u p2  0     λ22 0   u21     u22 u2n                .    .   . = .    .  .    .  .   .        . .   .       .  .   .  .   .        .   .       .  .     .  .     .      b n1 b n2 ··· b nn u1n u p2 ··· u pn 0 0 ··· λ pp u p1 u2 p ··· u pn √  u    11   u21 ··· u p1     λ11 √ 0 ··· 0      u  12   u22 u p2     0 λ22 0             XC =  .     .     . .      .  .    . .     .   .    . .      √    u n1 u n2 ··· u pn 0 0 ··· λ pp 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 16 / 44
  • 17. 特異値分解 定理 (Singular Value Decomposition[1]) n × p 行列 X に対して, n × n 直交行列 U, p × p 直交行列 V が存在し, X = U · L · V t とすることが出来る. 但し, n × p 行列 L = (li j ) は対角行列 li j = 0 (i j, i = 1, · · · , n, j = 1, · · · , p) である. そして, このとき次の条件が満たされる. X · X t は, U で直交対角化され 0 でない固有値の集合は {l2 | lii 0, i = 1, · · · , p}. ii UU t = E n で, U(XX t )U t が対角行列になる. X t · X は, V で直交対角化され 0 でない固有値の集合は {l2 | lii 0, i = 1, · · · , p}. ii VV t = E n で, V(X t X)V が対角行列になる. rank(X) = #{lii | lii 0, i = 1, · · · , p}. (0 でない特異値の数) . ∑ p Tr(X · X ) = Tr(X · X) = t t 2 lii i=1 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 17 / 44
  • 18. 特異値分解 (例) 8 個の 3 次元ベクトルのデータ, すなわち, 8 × 3 行列 X を考える. 6 7      0 0 0    5     0 1 0              1 1 0          2 8   1 0 0   X=           0 0 1          3      0 1 1         1 1 1      1 1 0 1 4 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 18 / 44
  • 19. 行列 X の特異値分解 行列 X の特異値分解 X = U · L · V t を計算する.  0 0 0 0 0 0 0 1           1 √ 0 1 √ 1 − √1 − √3 1 √ 0       2       2 6 3 2 2 2 10 2 10       2 √2  1 −1 1 −1 1 − √ 1 − √1    √ √ √ 0       6 2 2 3 2 2 2 2 10 √ 10    0 √ 0                5     0 2 0 √      1 1 −√ 1 −√     1 2     √     √ −1 1 − √ 0 0 0 0   0 0 2   √6      2 6 2 2 3 2       3 2     X=  1 1 1 3    0 0 0    1 2       √ − √ −1 1 − √ − √ 1 √ 0       √ 0 3       2 6 2 2 3 2 2 2 √ 10 2 2 10    0 0 0    3             1 √ 1 √ 1 −√     1 √ 1 1 √ 0 0 2 √ 1 0    0 0 0       √6 2 2 3 5 10    0 0 0    3 2 6           3    0 0 0    2       0 0 0 √ 1 − √1 1 − √ 0       2      1 1 1 2 1 1 10 2 10   √ 0 − √ 2 − √ √ − √1 0 6 3 2 2 2 10 10 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 19 / 44
  • 20. X · X t の対角化 特異値分解の行列 U は X · X t を直交対角化する. (※ 対称行列 X · X t は直交行列で対角化可能).  0 0 0 0 0 0 0 1           1 √ −1 1 √ 1 − √1 − √3 1 √ 0       2 2       2 6 2 3 2 2 2 10 2 10       1 √ −1 − √ 1 −1 1 − √ 1 √ − √1 0       6 2 2 3 2 2 2 2 10 √ 10             5       2       1 √ 0 1 −√ 0 0 0 0       2 6 3 2     U=  1 1 1 3       √ √ −1 − √1 − √ 1 √ 0       2 6 2 2 3 2 2 2 √ 10 2 2 10             1 √ 0 1 √ 0 0 2 √ 1 0       √6 3 5 10             3       2       0 0 0 √ 1 − √1 1 − √ 0       2      1 1 1 1 2 1 1 10 2 10   √ 2 − √ 2 − √ √ − √1 0 6 2 3 2 2 2 10 10  0 0 0 0 0 0 0 0   8 0 0 0 0 0 0 0           0       0 1 1 0 0 1 1 0       2 0 0 0 0 0 0            0        0 1 2 1 0 1 2 1       0 2 0 0 0 0 0           t (X · X t )U = U t    0 0 1 1 0 0 1 1 U =  0        0 0 0 0 0 0 0      U    0 0 0 0 1 1 1 1     0   0 0 0 0 0 0 0             0       0 1 1 0 1 2 2 1       0 0 0 0 0 0 0            0       0 1 2 1 1 2 3 2     0 0 0 0 0 0 0   0 0 1 1 1 1 2 2 0 0 0 0 0 0 0 0 注: 0 以外の固有値は特異値の平方になる. 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 20 / 44
  • 21. X t · X の対角化 特異値分解の行列 V は X t · X を直交対角化する. (※ 対称行列 X t · X は直交行列で対角化可能).     1 √ −√ 1 −√ 1      3 2 √6        V=    1 √ 0 2        3 3     1 √ 1 √ − 1 √  3 2 6      4 2 2       8 0   0        V (X · X)V = V  2 4 2  V =  0 2 t t    t       0         2 2 4 0 0 2 注: 0 以外の固有値は特異値の平方になる. 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 21 / 44
  • 22. 中心化行列 定義 (中心化行列) 自然数 n に対して, E n を n × n 単位行列, 1 n を全成分が 1 の n 次元列ベク トル, 1 n×n を全成分が 1 の n × n 行列とする. このとき, n × n 行列 J n = E n − 1 1 n×n を中心化行列という. n . 1∑ n 1 n × p 行列 X に対して, J n X = (E n X − 1 n×n X) = (xi j − x k j ) であ n n k=1 ∑ n . り, J n X = (x ) とすると xi j = 0 となる. すなわち, J n X はデータ列 X ij i=1 の重心を原点に平行移動したデータ列になる. 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 22 / 44
  • 23. 主成分分析 (PCA) 定理 (Principal Component Analysis) 1 n × p 行列 X の共分散行列を p × p 行列 S = (J n X) t (J n X) とする. S を直 n 交対角化して VSV t = Λ となり, Λ = (λi j ) は, λi j = 0 (i j), λ11 ≥ λ22 ≥ · · · ≥ λ pp ≥ 0 とする. n × p 行列 Y を Y = (J n X) · V t とする と Y = (y1 , y2 , · · · , y p) = (yi j ) に対して, 次の性質が成り立つ. ∑n 1 yi j = 0 ( j = 1, · · · , p), (yi の平均は 0) i=1 1 t 2 Y Y = Λ (Y の共分散行列は対角行列で対角成分 (yi の分散) は固有値), n . 3 Tr(Y t Y) = Tr(S), 4 |Y t Y| = |S|. 変換されたデータ列 Y について, 次のことがわかる. (1) より各成分の平均は全て 0 である. (2) より各成分の分散は第 1 成分から順番に小さくなっている. 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 23 / 44
  • 24. PCA (例) 8 個の 3 次元ベクトルのデータ, すなわち, 8 × 3 行列 X を考える. 8 7   6    0 0 0    5          0 1 0             1 2 0       1 3 0    X=           0 4 2          4    0 5 2          3    1 6 2    2 1 7 2 1 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 24 / 44
  • 25. 中心化行列 (例) データ X の重心は ( 1 , 7 , 1) である. 2 2  7 −1 1 −8 −1 −1 −1 −1 −1   −1 −7 −1     8 8 8 8 8 8 8                 −1 2 2       0 0 0 −1    7 −1 −1 −1 −1 −1 −1   −5 −1     8 8 8 8 8 8 8 8     0 1 0     12     2         −1 −1 7 −1 −1 −1 −1 −1        2   −3 −1       8 8 8 8 8 8 8 8    1 2 0   1     2       −1 −1 1 −8 7 −1 −1 −1 −1          2 −1 −1     J8 X =   8 8 8 8 8 8 8    1 3 0 =     2       −1 −1 1 −8 −1 7 −1 −1 −1    0 4 2   −1     1       8 8 8 8 8 8 8          2 2 1          0 5 2     −1   3      −1 −1 1 −8 −1 −1 7 −1 −1       1     8 8 8 8 8 8 8    1 6 2     12   2        −1 −1 1 −8 −1 −1 −1 7 −1      2  5 1      8 8 8 8 8 8 8   1 7 2   1 2   7 −1 8 −18 1 −8 −1 8 −1 8 −18 −1 8 7 8 2 2 1 原点を重心に平行移動したときの座標に変換することが行列 1 J 8 = E8 − 18×8 8 を掛けることに対応する. 溝口佳寛 (九大 IMI) 行列計算を利用したデータ解析技術 2012/04/15 25 / 44