SlideShare ist ein Scribd-Unternehmen logo
1 von 29
多変量解析と時系列解析
演習用資料
(東京大学 数理科学研究科)
2014-07-11 下野寿之 (株)ウフル
自己紹介
• 修士まで京大で数学→博士は東大・情報理工で量子情報
• その後、レコメンドエンジン・検索エンジン・グロースハッキ
ングなど、データ分析とそれに基づいたアルゴリズム作り
• 統計学は統計数理研究所の公開講座などで学ぶ。
• 現在 “医学統計学研究センター” に通っている。
• 後5年でデータ分析に対する迷いを消したい。
話す内容
1. ランダムウォークの相関(10兆個の乱数で調査)
2. 大量件数のデータ分析で分かること(ツイッター)
3. 重回帰は楕円の作図で理解できる話(プロ野球)
4. 対応分析とバブルチャートを組み合わせる
作業環境(ソフト,ハード,サービス)
• Windows と Cygwin
• Perl (特にデバッグモード) と SQLite3
• EmEditor (多目的エディタ)
▶ 数ギガバイトでも余裕
▶ CSVも見やすい(区切り文字は自由)
▶ 指定した文字列を10通りのマーカーで着色できて便利
• Amazon AWS
▶ メモリ32GBのEC2インスタンスを 1 ドル弱/時間 で利用できる
• R言語とScilabでグラフの描画
• 同じ大きさのディスプレイ2枚を横に並べる
4
1.ランダムウォークの相関
“ランダムウォーク同士の相関係数” の
分布についてのヒストグラム
• ±0.67の外側に20%が分布し、±0.83の外側に5%が分布する。
±0.41の外側に50%が分布し、±0.72の外側に15%が分布する。
• 2個の時系列のグラフの 同じ時刻ごとの値のペアについて 相関係数が高くても、
単にそれだけでは 将来の動き方が連動するとは、とても言いがたい。
100万対をおよそ10億対に増やした
時刻とランダムウォークの相関
2.大量件数のデータを
ビジュアル化して
初めて分かること
集計対象のツイッター発言データ :
1. 収集期間 ・・・・・・・・・・・・・・・・・・・・・・・・・・ 2013年12月10日から32日間
2. 収集した発言の数 ・・・・・・・・・・・・・・・・・・ ・・ ・・・・・・・・・・・・・・・・ 約320万件
3. 含まれていたアカウント数・・・・・・・・・・・・・・・・ ・・・ 約130万アカウント
4. ツイート発言で収集した範囲 ・・・・・・・・・・・下記の単語を含む発言
▼ ヒットしたツイート発言の多いアカウント 上位9個
“おせち イオン ジャスコ ヨーカドー 西友
ルミネ パルコ ラゾーナ ららぽーと
伊勢丹 三越 高島屋 丸井 初売り 初商 福袋
東急 東急本店 東横店 フードショー
ヒカリエ シンクス ShinQs
百貨店 デパート ショッピングセンター
クリアランス バーゲンセール バレンタイン ホワイトデー”
10
30万アカウントに対するフォロー数とフォロワー数。
色と抽出数を段階的に変えて重ねた。
楕円的形状よりも細かな細部構造を知るには
おそらく数千から数万件のデータが必要
12
N = 300 N = 3000
N = 3万
N = 132万5580
1万アカウントのデータを使うか、100万にするかで、
“影響力” の検討に使うグラフの滑らかさが違う
N = 1万N = 100万
フォロー数(x)とフォロワー数(y)と
ツイート数(z) 関して
▲ ユーザー1.3万人を抽出してScilabで3次元プロット。
Snagitで30秒の動画にした。
▲ ツイート約4000を抽出して、RTと被RTの分布を見ようとした。
3次元で手に取るように回転・移動をして眺めることが出来て分析当事者にとって発見が多い。
▶ x, y, z の値の広がりと相関 ▶ 注目したセグメントの形状▶ 注目している各発言の位置づけ
→ 2次元では分からない形状が分かる。 → 値の大小の感覚や、異常なのかなど
この節のまとめ
▶数万件・数十万件のデータがあって、
初めて気が付くようなことがある。
▶2次元では分からず3次元に図示して、
初めて気が付くことがある。
▶数十万件以上のデータを有意義な可視化には、
おそらく未知のノウハウが必要。
(色彩も重要になる。)
▶グラフから数値を読めるようにするには、
格子を線ではなく十字にすると良い(2次元の場合)。
(従来の方眼紙は使わない。)
3.重回帰係数は
楕円で考えることが出来る
参照したデータ :
「日本プロ野球記録大百科2004」
1954年-61年, 69年-89年, 94年, 96年の
31カ年は、プロ野球のセントラルリーグで
6球団が年間に130試合行っている。
これらの年の6球団の、以下の変数に着目した。
1. 年間順位
2. 年間の総得点(各戦いの自チームの得点の総和)
3. 年間の総失点(各戦いで対戦相手の得点の総和)
[観点]
◎ 優勝する球団は得点は大きく失点は小さいはず
◎ そういう関係は “数量” の観点でどう理解できるか?
年間総得点と年間順位の関係
相関係数は -0.419..
年間の得点が多いほど
順位は上がり優勝に近づく
年間総失点と年間順位の関係
相関係数は +0.471..
年間の失点が少ないほど
順位は上がり優勝に近づく
総得点(x)と総失点(y)の関係
相関係数は +0.423..
(得点と失点は正に相関する)
順位を総得点と総失点で重回帰
重相関係数は 0.828..
◎目的変数(順位)は2個の説明変数を用いることで
予測精度が上がった。
◎ これらの数量の関係をどう理解したら良いだろうか??
数量の関係をどう理解したら
良いだろうか??
• 実は、難しい数式を経由しなくても、重相関係数などは作図で
求めることができる。
• 楕円を描く方法と、球面三角形を描く方法がある。
• 重回帰の幾何的な表現により、把握が容易になる。
(この後で述べる方法を広く普及させたい!)
• 重回帰に関係するいろいろな現象の理解を俯瞰的に与えるこ
とが出来る。
• 既にある多変量に関係する理論を分かりやすく再構築する可
能性がある。
• 新たな理論を導く可能性もある。
重相関係数は楕円の作図で求まる
説明変数間(総得点と総失点)の相関係数ρに応じて、x=±1,y=±1に囲まれた正方形に4点(±ρ, ±1), (±1, ±ρ) で内
接する楕円を描く。そして、説明変数たちに対する目的変数(年間順位)への相関係数の組(ρ1,ρ2)に対応する点
に打点する。図において2個の楕円の相似比が、重相関係数に等しい。(原点から補助線を図のように引くか、同
心・同方向・相似な楕円を打点を通るように描く。)
決定係数は楕円の面積比となる。なお、高次元への拡張は容易。さらにある工夫をすることで偏相関係数を求めることも可能。
重相関係数は球面三角形の作図で
考えることもできる
便宜上ここでは得点を-1倍する。3変数(順位、得点、失点)の間の相関係数が、球面三角形X1X2Yの辺の長さ
(65°,62°,(59+55)°)のcos(余弦)に一致するようにする。球面三角形の頂点がそれぞれの変数に対応している。
目的変数に対応する頂点から、対辺へ垂線を伸ばしたときの、垂線の長さ(34°)のcos が重相関係数に等しい。
(なお、球面三角形の内角の cos は (3個考えられる) 偏相関係数と一致する。)
ちなみに
全体像はこうなる
この節のまとめ
• プロ野球の年間順位、総得点、総失点の数量的な関係を幾何
的に捉えることが可能となった。
• 同様に野球やスポーツのさまざまな数量の関係を幾何的な作図
の概念で、把握して予測精度の考察も可能。
• スポーツに限らない。
[数理的なこと]
• 重相関係数などの重回帰の結果は、楕円か球面三角形の作図で求まる。
(偏回帰係数も標準化偏回帰係数もこの方法をさらに少し工夫すると求まる。)
• 説明変数3個以上への拡張も容易。
• 重回帰に関係するいろいろな現象の理解を俯瞰的に与えると考えられる。
• (共分散構造分析でどんな時に標準化偏回帰係数の絶対値が1を超える時が
あるのか、欠測などで相関行列の正定値値がどのように崩れるか俯瞰でき
る。)
補足-1
• 相関係数それ自体も、楕円と対応させて考えることが可能。
(相関係数ρに応じて、x=±1,y=±1に囲まれた正方形に4点(±ρ, ±1), (±1, ±ρ) で内接する
楕円)
• 理論的考察を加えることで、単純だが未知の知見を数多く得られる可能
性を大いに秘めている。
▲ 重相関係数 ▲ 偏相関係数 ▲ 標準化偏回帰係数
◀ 高次元化する場合
(相関行列から容易に形状を指定できる)
補足-2
• 相関係数はかなり大きな変換(ただし単調関数による)を加えても、ほとんど値を変
化させない(はずれ値含まない場合)。
• サンプリングサイズの有限性による誤差の方がはるかに大きい。
• データの数量の関係について考える際に、我々は何か認識を改めた方が良さそう。
ρ[X:Y]=0.557
ρ[X2:Y]=0.519
Xを2乗
ρ[X:Y2]=0.536
Yを2乗
ρ[Xrank:Yrank]=0.537
X,Yを順位化
ρ[X:log(Y)]=0.539
Yを対数化
ρ[X(5):Y(5)]=0.507
X,Yを5値
ρ[X(7):Y(7)]=0.524
X,Yを7値
4.対応分析
29
対応分析とは
• 「対応分析(correspondence analysis)は、フランスのベンゼクリ
(Benzécri)によって 1960 年代に提唱され、1970 年代から普及し始
めたカテゴリカルデータの解析方法で、コレスポンデンス分析とも
呼ばれている。類似の方法としては、1950 年代に林知己夫氏に
よって提案された数量化Ⅲ類、1980 年代に西里静彦氏によって
提案された双対尺度法(dual scaling)などがある。それぞれの方法
が提案された背景は異なるが、基本的なアプローチおよびアルゴ
リズムの中核は同じである。」
(金明哲, フリーソフトによるデータ解析・マイニング 第26回)
• データ数1万程度未満では安定では無いようだが、
今回はさらに大量のデータがある(オペレーション・リ
サーチ2004年3月号「コレスポンデンス分析における布
置の精度」 )。

Weitere ähnliche Inhalte

Was ist angesagt?

第1回多変量解析・標本調査勉強会
第1回多変量解析・標本調査勉強会第1回多変量解析・標本調査勉強会
第1回多変量解析・標本調査勉強会t_inaba_zemi
 
kggk3
kggk3kggk3
kggk3Ak Ok
 
推定と標本抽出
推定と標本抽出推定と標本抽出
推定と標本抽出山津 貴之
 
アンケート「入力~集計」講習会
アンケート「入力~集計」講習会アンケート「入力~集計」講習会
アンケート「入力~集計」講習会Yutaka Makabe
 
データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習Seiichi Uchida
 

Was ist angesagt? (6)

第1回多変量解析・標本調査勉強会
第1回多変量解析・標本調査勉強会第1回多変量解析・標本調査勉強会
第1回多変量解析・標本調査勉強会
 
20140416 伊藤
20140416 伊藤20140416 伊藤
20140416 伊藤
 
kggk3
kggk3kggk3
kggk3
 
推定と標本抽出
推定と標本抽出推定と標本抽出
推定と標本抽出
 
アンケート「入力~集計」講習会
アンケート「入力~集計」講習会アンケート「入力~集計」講習会
アンケート「入力~集計」講習会
 
データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習
 

Andere mochten auch

はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~宏喜 佐野
 
Discrete Equal-Simiar-Symbols To Enhance the Existing Equal Symbol
Discrete Equal-Simiar-Symbols To Enhance the Existing Equal SymbolDiscrete Equal-Simiar-Symbols To Enhance the Existing Equal Symbol
Discrete Equal-Simiar-Symbols To Enhance the Existing Equal SymbolToshiyuki Shimono
 
ある最適停止問題の解についての考察
ある最適停止問題の解についての考察ある最適停止問題の解についての考察
ある最適停止問題の解についての考察Toshiyuki Shimono
 
Why 40? なぜ40個のサンプルで調査をするのか ― 数値例からの考察
Why 40? なぜ40個のサンプルで調査をするのか ― 数値例からの考察Why 40? なぜ40個のサンプルで調査をするのか ― 数値例からの考察
Why 40? なぜ40個のサンプルで調査をするのか ― 数値例からの考察Toshiyuki Shimono
 
オープンソースを利用した新時代を生き抜くためのデータ解析
オープンソースを利用した新時代を生き抜くためのデータ解析オープンソースを利用した新時代を生き抜くためのデータ解析
オープンソースを利用した新時代を生き抜くためのデータ解析nakapara
 
オンコロジストなるためのスキル
オンコロジストなるためのスキルオンコロジストなるためのスキル
オンコロジストなるためのスキルmusako-oncology
 
あたらしい伺かを動かしてみたはなし
あたらしい伺かを動かしてみたはなしあたらしい伺かを動かしてみたはなし
あたらしい伺かを動かしてみたはなしkiki utagawa
 
多変量解析の一般化
多変量解析の一般化多変量解析の一般化
多変量解析の一般化Akisato Kimura
 
照明制御とBluemixの可能性
照明制御とBluemixの可能性照明制御とBluemixの可能性
照明制御とBluemixの可能性Nippon P.I.
 
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by ホットリンク 公開用
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by  ホットリンク 公開用2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by  ホットリンク 公開用
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by ホットリンク 公開用Takeshi Sakaki
 
人生を豊かにする線形代数学
人生を豊かにする線形代数学人生を豊かにする線形代数学
人生を豊かにする線形代数学Fumiya Watanabe
 
ふくあずLt資料 windows server technical preview まとめ 141222
ふくあずLt資料 windows server technical preview まとめ 141222ふくあずLt資料 windows server technical preview まとめ 141222
ふくあずLt資料 windows server technical preview まとめ 141222wintechq
 
第1回DARM勉強会のANOVA補足(repeated measures designs)
第1回DARM勉強会のANOVA補足(repeated measures designs)第1回DARM勉強会のANOVA補足(repeated measures designs)
第1回DARM勉強会のANOVA補足(repeated measures designs)Masaru Tokuoka
 
Performance Howto - TechAid2011
Performance Howto - TechAid2011Performance Howto - TechAid2011
Performance Howto - TechAid2011Kazushi Kamegawa
 
パターン認識 第12章 正則化とパス追跡アルゴリズム
パターン認識 第12章 正則化とパス追跡アルゴリズムパターン認識 第12章 正則化とパス追跡アルゴリズム
パターン認識 第12章 正則化とパス追跡アルゴリズムMiyoshi Yuya
 
Tokyo.R #22 Association Rules
Tokyo.R #22 Association RulesTokyo.R #22 Association Rules
Tokyo.R #22 Association Rulesosamu morimoto
 
Rexhep qosja te vertetat e vonuara
Rexhep qosja   te vertetat e vonuaraRexhep qosja   te vertetat e vonuara
Rexhep qosja te vertetat e vonuaraLibra Islame
 
Team Foundation Server / Visual Studio Online を利用したチーム開発の実践
Team Foundation Server / Visual Studio Online を利用したチーム開発の実践Team Foundation Server / Visual Studio Online を利用したチーム開発の実践
Team Foundation Server / Visual Studio Online を利用したチーム開発の実践慎一 古賀
 
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)Koichi Hamada
 

Andere mochten auch (20)

はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~
 
多変量解析
多変量解析多変量解析
多変量解析
 
Discrete Equal-Simiar-Symbols To Enhance the Existing Equal Symbol
Discrete Equal-Simiar-Symbols To Enhance the Existing Equal SymbolDiscrete Equal-Simiar-Symbols To Enhance the Existing Equal Symbol
Discrete Equal-Simiar-Symbols To Enhance the Existing Equal Symbol
 
ある最適停止問題の解についての考察
ある最適停止問題の解についての考察ある最適停止問題の解についての考察
ある最適停止問題の解についての考察
 
Why 40? なぜ40個のサンプルで調査をするのか ― 数値例からの考察
Why 40? なぜ40個のサンプルで調査をするのか ― 数値例からの考察Why 40? なぜ40個のサンプルで調査をするのか ― 数値例からの考察
Why 40? なぜ40個のサンプルで調査をするのか ― 数値例からの考察
 
オープンソースを利用した新時代を生き抜くためのデータ解析
オープンソースを利用した新時代を生き抜くためのデータ解析オープンソースを利用した新時代を生き抜くためのデータ解析
オープンソースを利用した新時代を生き抜くためのデータ解析
 
オンコロジストなるためのスキル
オンコロジストなるためのスキルオンコロジストなるためのスキル
オンコロジストなるためのスキル
 
あたらしい伺かを動かしてみたはなし
あたらしい伺かを動かしてみたはなしあたらしい伺かを動かしてみたはなし
あたらしい伺かを動かしてみたはなし
 
多変量解析の一般化
多変量解析の一般化多変量解析の一般化
多変量解析の一般化
 
照明制御とBluemixの可能性
照明制御とBluemixの可能性照明制御とBluemixの可能性
照明制御とBluemixの可能性
 
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by ホットリンク 公開用
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by  ホットリンク 公開用2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by  ホットリンク 公開用
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by ホットリンク 公開用
 
人生を豊かにする線形代数学
人生を豊かにする線形代数学人生を豊かにする線形代数学
人生を豊かにする線形代数学
 
ふくあずLt資料 windows server technical preview まとめ 141222
ふくあずLt資料 windows server technical preview まとめ 141222ふくあずLt資料 windows server technical preview まとめ 141222
ふくあずLt資料 windows server technical preview まとめ 141222
 
第1回DARM勉強会のANOVA補足(repeated measures designs)
第1回DARM勉強会のANOVA補足(repeated measures designs)第1回DARM勉強会のANOVA補足(repeated measures designs)
第1回DARM勉強会のANOVA補足(repeated measures designs)
 
Performance Howto - TechAid2011
Performance Howto - TechAid2011Performance Howto - TechAid2011
Performance Howto - TechAid2011
 
パターン認識 第12章 正則化とパス追跡アルゴリズム
パターン認識 第12章 正則化とパス追跡アルゴリズムパターン認識 第12章 正則化とパス追跡アルゴリズム
パターン認識 第12章 正則化とパス追跡アルゴリズム
 
Tokyo.R #22 Association Rules
Tokyo.R #22 Association RulesTokyo.R #22 Association Rules
Tokyo.R #22 Association Rules
 
Rexhep qosja te vertetat e vonuara
Rexhep qosja   te vertetat e vonuaraRexhep qosja   te vertetat e vonuara
Rexhep qosja te vertetat e vonuara
 
Team Foundation Server / Visual Studio Online を利用したチーム開発の実践
Team Foundation Server / Visual Studio Online を利用したチーム開発の実践Team Foundation Server / Visual Studio Online を利用したチーム開発の実践
Team Foundation Server / Visual Studio Online を利用したチーム開発の実践
 
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
 

Ähnlich wie 多変量解析の授業(駒場キャンパス)の演習で話すために作った資料

これからの仮説検証・モデル評価
これからの仮説検証・モデル評価これからの仮説検証・モデル評価
これからの仮説検証・モデル評価daiki hojo
 
「予測にいかす統計モデリングの基本」勉強会 第一章
「予測にいかす統計モデリングの基本」勉強会 第一章「予測にいかす統計モデリングの基本」勉強会 第一章
「予測にいかす統計モデリングの基本」勉強会 第一章Takahiro Yoshinaga
 
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回 サイエンスリンケージデータベースの使い方
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回サイエンスリンケージデータベースの使い方SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回サイエンスリンケージデータベースの使い方
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回 サイエンスリンケージデータベースの使い方Yasushi Hara
 
人それぞれの競プロとの向き合い方
人それぞれの競プロとの向き合い方人それぞれの競プロとの向き合い方
人それぞれの競プロとの向き合い方Kensuke Otsuki
 
ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 (関東CV勉強会)
ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 (関東CV勉強会)ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 (関東CV勉強会)
ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 (関東CV勉強会)Yoshitaka Ushiku
 
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太Preferred Networks
 
マイニング探検会#12
マイニング探検会#12マイニング探検会#12
マイニング探検会#12Yoji Kiyota
 
“確率的最適化”を読む前に知っておくといいかもしれない関数解析のこと
“確率的最適化”を読む前に知っておくといいかもしれない関数解析のこと“確率的最適化”を読む前に知っておくといいかもしれない関数解析のこと
“確率的最適化”を読む前に知っておくといいかもしれない関数解析のことHiroaki Kudo
 
2018-06-15第4回高大連携 高校生・大学生交流会2018
2018-06-15第4回高大連携 高校生・大学生交流会20182018-06-15第4回高大連携 高校生・大学生交流会2018
2018-06-15第4回高大連携 高校生・大学生交流会2018Matsushima Sho
 
人工知能のための哲学塾 東洋哲学篇 第零夜 資料
人工知能のための哲学塾 東洋哲学篇 第零夜 資料人工知能のための哲学塾 東洋哲学篇 第零夜 資料
人工知能のための哲学塾 東洋哲学篇 第零夜 資料Youichiro Miyake
 
人工知能に何ができないか? ー ゲームと人工知能の視点から -
人工知能に何ができないか? ー ゲームと人工知能の視点から -人工知能に何ができないか? ー ゲームと人工知能の視点から -
人工知能に何ができないか? ー ゲームと人工知能の視点から -Youichiro Miyake
 
Lt conehito 20210225_ota
Lt conehito 20210225_otaLt conehito 20210225_ota
Lt conehito 20210225_ota博三 太田
 
状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38horihorio
 
JPA2023_NetworkTutorial_Part4.pdf
JPA2023_NetworkTutorial_Part4.pdfJPA2023_NetworkTutorial_Part4.pdf
JPA2023_NetworkTutorial_Part4.pdfJun Kashihara
 

Ähnlich wie 多変量解析の授業(駒場キャンパス)の演習で話すために作った資料 (16)

これからの仮説検証・モデル評価
これからの仮説検証・モデル評価これからの仮説検証・モデル評価
これからの仮説検証・モデル評価
 
「予測にいかす統計モデリングの基本」勉強会 第一章
「予測にいかす統計モデリングの基本」勉強会 第一章「予測にいかす統計モデリングの基本」勉強会 第一章
「予測にいかす統計モデリングの基本」勉強会 第一章
 
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回 サイエンスリンケージデータベースの使い方
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回サイエンスリンケージデータベースの使い方SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回サイエンスリンケージデータベースの使い方
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回 サイエンスリンケージデータベースの使い方
 
人それぞれの競プロとの向き合い方
人それぞれの競プロとの向き合い方人それぞれの競プロとの向き合い方
人それぞれの競プロとの向き合い方
 
因子分析
因子分析因子分析
因子分析
 
数理解析分野(研究室)の案内
数理解析分野(研究室)の案内数理解析分野(研究室)の案内
数理解析分野(研究室)の案内
 
ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 (関東CV勉強会)
ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 (関東CV勉強会)ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 (関東CV勉強会)
ごあいさつ 或いはMATLAB教徒がPythonistaに改宗した話 (関東CV勉強会)
 
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
 
マイニング探検会#12
マイニング探検会#12マイニング探検会#12
マイニング探検会#12
 
“確率的最適化”を読む前に知っておくといいかもしれない関数解析のこと
“確率的最適化”を読む前に知っておくといいかもしれない関数解析のこと“確率的最適化”を読む前に知っておくといいかもしれない関数解析のこと
“確率的最適化”を読む前に知っておくといいかもしれない関数解析のこと
 
2018-06-15第4回高大連携 高校生・大学生交流会2018
2018-06-15第4回高大連携 高校生・大学生交流会20182018-06-15第4回高大連携 高校生・大学生交流会2018
2018-06-15第4回高大連携 高校生・大学生交流会2018
 
人工知能のための哲学塾 東洋哲学篇 第零夜 資料
人工知能のための哲学塾 東洋哲学篇 第零夜 資料人工知能のための哲学塾 東洋哲学篇 第零夜 資料
人工知能のための哲学塾 東洋哲学篇 第零夜 資料
 
人工知能に何ができないか? ー ゲームと人工知能の視点から -
人工知能に何ができないか? ー ゲームと人工知能の視点から -人工知能に何ができないか? ー ゲームと人工知能の視点から -
人工知能に何ができないか? ー ゲームと人工知能の視点から -
 
Lt conehito 20210225_ota
Lt conehito 20210225_otaLt conehito 20210225_ota
Lt conehito 20210225_ota
 
状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38
 
JPA2023_NetworkTutorial_Part4.pdf
JPA2023_NetworkTutorial_Part4.pdfJPA2023_NetworkTutorial_Part4.pdf
JPA2023_NetworkTutorial_Part4.pdf
 

Mehr von Toshiyuki Shimono

国際産業数理・応用数理会議のポスター(作成中)
国際産業数理・応用数理会議のポスター(作成中)国際産業数理・応用数理会議のポスター(作成中)
国際産業数理・応用数理会議のポスター(作成中)Toshiyuki Shimono
 
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装Toshiyuki Shimono
 
extracting only a necessary file from a zip file
extracting only a necessary file from a zip fileextracting only a necessary file from a zip file
extracting only a necessary file from a zip fileToshiyuki Shimono
 
A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021
A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021
A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021Toshiyuki Shimono
 
新型コロナの感染者数 全国の状況 2021年2月上旬まで
新型コロナの感染者数 全国の状況 2021年2月上旬まで新型コロナの感染者数 全国の状況 2021年2月上旬まで
新型コロナの感染者数 全国の状況 2021年2月上旬までToshiyuki Shimono
 
Multiplicative Decompositions of Stochastic Distributions and Their Applicat...
 Multiplicative Decompositions of Stochastic Distributions and Their Applicat... Multiplicative Decompositions of Stochastic Distributions and Their Applicat...
Multiplicative Decompositions of Stochastic Distributions and Their Applicat...Toshiyuki Shimono
 
Theory to consider an inaccurate testing and how to determine the prior proba...
Theory to consider an inaccurate testing and how to determine the prior proba...Theory to consider an inaccurate testing and how to determine the prior proba...
Theory to consider an inaccurate testing and how to determine the prior proba...Toshiyuki Shimono
 
Interpreting Multiple Regression via an Ellipse Inscribed in a Square Extensi...
Interpreting Multiple Regressionvia an Ellipse Inscribed in a Square Extensi...Interpreting Multiple Regressionvia an Ellipse Inscribed in a Square Extensi...
Interpreting Multiple Regression via an Ellipse Inscribed in a Square Extensi...Toshiyuki Shimono
 
BigQueryを使ってみた(2018年2月)
BigQueryを使ってみた(2018年2月)BigQueryを使ってみた(2018年2月)
BigQueryを使ってみた(2018年2月)Toshiyuki Shimono
 
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案Toshiyuki Shimono
 
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...Toshiyuki Shimono
 
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...Toshiyuki Shimono
 
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)Toshiyuki Shimono
 
企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案Toshiyuki Shimono
 
新入社員の頃に教えて欲しかったようなことなど
新入社員の頃に教えて欲しかったようなことなど新入社員の頃に教えて欲しかったようなことなど
新入社員の頃に教えて欲しかったようなことなどToshiyuki Shimono
 
ページャ lessを使いこなす
ページャ lessを使いこなすページャ lessを使いこなす
ページャ lessを使いこなすToshiyuki Shimono
 
Guiを使わないテキストデータ処理
Guiを使わないテキストデータ処理Guiを使わないテキストデータ処理
Guiを使わないテキストデータ処理Toshiyuki Shimono
 
データ全貌把握の方法170324
データ全貌把握の方法170324データ全貌把握の方法170324
データ全貌把握の方法170324Toshiyuki Shimono
 

Mehr von Toshiyuki Shimono (20)

国際産業数理・応用数理会議のポスター(作成中)
国際産業数理・応用数理会議のポスター(作成中)国際産業数理・応用数理会議のポスター(作成中)
国際産業数理・応用数理会議のポスター(作成中)
 
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
 
extracting only a necessary file from a zip file
extracting only a necessary file from a zip fileextracting only a necessary file from a zip file
extracting only a necessary file from a zip file
 
A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021
A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021
A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021
 
新型コロナの感染者数 全国の状況 2021年2月上旬まで
新型コロナの感染者数 全国の状況 2021年2月上旬まで新型コロナの感染者数 全国の状況 2021年2月上旬まで
新型コロナの感染者数 全国の状況 2021年2月上旬まで
 
Multiplicative Decompositions of Stochastic Distributions and Their Applicat...
 Multiplicative Decompositions of Stochastic Distributions and Their Applicat... Multiplicative Decompositions of Stochastic Distributions and Their Applicat...
Multiplicative Decompositions of Stochastic Distributions and Their Applicat...
 
Theory to consider an inaccurate testing and how to determine the prior proba...
Theory to consider an inaccurate testing and how to determine the prior proba...Theory to consider an inaccurate testing and how to determine the prior proba...
Theory to consider an inaccurate testing and how to determine the prior proba...
 
Interpreting Multiple Regression via an Ellipse Inscribed in a Square Extensi...
Interpreting Multiple Regressionvia an Ellipse Inscribed in a Square Extensi...Interpreting Multiple Regressionvia an Ellipse Inscribed in a Square Extensi...
Interpreting Multiple Regression via an Ellipse Inscribed in a Square Extensi...
 
Sqlgen190412.pdf
Sqlgen190412.pdfSqlgen190412.pdf
Sqlgen190412.pdf
 
BigQueryを使ってみた(2018年2月)
BigQueryを使ってみた(2018年2月)BigQueryを使ってみた(2018年2月)
BigQueryを使ってみた(2018年2月)
 
Seminar0917
Seminar0917Seminar0917
Seminar0917
 
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
 
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
 
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
 
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
 
企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案
 
新入社員の頃に教えて欲しかったようなことなど
新入社員の頃に教えて欲しかったようなことなど新入社員の頃に教えて欲しかったようなことなど
新入社員の頃に教えて欲しかったようなことなど
 
ページャ lessを使いこなす
ページャ lessを使いこなすページャ lessを使いこなす
ページャ lessを使いこなす
 
Guiを使わないテキストデータ処理
Guiを使わないテキストデータ処理Guiを使わないテキストデータ処理
Guiを使わないテキストデータ処理
 
データ全貌把握の方法170324
データ全貌把握の方法170324データ全貌把握の方法170324
データ全貌把握の方法170324
 

Kürzlich hochgeladen

The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024koheioishi1
 
UniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScriptUniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScriptyuitoakatsukijp
 
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationYukiTerazawa
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2Tokyo Institute of Technology
 
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学ssusere0a682
 
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料Takayuki Itoh
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ssusere0a682
 

Kürzlich hochgeladen (7)

The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
 
UniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScriptUniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScript
 
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
 
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
 
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
 

多変量解析の授業(駒場キャンパス)の演習で話すために作った資料

Hinweis der Redaktion

  1. 30万人のデータを抽出したもの (1) 切れ方 (2) 平行四辺形の構造 R言語で不透明度のアルファを最小の0.01にして 点の色を紫、黄、赤、黄 と変えながら、点の数を段階的に減らしながらプロット。
  2. フォローして良い数が約2000の壁があるのだが (それ以上、フォローを増やすにはねフォロワーを増やさないといけない) それに気付くには、数千は必要だし、明確化するには、数万が必要になる。 しかし、数十万以上あっても、ビジュアル化の高度な習練が必要。
  3. メモ重要(忘れるので) メモ無しでも”感覚”が身につく 色づけなどのアート的センスは重要となる。