Suche senden
Hochladen
統計と機械学習
•
Als PPTX, PDF herunterladen
•
3 gefällt mir
•
594 views
M
MatsuiRyo
Folgen
統計モデルと機械学習モデルの違いについて
Weniger lesen
Mehr lesen
Ingenieurwesen
Melden
Teilen
Melden
Teilen
1 von 12
Jetzt herunterladen
Empfohlen
カステラ本勉強会 第三回 補足
カステラ本勉強会 第三回 補足
ke beck
Introduction to statistics
Introduction to statistics
Kohta Ishikawa
Probabilistic Graphical Models 輪読会 #1
Probabilistic Graphical Models 輪読会 #1
Takuma Yagi
Prml 1.3~1.6 ver3
Prml 1.3~1.6 ver3
Toshihiko Iio
モンテカルロ法と情報量
モンテカルロ法と情報量
Shohei Miyashita
ベイズ最適化
ベイズ最適化
MatsuiRyo
多目的遺伝的アルゴリズム
多目的遺伝的アルゴリズム
MatsuiRyo
最尤推定法(NNでの応用)
最尤推定法(NNでの応用)
MatsuiRyo
Empfohlen
カステラ本勉強会 第三回 補足
カステラ本勉強会 第三回 補足
ke beck
Introduction to statistics
Introduction to statistics
Kohta Ishikawa
Probabilistic Graphical Models 輪読会 #1
Probabilistic Graphical Models 輪読会 #1
Takuma Yagi
Prml 1.3~1.6 ver3
Prml 1.3~1.6 ver3
Toshihiko Iio
モンテカルロ法と情報量
モンテカルロ法と情報量
Shohei Miyashita
ベイズ最適化
ベイズ最適化
MatsuiRyo
多目的遺伝的アルゴリズム
多目的遺伝的アルゴリズム
MatsuiRyo
最尤推定法(NNでの応用)
最尤推定法(NNでの応用)
MatsuiRyo
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
Introduction to Data Science
Introduction to Data Science
Christy Abraham Joy
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
Vit Horky
The six step guide to practical project management
The six step guide to practical project management
MindGenius
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
Weitere ähnliche Inhalte
Empfohlen
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
Introduction to Data Science
Introduction to Data Science
Christy Abraham Joy
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
Vit Horky
The six step guide to practical project management
The six step guide to practical project management
MindGenius
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
Empfohlen
(20)
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
Skeleton Culture Code
Skeleton Culture Code
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
How to have difficult conversations
How to have difficult conversations
Introduction to Data Science
Introduction to Data Science
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
The six step guide to practical project management
The six step guide to practical project management
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
統計と機械学習
1.
統計と機械学習 2018/12/10 東京工業大学 工学院 経営工学系
3年 松井諒生 1
2.
統計学の基礎知識 • 確率変数・実現値 確率変数:確率によって値が変化する変数 実現値: その確率によって得られた変数の値 •
確率分布 確率変数の得られる値とその頻度の関係をあらわす。(確率密度関数) • 説明変数・目的(応答)変数 目的変数がどれだけ説明変数の影響を受けるかを考える。 y=ax1+bx2 であれば、yが目的変数、x1,x2が説明変数で、その影響の度がパラメータa,bで示される。 • 最尤推定 得られた実現値から確率的に最も尤もらしいパラメータを推定する方法。 2
3.
まず、モデルという言葉について • 統計モデル • 機械学習モデル ここでいうモデルとは数理モデルのこと。 モデルとは一般的に、「あるシステムを簡略化し、本質を表した もの」であり、とくに数理モデルとは、「ある仮定、ある条件の 下で得られたデータをある目標にそって計算する一連の流れを一 般化したもの」 3
4.
統計モデルと機械学習モデルの比較 統計モデル 機械学習モデル 仮定 基本予測モデル 説明変数 学習モデル 説明変数 条件 データの特徴(離散値or連続値、定義域、バイナリ、など) 目標 目的変数の説明 未知データに対する予測 未知データに対する予測 4
5.
モデルの概要だけ見るとほぼ同じ 与えられたデータに対して、どのような 理論を用いるかを決め、未知のデータに 対する予測を行う。 ではどの点で互いにユニークだといえるのか? 5
6.
①最適化or学習 統計 • データセットをひとまとまりの実現値群とみて、それらに対し て確率的に最尤なパラメータを一度の計算によって求めていく。 機械学習 • データセットを小分けにして「経験」させることで逐一もっと もらしい方向へパラメータを動かしていく。 6
7.
②可視or不可視 統計 • 統計モデルの最大の目標は「説明」 • つまり、目的変数はどれだけ説明変数に影響を受けているかを求め、 それを考察することが大切。 機械学習 •
機械学習の目標は「予測」 • つまり、変数Aが変数Bにどれだけ影響を与えるかということは無視 し、ただ精度の高い予測に特化したもの。 • だから、予測さえできればそれらのパラメータは見えなくてもよい 7
8.
③情報損失or丸投げ 統計 • データの確率分布を仮定する必要がある。 • この仮定によって、得られたデータの情報を圧縮してしまう。 (第二段階の情報圧縮) 機械学習 •
統計モデルに比べて情報圧縮は少ない。(第一段階のみ) • ただ、分布の推定までアルゴリズムに任せてしまうため、正確 性はそのアルゴリズムとデータセットに依存する。 8
9.
まとめ 統計モデル 機械学習モデル メリット ・一つのデータセットから確率的に尤もな パラメータが唯一に決まる。 ・可視化させるため分析・考察が容易 ・情報損失が小さい ・不可視な構造でより正確な予測ができる。 ・予測データの分布を指定しない。 デメリット ・情報損失が大きい ・精度は仮定に依存 ・実現値に存在しないものは予測できない。 ・精度がアルゴリズムに依存する。 ・学習ごとの解が不安定で局所解や過学習な どがおこる。 *どちらのモデルも精度は第一段階の情報損失の影響を大きく受ける。 9
10.
結論 • 仮定、条件、目標はほぼ同じだが、アプローチが違う。 • 現段階(トップレベル)では予測としては機械学習の方が優れて いる。 •
予測を目標とし、人の仮定が機械学習アルゴリズムより優れて いるのであれば機械学習に固執する必要はない。 • さらに、統計モデルの「説明」できる強みを生かして機械学習 に与えるデータの整形をできないか。 10
11.
最も簡単な統計モデル(一般線形モデル)紹介 • 単回帰モデル 𝒚 =
𝜶𝒙 + 𝜷 𝑆 𝑥𝑦 = 𝑖( 𝑥 − 𝑥𝑖)( 𝑦 − 𝑦𝑖) 𝑛 , 𝑆 𝑥𝑦 = 𝑖( 𝑥 − 𝑥𝑖)2 𝑛 , 𝛼 = 𝑆 𝑥𝑦 𝑆𝑥𝑥 , 𝛽 = 𝑦 − 𝛼 𝑥 • 重回帰モデル 𝒚 = 𝜶 𝟏 𝒙 𝟏 + 𝜶 𝟐 𝒙 𝟐 + 𝜷 𝛼1 𝛼2 = 𝑆11 𝑆21 𝑆12 𝑆22 −1 ( 𝑆1𝑦 𝑆2𝑦 ), 𝛽 = 𝑦 − 𝛼1 𝑥1 − 𝛼2 𝑥2 これらは誤差が等分散正規分布であるという仮定の下で算出される。11
12.
ではこの条件を仮定できないときは? ⇒一般化線形モデルなどを用いる。 ・ポアソン回帰 カウントデータ(0以上の離散値) ex)来客集 ・ロジスティック回帰 カテゴリカルデータ ex)発症率 12
Jetzt herunterladen