Weitere ähnliche Inhalte
Ähnlich wie データマイニング勉強会3 (20)
データマイニング勉強会3
- 3. AGENDA
自己紹介
機械学習
SVM
マージンの最大化
カーネル関数を用いた柔軟なモデリング
ハードマージンとソフトマージン
ラグランジュ乗数
パラメータ推定の定式化
RによるSVMの使用例
- 4. 自己紹介
id : yokkuns
名前 : 里 洋平
職業 : Webエンジニア
出身 : 種子島
趣味 : プログラミングとかカラオケとか
主催してる勉強会 : Tokyo.R、数式ニヤニヤ勉強会
統計とか機械学習やりはじめたのは割と最近なので
、
突っ込み大歓迎です!
- 10. 記憶ベース推論
車
今までの経験・記憶がベースとなって
判断している!
ギター
テレビ
- 12. 認識系の構成
特徴抽出 識別演算
前処理部
部 部 車
照合
識別辞書
識別部
- 13. 認識系の構成
特徴抽出 識別演算
前処理部
部 部 車
照合
・ノイズ除去 識別辞書
・正規化など
グレースケール化など 識別部
- 14. 認識系の構成
特徴抽出 識別演算
前処理部
部 部 車
照合
識別辞書
識別に必要な本質的な
特徴のみを抽出!
配色、輪郭など
識別部
- 15. 認識系の構成
特徴抽出 識別演算
前処理部
部 部 車
照合
あらかじめ識別辞書を用意し、 識別辞書
抽出された特徴をこの辞書と照合
することにより、入力対象を分類す
る
識別部
- 25. マージン最大化
超平面のパラメータをともに
定数倍しても境界は不変なので、
以下の条件を付加しても影響ない
- 26. マージン最大化
また、学習データのクラス
を使って、以下のように書ける
- 28. マージン最大化
よって、以下のように定式化出来る
を解きやすい に置き換えている
- 30. カーネル関数を用いた柔軟なモデリング
この特徴空間上の分布は
、明らかに線形分離可能で
はない
x2
カーネル関数を使って、元
のデータよりも高い次元の
空間に写像する
x1
- 32. 非線形変換
高次元に写像することで、線形分離可能になる
φ3(x)
x2
φ1(x)
φ2(x)
x1
- 39. 勾配
x軸に平行な方向に1だけ進むと関数値は、aだけ増
え、 y軸に平行な方向に距離1だけ進むと
関数値はbだけ増える
x軸、y軸方向への勾配の大きさがそれぞれ、a,b。これらを成
分とするベクトルを勾配と呼ぶ
勾配は、関数値がもっとも急激に増大する方向を表す
- 44. ラグランジュの未定乗数法
解となる点を通る等高線は
、制約式に接していなけれ
ばならない
このことは、接点で両者の
法線ベクトルが平行である
ことを意味する
制約条件
- 45. 双対原理
用いたのは等高線と制約条
件が接するという事実のみ
なので、どちらが等高線で
どちらが制約条件かは無関
係
等高線と制約条件が逆でも
同じ解が得られる。
制約条件
双対原理
- 47. 線形計画と非線形計画
線形計画
線形制約条件のもとで線形関数を最大、最小にする
問題
シンプレックス法とか使える
非線形計画
非線形制約条件のもとで非線形関数を最大、最小に
する問題
一般的な理論も解法も存在しない
制約条件や目的関数のもつ性質ごとに種々の定理が成立
し、さまざまな解法が存在する
- 48. 線形計画と非線形計画
線形計画
線形制約条件のもとで線形関数を最大、最小にする
問題
シンプレックス法とか使える
非線形計画
非線形制約条件のもとで非線形関数を最大、最小に
する問題
一般的な理論も解法も存在しない
制約条件や目的関数のもつ性質ごとに種々の定理が成立
し、さまざまな解法が存在する
- 51. 双対問題
ラグランジュ関数Lにおいて、ラグランジュ乗数
{λi}、{μi}を定数とみなしてxに関して最大化した値
は{λi}、{μi}の関数である。これを
と置くと、次の問題を問題Aの双対問題と呼ぶ
問題B
- 55. パラメータ推定の定式化
よって、相対形式として、以下の凸2次計画問題を解
けばよい
これを解く手法として、SMOなどがある
- 59. 参考文献
わかりやすいパターン認識
データマイニング手法―
営業、マーケティング、カスタマーサポートのための顧客分析
Rによるデータサイエンス - データ解析の基礎から最新手法まで
パターン認識 (Rで学ぶデータサイエンス 5)
マシンラーニング (Rで学ぶデータサイエンス 6)
これなら分かる最適化数学―基礎原理から計算手法まで