SlideShare ist ein Scribd-Unternehmen logo
1 von 83
Downloaden Sie, um offline zu lesen
takemikamiʼs note ‒ http://takemikami.com/
データサイエンスアイドル
「⼩⽇向美穂」と考える「つながり」
Copyright (C) Takeshi Mikami. All rights reserved. 1
三上 威 - @takemikami
アーリース情報技術株式会社 代表取締役 社⻑
IM@S Engineer Talks 2019
2019.7.6 @ Speee株式会社
takemikamiʼs note ‒ http://takemikami.com/
はじめに
•テーマ
データサイエンスアイドル
「⼩⽇向美穂」と考える「つながり」
•内容
• アイドル共通の特徴を探る⽅法
• ⾃然⾔語処理を⽤いた特徴の表現⽅法
Copyright (C) Takeshi Mikami. All rights reserved. 2
本⽇のセッションでお話しする内容について説明します
takemikamiʼs note ‒ http://takemikami.com/
副業紹介
• みかみんP (@takemikamas)
• データエンジニア・サイエンティスト
• タスク: 分析・予測モデル開発・基盤構築 etc
• 対象: マーケティングデータ etc
• 略歴
• 甲南⼤学理学部応⽤数学科 卒
• EC, CRM等のシステム構築 @ NEC系SIer
• ECサイトのマーケティングデータ分析 @ DeNA
• データ分析・予測モデル開発・基盤構築 @アーリース情報技術(株)
Copyright (C) Takeshi Mikami. All rights reserved. 3
発表者の副業を紹介します
※フリーランスの法⼈成り
P
takemikamiʼs note ‒ http://takemikami.com/
副業紹介 開発プロダクト
• rdflint
• RDFデータのチェックツール
• im@sparqlのデータチェックに利⽤中
• https://github.com/imas/rdflint
• digdag-plugin-shresult
• ワークフローエンジン「Digdag」のプラグイン
• シェルスクリプトを実⾏し、標準出⼒をDigdagの変数に格納するオペレータ
• https://github.com/takemikami/digdag-plugin-shresult
• objectify-appengine-memcacheclient
• Google Cloud DatastoreのJava⽤ライブラリ「Objectify」(v6以降)で、
Google AppEngine Memcache のキャッシュを利⽤するためのサービス
• https://github.com/takemikami/objectify-appengine-memcacheclient
Copyright (C) Takeshi Mikami. All rights reserved. 4
発表者が作ったプロダクトを紹介します
etc
takemikamiʼs note ‒ http://takemikami.com/
本業紹介
• 担当アイドル:萩原雪歩・箱崎星梨花・杜野凛世・⼩⽇向美穂
Copyright (C) Takeshi Mikami. All rights reserved. 5
発表者の本業(プロデュース業)を紹介します
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
takemikamiʼs note ‒ http://takemikami.com/
IM@Studyでの発表 1/2
• 担当アイドルに反応してLチカさせる予測モデル開発
@2017.5.17 アイマスエンジニア MeetUp In Tokyo
• ima@sparqlではじめるR Markdownとgitbookによるレポート⽣成
@2017.9.2 あいますえんじにあ Meetup in 京都
Copyright (C) Takeshi Mikami. All rights reserved. 6
発表者のIM@Studyでの過去の発表を紹介します
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
takemikamiʼs note ‒ http://takemikami.com/
IM@Studyでの発表 2/2
• 何つながりなのかな?を探る⾃然⾔語処理〜765PRO LIVE THEATERに通りがかる⼩⽇向美穂〜
@2019.4.14 週刊IM@Study 2019年5⽉
• RDFチェックツール「rdflint」のご紹介
@2019.4.21 アイマスハッカソン2019 in 名古屋
Copyright (C) Takeshi Mikami. All rights reserved. 7
発表者のIM@Studyでの過去の発表を紹介します
takemikamiʼs note ‒ http://takemikami.com/
rdflintとは
• 以下のチェックが⾃動化出来る
• RDF、Turtle(ttl)ファイルの⽂法チェック
• 未定義の主語が、⽬的語として使われていないかのチェック etc
• CIに組み込んでPullRequestによるマスターデータ作成運⽤に利⽤可能
• im@sparqlのデータ作成運⽤に利⽤中
Copyright (C) Takeshi Mikami. All rights reserved. 8
rdflintの概要を⽰します
RDFファイルの⾃動検査ツール
https://github.com/imas/rdflint
×
に応募!
応援下さい!
takemikamiʼs note ‒ http://takemikami.com/
アイドル「⼩⽇向美穂」の紹介
Copyright (C) Takeshi Mikami. All rights reserved. 9
takemikamiʼs note ‒ http://takemikami.com/
⼩⽇向美穂と⾔えば
Copyright (C) Takeshi Mikami. All rights reserved. 10
⼩⽇向美穂といえばデータサイエンスアイドルです
データサイエンスアイドル
⼩⽇向美穂と⾔えば
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
takemikamiʼs note ‒ http://takemikami.com/Copyright (C) Takeshi Mikami. All rights reserved. 11
ですよね
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
takemikamiʼs note ‒ http://takemikami.com/
⼩⽇向美穂@1コマ劇場 1/5
Copyright (C) Takeshi Mikami. All rights reserved. 12
1コマ劇場での⼩⽇向美穂と⾔えば「何繋がりなのかな?」
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
何
つ
な
が
り
な
の
か
な
?
相原雪乃① A・お茶(紅茶、緑茶、珈琲)
takemikamiʼs note ‒ http://takemikami.com/
⼩⽇向美穂@1コマ劇場 2/5
Copyright (C) Takeshi Mikami. All rights reserved. 13
1コマ劇場での⼩⽇向美穂と⾔えば「何繋がりなのかな?」
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
ス
イ
ツ
の
話
し
だ
♪
槙原志保① 何つながりか…わかる
takemikamiʼs note ‒ http://takemikami.com/
⼩⽇向美穂@1コマ劇場 3/5
Copyright (C) Takeshi Mikami. All rights reserved. 14
1コマ劇場での⼩⽇向美穂と⾔えば「何繋がりなのかな?」
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
何
つ
な
が
り
な
の
か
な
?
間中美⾥① あっ旅⾏の話♪
takemikamiʼs note ‒ http://takemikami.com/
⼩⽇向美穂@1コマ劇場 4/5
Copyright (C) Takeshi Mikami. All rights reserved. 15
1コマ劇場での⼩⽇向美穂と⾔えば「何繋がりなのかな?」
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
何
つ
な
が
り
な
の
か
な
?
涼宮星花① A・ネイル無理繋がり
takemikamiʼs note ‒ http://takemikami.com/
⼩⽇向美穂@1コマ劇場 5/5
Copyright (C) Takeshi Mikami. All rights reserved. 16
1コマ劇場での⼩⽇向美穂と⾔えば「何繋がりなのかな?」
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
何
つ
な
が
り
な
の
か
な
?
横⼭千佳① A・魔法少⼥アニメ
takemikamiʼs note ‒ http://takemikami.com/
何
つ
な
が
り
な
の
か
な
?
横⼭千佳① A・魔法少⼥アニメ
⼩⽇向美穂@1コマ劇場
Copyright (C) Takeshi Mikami. All rights reserved. 17
1コマ劇場での⼩⽇向美穂と⾔えば「何繋がりなのかな?」
もしかして
機械学習?
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
takemikamiʼs note ‒ http://takemikami.com/
何
つ
な
が
り
な
の
か
な
?
横⼭千佳① A・魔法少⼥アニメ
⼩⽇向美穂@1コマ劇場
Copyright (C) Takeshi Mikami. All rights reserved. 18
1コマ劇場での⼩⽇向美穂と⾔えば「何繋がりなのかな?」
特徴量
その他のアイドル
2値分類2値分類
⼩⽇向美穂
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
takemikamiʼs note ‒ http://takemikami.com/
⼩⽇向美穂のデータサイエンス
Copyright (C) Takeshi Mikami. All rights reserved. 19
⼩⽇向美穂のデータサイエンスアイドルを紹介します
•「何つながりなのかな?」問題を解く⼿続き
•アイドルを何⼈か選ぶ
•選んだアイドルとそれ以外のグループに分ける
•2つのグループを分ける最適な特徴量を探す
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
takemikamiʼs note ‒ http://takemikami.com/
アイドル共通の特徴を探る⽅法
Copyright (C) Takeshi Mikami. All rights reserved. 20
takemikamiʼs note ‒ http://takemikami.com/
教師あり学習と教師なし学習
•教師あり学習
•正解が分かっているデータから規則性を導き出す
→正解が分からないデータの正解を予測する
•教師なし学習
•データ群をグルーピングしたり特徴をまとめる
→データを捉えやすくする(可視化などを⾏う際に)
Copyright (C) Takeshi Mikami. All rights reserved. 21
教師あり学習と教師なし学習について説明します
takemikamiʼs note ‒ http://takemikami.com/
代表的な機械学習の⼿法
Copyright (C) Takeshi Mikami. All rights reserved. 22
scikit-learnによる機械学習
教師 種類 ⼿法 活⽤⽅法
教師あり
(supervised
learning)
分類
(classification)
ロジスティック回帰
決定⽊
SVM
ニューラルネットワーク
離脱顧客判定
スパムメールの判定
回帰
(regression)
線形回帰分析
ベイズ線形回帰分析
販売予測
教師なし
(unsupervised
learning)
クラスタリング
(clustering)
k-means法
混合正規分布モデル
顧客のセグメント分け
次元削減
(dimentionality reduction)
主成分分析
特異値分解
商品の類似性を可視化
※教師あり/なし以外にも強化学習(reinforcement learning)という⼿法もあります
代表的な機械学習の⼿法を紹介します
takemikamiʼs note ‒ http://takemikami.com/
y = f(x)<latexit sha1_base64="avIj5XAps1N9LzLhuEjnUmfZI00=">AAACa3ichVHLSsNAFD2Nr1ofrXYj6qJYKropUxEUQSi6cdmHfUAtJYnTGpomIUmLtfgDLt24qBsFEfEz3PgDLvoJIq4quHHhbRoQLeoNkzlz5p47Z+5IhqpYNmMdjzA0PDI65h33TUxOTfsDM7NZS6+bMs/IuqqbeUm0uKpoPGMrtsrzhsnFmqTynFTd7e3nGty0FF3bt5sGL9bEiqaUFVm0ico3Q9uh8srxaikQZlHmRGgQxFwQhhsJPXCLAxxCh4w6auDQYBNWIcKir4AYGAziimgRZxJSnH2OU/hIW6csThkisVX6V2hVcFmN1r2alqOW6RSVhknKECLsid2xLntk9+yZffxaq+XU6Hlp0iz1tdwo+c/m0u//qmo02zj6Uv3p2UYZm45XhbwbDtO7hdzXN04uuumtVKS1zK7ZC/m/Yh32QDfQGm/yTZKn2vDRA8R+tnsQZNeiMcLJ9XB8x30KLxawhBXq9wbi2EMCGafP52jj0vMqBIV5YbGfKnhcTRDfQoh8Al4di+s=</latexit><latexit sha1_base64="avIj5XAps1N9LzLhuEjnUmfZI00=">AAACa3ichVHLSsNAFD2Nr1ofrXYj6qJYKropUxEUQSi6cdmHfUAtJYnTGpomIUmLtfgDLt24qBsFEfEz3PgDLvoJIq4quHHhbRoQLeoNkzlz5p47Z+5IhqpYNmMdjzA0PDI65h33TUxOTfsDM7NZS6+bMs/IuqqbeUm0uKpoPGMrtsrzhsnFmqTynFTd7e3nGty0FF3bt5sGL9bEiqaUFVm0ico3Q9uh8srxaikQZlHmRGgQxFwQhhsJPXCLAxxCh4w6auDQYBNWIcKir4AYGAziimgRZxJSnH2OU/hIW6csThkisVX6V2hVcFmN1r2alqOW6RSVhknKECLsid2xLntk9+yZffxaq+XU6Hlp0iz1tdwo+c/m0u//qmo02zj6Uv3p2UYZm45XhbwbDtO7hdzXN04uuumtVKS1zK7ZC/m/Yh32QDfQGm/yTZKn2vDRA8R+tnsQZNeiMcLJ9XB8x30KLxawhBXq9wbi2EMCGafP52jj0vMqBIV5YbGfKnhcTRDfQoh8Al4di+s=</latexit><latexit sha1_base64="avIj5XAps1N9LzLhuEjnUmfZI00=">AAACa3ichVHLSsNAFD2Nr1ofrXYj6qJYKropUxEUQSi6cdmHfUAtJYnTGpomIUmLtfgDLt24qBsFEfEz3PgDLvoJIq4quHHhbRoQLeoNkzlz5p47Z+5IhqpYNmMdjzA0PDI65h33TUxOTfsDM7NZS6+bMs/IuqqbeUm0uKpoPGMrtsrzhsnFmqTynFTd7e3nGty0FF3bt5sGL9bEiqaUFVm0ico3Q9uh8srxaikQZlHmRGgQxFwQhhsJPXCLAxxCh4w6auDQYBNWIcKir4AYGAziimgRZxJSnH2OU/hIW6csThkisVX6V2hVcFmN1r2alqOW6RSVhknKECLsid2xLntk9+yZffxaq+XU6Hlp0iz1tdwo+c/m0u//qmo02zj6Uv3p2UYZm45XhbwbDtO7hdzXN04uuumtVKS1zK7ZC/m/Yh32QDfQGm/yTZKn2vDRA8R+tnsQZNeiMcLJ9XB8x30KLxawhBXq9wbi2EMCGafP52jj0vMqBIV5YbGfKnhcTRDfQoh8Al4di+s=</latexit><latexit sha1_base64="avIj5XAps1N9LzLhuEjnUmfZI00=">AAACa3ichVHLSsNAFD2Nr1ofrXYj6qJYKropUxEUQSi6cdmHfUAtJYnTGpomIUmLtfgDLt24qBsFEfEz3PgDLvoJIq4quHHhbRoQLeoNkzlz5p47Z+5IhqpYNmMdjzA0PDI65h33TUxOTfsDM7NZS6+bMs/IuqqbeUm0uKpoPGMrtsrzhsnFmqTynFTd7e3nGty0FF3bt5sGL9bEiqaUFVm0ico3Q9uh8srxaikQZlHmRGgQxFwQhhsJPXCLAxxCh4w6auDQYBNWIcKir4AYGAziimgRZxJSnH2OU/hIW6csThkisVX6V2hVcFmN1r2alqOW6RSVhknKECLsid2xLntk9+yZffxaq+XU6Hlp0iz1tdwo+c/m0u//qmo02zj6Uv3p2UYZm45XhbwbDtO7hdzXN04uuumtVKS1zK7ZC/m/Yh32QDfQGm/yTZKn2vDRA8R+tnsQZNeiMcLJ9XB8x30KLxawhBXq9wbi2EMCGafP52jj0vMqBIV5YbGfKnhcTRDfQoh8Al4di+s=</latexit>
教師あり学習の基本
Copyright (C) Takeshi Mikami. All rights reserved. 23
教師あり学習の基本的な考え⽅を説明します
やりたいこと:
「xの値」が与えられた時に「yの値」を予測したい
→ 𝑦 = 𝑓 𝑥 という関数を求めたい
⽬的変数 説明変数
予測モデル⽬的変数が離散値→分類
⽬的変数が連続値→回帰
takemikamiʼs note ‒ http://takemikami.com/
y = 2x<latexit sha1_base64="6ey09tPnw6uJouWfltsKpi6x1ZM=">AAACaXichVFNSwJBGH7cvsw+1LpIXSQxOskoQREEUpeOfuQHmMjuNtbmurvsrpJJf6BTt6hOBRHRz+jSH+jgTwiPBl069LouREn1DjPzzDPv884zM5KhKpbNWMcjjIyOjU94J31T0zOz/kBwLm/pDVPmOVlXdbMoiRZXFY3nbMVWedEwuViXVF6Qatv9/UKTm5aia7t2y+DlunigKVVFFm2i8q3wZjhxXAlEWIw5ER4GcRdE4EZKD9xjD/vQIaOBOjg02IRViLColRAHg0FcGW3iTEKKs89xCh9pG5TFKUMktkbjAa1KLqvRul/TctQynaJSN0kZRpS9sAfWY8/skb2yj19rtZ0afS8tmqWBlhsV/1ko+/6vqk6zjcMv1Z+ebVSx7nhVyLvhMP1byAN98+Sil93IRNvL7JZ1yf8N67AnuoHWfJPv0jxzDR99QPzncw+DfCIWJ5xejSS33K/wYhFLWKH3XkMSO0ghR+ce4RyXuPJ0haAQEhYGqYLH1czjWwiRTwWEi1I=</latexit><latexit sha1_base64="6ey09tPnw6uJouWfltsKpi6x1ZM=">AAACaXichVFNSwJBGH7cvsw+1LpIXSQxOskoQREEUpeOfuQHmMjuNtbmurvsrpJJf6BTt6hOBRHRz+jSH+jgTwiPBl069LouREn1DjPzzDPv884zM5KhKpbNWMcjjIyOjU94J31T0zOz/kBwLm/pDVPmOVlXdbMoiRZXFY3nbMVWedEwuViXVF6Qatv9/UKTm5aia7t2y+DlunigKVVFFm2i8q3wZjhxXAlEWIw5ER4GcRdE4EZKD9xjD/vQIaOBOjg02IRViLColRAHg0FcGW3iTEKKs89xCh9pG5TFKUMktkbjAa1KLqvRul/TctQynaJSN0kZRpS9sAfWY8/skb2yj19rtZ0afS8tmqWBlhsV/1ko+/6vqk6zjcMv1Z+ebVSx7nhVyLvhMP1byAN98+Sil93IRNvL7JZ1yf8N67AnuoHWfJPv0jxzDR99QPzncw+DfCIWJ5xejSS33K/wYhFLWKH3XkMSO0ghR+ce4RyXuPJ0haAQEhYGqYLH1czjWwiRTwWEi1I=</latexit><latexit sha1_base64="6ey09tPnw6uJouWfltsKpi6x1ZM=">AAACaXichVFNSwJBGH7cvsw+1LpIXSQxOskoQREEUpeOfuQHmMjuNtbmurvsrpJJf6BTt6hOBRHRz+jSH+jgTwiPBl069LouREn1DjPzzDPv884zM5KhKpbNWMcjjIyOjU94J31T0zOz/kBwLm/pDVPmOVlXdbMoiRZXFY3nbMVWedEwuViXVF6Qatv9/UKTm5aia7t2y+DlunigKVVFFm2i8q3wZjhxXAlEWIw5ER4GcRdE4EZKD9xjD/vQIaOBOjg02IRViLColRAHg0FcGW3iTEKKs89xCh9pG5TFKUMktkbjAa1KLqvRul/TctQynaJSN0kZRpS9sAfWY8/skb2yj19rtZ0afS8tmqWBlhsV/1ko+/6vqk6zjcMv1Z+ebVSx7nhVyLvhMP1byAN98+Sil93IRNvL7JZ1yf8N67AnuoHWfJPv0jxzDR99QPzncw+DfCIWJ5xejSS33K/wYhFLWKH3XkMSO0ghR+ce4RyXuPJ0haAQEhYGqYLH1czjWwiRTwWEi1I=</latexit><latexit sha1_base64="6ey09tPnw6uJouWfltsKpi6x1ZM=">AAACaXichVFNSwJBGH7cvsw+1LpIXSQxOskoQREEUpeOfuQHmMjuNtbmurvsrpJJf6BTt6hOBRHRz+jSH+jgTwiPBl069LouREn1DjPzzDPv884zM5KhKpbNWMcjjIyOjU94J31T0zOz/kBwLm/pDVPmOVlXdbMoiRZXFY3nbMVWedEwuViXVF6Qatv9/UKTm5aia7t2y+DlunigKVVFFm2i8q3wZjhxXAlEWIw5ER4GcRdE4EZKD9xjD/vQIaOBOjg02IRViLColRAHg0FcGW3iTEKKs89xCh9pG5TFKUMktkbjAa1KLqvRul/TctQynaJSN0kZRpS9sAfWY8/skb2yj19rtZ0afS8tmqWBlhsV/1ko+/6vqk6zjcMv1Z+ebVSx7nhVyLvhMP1byAN98+Sil93IRNvL7JZ1yf8N67AnuoHWfJPv0jxzDR99QPzncw+DfCIWJ5xejSS33K/wYhFLWKH3XkMSO0ghR+ce4RyXuPJ0haAQEhYGqYLH1czjWwiRTwWEi1I=</latexit>
教師あり学習の基本
Copyright (C) Takeshi Mikami. All rights reserved. 24
教師あり学習の基本的な考え⽅を説明します
x y
データ1 1 2
データ2 2 4
データ3 3 6
データ4 4 8
データ5 5 ?
①教師データを取得
教師あり学習の⼿続き:
②教師データから y=f(x) を導く
10
③未知の値を予測する
予測(prediction)
学習
(fitting, training)
takemikamiʼs note ‒ http://takemikami.com/
線形回帰による回帰
• 線形回帰分析:データに当てはまりの良い直線(回帰直線)を引く
• ⼿法:最⼩⼆乗法(残差の⼆乗和が最⼩になる係数を決定する)
Copyright (C) Takeshi Mikami. All rights reserved. 25
線形回帰による回帰を紹介します
線形回帰の例
標本回帰直線からの残差の⼆乗和
これを最⼩にする、a,bを求める
y = a + bx<latexit sha1_base64="YjNKByktGNZfn74w3E4yJfvBpyE=">AAACbXichVHLSsNAFD2N7/qqiiAoEiw+QCgTERRBEN24bNWq+ECSONWhaRKSabEWf8C14EIUFETEz3DjD7jwE8SFCwU3LrxJA6Ki3mFmzpy5586ZGcO1hC8Ze4gpNbV19Q2NTfHmlta29kRH57LvFD2TZ03HcrxVQ/e5JWyelUJafNX1uF4wLL5i5OeC/ZUS93zh2Euy7PLNgr5ji5wwdUnUWlmdVnV1VDX2thJJlmJhqD+BFoEkokg7iStsYBsOTBRRAIcNSdiCDp/aOjQwuMRtokKcR0iE+xwHiJO2SFmcMnRi8zTu0Go9Ym1aBzX9UG3SKRZ1j5QqBtk9u2Yv7I7dsEf2/mutSlgj8FKm2ahqubvVftiz+PavqkCzxO6n6k/PEjlMhl4FeXdDJriFWdWX9o9fFqcWBitD7II9kf9z9sBu6QZ26dW8zPCFE8TpA7Tvz/0TLI+lNMKZ8eTMbPQVjejFAEbovScwg3mkkaVzbRzhFGexZ6Vb6VP6q6lKLNJ04Usowx+ahIx2</latexit><latexit sha1_base64="YjNKByktGNZfn74w3E4yJfvBpyE=">AAACbXichVHLSsNAFD2N7/qqiiAoEiw+QCgTERRBEN24bNWq+ECSONWhaRKSabEWf8C14EIUFETEz3DjD7jwE8SFCwU3LrxJA6Ki3mFmzpy5586ZGcO1hC8Ze4gpNbV19Q2NTfHmlta29kRH57LvFD2TZ03HcrxVQ/e5JWyelUJafNX1uF4wLL5i5OeC/ZUS93zh2Euy7PLNgr5ji5wwdUnUWlmdVnV1VDX2thJJlmJhqD+BFoEkokg7iStsYBsOTBRRAIcNSdiCDp/aOjQwuMRtokKcR0iE+xwHiJO2SFmcMnRi8zTu0Go9Ym1aBzX9UG3SKRZ1j5QqBtk9u2Yv7I7dsEf2/mutSlgj8FKm2ahqubvVftiz+PavqkCzxO6n6k/PEjlMhl4FeXdDJriFWdWX9o9fFqcWBitD7II9kf9z9sBu6QZ26dW8zPCFE8TpA7Tvz/0TLI+lNMKZ8eTMbPQVjejFAEbovScwg3mkkaVzbRzhFGexZ6Vb6VP6q6lKLNJ04Usowx+ahIx2</latexit><latexit sha1_base64="YjNKByktGNZfn74w3E4yJfvBpyE=">AAACbXichVHLSsNAFD2N7/qqiiAoEiw+QCgTERRBEN24bNWq+ECSONWhaRKSabEWf8C14EIUFETEz3DjD7jwE8SFCwU3LrxJA6Ki3mFmzpy5586ZGcO1hC8Ze4gpNbV19Q2NTfHmlta29kRH57LvFD2TZ03HcrxVQ/e5JWyelUJafNX1uF4wLL5i5OeC/ZUS93zh2Euy7PLNgr5ji5wwdUnUWlmdVnV1VDX2thJJlmJhqD+BFoEkokg7iStsYBsOTBRRAIcNSdiCDp/aOjQwuMRtokKcR0iE+xwHiJO2SFmcMnRi8zTu0Go9Ym1aBzX9UG3SKRZ1j5QqBtk9u2Yv7I7dsEf2/mutSlgj8FKm2ahqubvVftiz+PavqkCzxO6n6k/PEjlMhl4FeXdDJriFWdWX9o9fFqcWBitD7II9kf9z9sBu6QZ26dW8zPCFE8TpA7Tvz/0TLI+lNMKZ8eTMbPQVjejFAEbovScwg3mkkaVzbRzhFGexZ6Vb6VP6q6lKLNJ04Usowx+ahIx2</latexit><latexit sha1_base64="YjNKByktGNZfn74w3E4yJfvBpyE=">AAACbXichVHLSsNAFD2N7/qqiiAoEiw+QCgTERRBEN24bNWq+ECSONWhaRKSabEWf8C14EIUFETEz3DjD7jwE8SFCwU3LrxJA6Ki3mFmzpy5586ZGcO1hC8Ze4gpNbV19Q2NTfHmlta29kRH57LvFD2TZ03HcrxVQ/e5JWyelUJafNX1uF4wLL5i5OeC/ZUS93zh2Euy7PLNgr5ji5wwdUnUWlmdVnV1VDX2thJJlmJhqD+BFoEkokg7iStsYBsOTBRRAIcNSdiCDp/aOjQwuMRtokKcR0iE+xwHiJO2SFmcMnRi8zTu0Go9Ym1aBzX9UG3SKRZ1j5QqBtk9u2Yv7I7dsEf2/mutSlgj8FKm2ahqubvVftiz+PavqkCzxO6n6k/PEjlMhl4FeXdDJriFWdWX9o9fFqcWBitD7II9kf9z9sBu6QZ26dW8zPCFE8TpA7Tvz/0TLI+lNMKZ8eTMbPQVjejFAEbovScwg3mkkaVzbRzhFGexZ6Vb6VP6q6lKLNJ04Usowx+ahIx2</latexit>
yi = a + bxi + ei<latexit sha1_base64="D3Ru8iBacgECSwooiGbuMLygC6U=">AAACeXichVHLSsNAFD2N7/qqj4XgJloqxYJMVVAEoejGpVbbClpCEqc6mCYhSYu1+AP+gAs3KohUP8ONP+CinyAuFVzowts0IFrUO8zMmTP33Dkzo9mGcD3G6iGprb2js6u7J9zb1z8wGBkazrpWydF5RrcMy9nWVJcbwuQZT3gG37YdrhY1g+e0w9XGfq7MHVdY5pZXsXm+qO6boiB01SNKiYxWFCEvy6qckLUjggmZK0KJRNkM80NuBckARBHEuhW5wS72YEFHCUVwmPAIG1DhUttBEgw2cXlUiXMICX+f4wRh0pYoi1OGSuwhjfu02glYk9aNmq6v1ukUg7pDShkx9shq7IU9sDv2xD5+rVX1azS8VGjWmlpuK4OnY5tv/6qKNHs4+FL96dlDAYu+V0HebZ9p3EJv6svHZy+bS+lYdYpdsWfyf8nq7J5uYJZf9esNnj5HmD4g+fO5W0F2diZJeGM+mloJvqIb45hEnN57ASmsYR0ZOvcYF6jhNvQuTUhxabqZKoUCzQi+hTT3CRSKkDM=</latexit><latexit sha1_base64="D3Ru8iBacgECSwooiGbuMLygC6U=">AAACeXichVHLSsNAFD2N7/qqj4XgJloqxYJMVVAEoejGpVbbClpCEqc6mCYhSYu1+AP+gAs3KohUP8ONP+CinyAuFVzowts0IFrUO8zMmTP33Dkzo9mGcD3G6iGprb2js6u7J9zb1z8wGBkazrpWydF5RrcMy9nWVJcbwuQZT3gG37YdrhY1g+e0w9XGfq7MHVdY5pZXsXm+qO6boiB01SNKiYxWFCEvy6qckLUjggmZK0KJRNkM80NuBckARBHEuhW5wS72YEFHCUVwmPAIG1DhUttBEgw2cXlUiXMICX+f4wRh0pYoi1OGSuwhjfu02glYk9aNmq6v1ukUg7pDShkx9shq7IU9sDv2xD5+rVX1azS8VGjWmlpuK4OnY5tv/6qKNHs4+FL96dlDAYu+V0HebZ9p3EJv6svHZy+bS+lYdYpdsWfyf8nq7J5uYJZf9esNnj5HmD4g+fO5W0F2diZJeGM+mloJvqIb45hEnN57ASmsYR0ZOvcYF6jhNvQuTUhxabqZKoUCzQi+hTT3CRSKkDM=</latexit><latexit sha1_base64="D3Ru8iBacgECSwooiGbuMLygC6U=">AAACeXichVHLSsNAFD2N7/qqj4XgJloqxYJMVVAEoejGpVbbClpCEqc6mCYhSYu1+AP+gAs3KohUP8ONP+CinyAuFVzowts0IFrUO8zMmTP33Dkzo9mGcD3G6iGprb2js6u7J9zb1z8wGBkazrpWydF5RrcMy9nWVJcbwuQZT3gG37YdrhY1g+e0w9XGfq7MHVdY5pZXsXm+qO6boiB01SNKiYxWFCEvy6qckLUjggmZK0KJRNkM80NuBckARBHEuhW5wS72YEFHCUVwmPAIG1DhUttBEgw2cXlUiXMICX+f4wRh0pYoi1OGSuwhjfu02glYk9aNmq6v1ukUg7pDShkx9shq7IU9sDv2xD5+rVX1azS8VGjWmlpuK4OnY5tv/6qKNHs4+FL96dlDAYu+V0HebZ9p3EJv6svHZy+bS+lYdYpdsWfyf8nq7J5uYJZf9esNnj5HmD4g+fO5W0F2diZJeGM+mloJvqIb45hEnN57ASmsYR0ZOvcYF6jhNvQuTUhxabqZKoUCzQi+hTT3CRSKkDM=</latexit><latexit sha1_base64="D3Ru8iBacgECSwooiGbuMLygC6U=">AAACeXichVHLSsNAFD2N7/qqj4XgJloqxYJMVVAEoejGpVbbClpCEqc6mCYhSYu1+AP+gAs3KohUP8ONP+CinyAuFVzowts0IFrUO8zMmTP33Dkzo9mGcD3G6iGprb2js6u7J9zb1z8wGBkazrpWydF5RrcMy9nWVJcbwuQZT3gG37YdrhY1g+e0w9XGfq7MHVdY5pZXsXm+qO6boiB01SNKiYxWFCEvy6qckLUjggmZK0KJRNkM80NuBckARBHEuhW5wS72YEFHCUVwmPAIG1DhUttBEgw2cXlUiXMICX+f4wRh0pYoi1OGSuwhjfu02glYk9aNmq6v1ukUg7pDShkx9shq7IU9sDv2xD5+rVX1azS8VGjWmlpuK4OnY5tv/6qKNHs4+FL96dlDAYu+V0HebZ9p3EJv6svHZy+bS+lYdYpdsWfyf8nq7J5uYJZf9esNnj5HmD4g+fO5W0F2diZJeGM+mloJvqIb45hEnN57ASmsYR0ZOvcYF6jhNvQuTUhxabqZKoUCzQi+hTT3CRSKkDM=</latexit>
nX
i=1
e2
i =
nX
i=1
{yi (a + bxi)}2
<latexit sha1_base64="mqoVWZNV3XgkliJsHW1/TpWKMMo=">AAACo3ichVFNSxtBGH5c22pTbVZ7EbwMDRGlNMwGQREsYi+CF41GBZMsu+skDu4Xu5tgXPYP+Ac89NTSUqQ/o5fSa+vBnyA9KnjpoW82C6UJbd9hZp555n3eeWbG9G0ZRpxfjyijDx4+Ght/nHsyMfk0r05N74VeO7BE1fJsLzgwjVDY0hXVSEa2OPADYTimLfbNk9e9/f2OCELpubtR1xd1x2i5siktIyJKV1/Vwrajx3JVSxqxmzChy0aZrbIBOq7FXV2yl2zeYC+YearLhVrSKCe6WuAlngYbBloGCshiy1M/ooYjeLDQhgMBFxFhGwZCaofQwOETV0dMXEBIpvsCCXKkbVOWoAyD2BMaW7Q6zFiX1r2aYaq26BSbekBKhiK/4pf8ln/hn/gN//nXWnFao+elS7PZ1wpfz5/P7Nz/V+XQHOH4t+qfniM0sZx6leTdT5neLay+vnN2cbuzUinGc/wd/0H+3/Jr/plu4HburA/bovIGOfoAbfC5h8FeuaQR3l4srK1nXzGOWTzHPL33EtawgS1U6dz3+Ipv+K4UlU2louz2U5WRTPMMf4RS/wXUzKB5</latexit><latexit sha1_base64="mqoVWZNV3XgkliJsHW1/TpWKMMo=">AAACo3ichVFNSxtBGH5c22pTbVZ7EbwMDRGlNMwGQREsYi+CF41GBZMsu+skDu4Xu5tgXPYP+Ac89NTSUqQ/o5fSa+vBnyA9KnjpoW82C6UJbd9hZp555n3eeWbG9G0ZRpxfjyijDx4+Ght/nHsyMfk0r05N74VeO7BE1fJsLzgwjVDY0hXVSEa2OPADYTimLfbNk9e9/f2OCELpubtR1xd1x2i5siktIyJKV1/Vwrajx3JVSxqxmzChy0aZrbIBOq7FXV2yl2zeYC+YearLhVrSKCe6WuAlngYbBloGCshiy1M/ooYjeLDQhgMBFxFhGwZCaofQwOETV0dMXEBIpvsCCXKkbVOWoAyD2BMaW7Q6zFiX1r2aYaq26BSbekBKhiK/4pf8ln/hn/gN//nXWnFao+elS7PZ1wpfz5/P7Nz/V+XQHOH4t+qfniM0sZx6leTdT5neLay+vnN2cbuzUinGc/wd/0H+3/Jr/plu4HburA/bovIGOfoAbfC5h8FeuaQR3l4srK1nXzGOWTzHPL33EtawgS1U6dz3+Ipv+K4UlU2louz2U5WRTPMMf4RS/wXUzKB5</latexit><latexit sha1_base64="mqoVWZNV3XgkliJsHW1/TpWKMMo=">AAACo3ichVFNSxtBGH5c22pTbVZ7EbwMDRGlNMwGQREsYi+CF41GBZMsu+skDu4Xu5tgXPYP+Ac89NTSUqQ/o5fSa+vBnyA9KnjpoW82C6UJbd9hZp555n3eeWbG9G0ZRpxfjyijDx4+Ght/nHsyMfk0r05N74VeO7BE1fJsLzgwjVDY0hXVSEa2OPADYTimLfbNk9e9/f2OCELpubtR1xd1x2i5siktIyJKV1/Vwrajx3JVSxqxmzChy0aZrbIBOq7FXV2yl2zeYC+YearLhVrSKCe6WuAlngYbBloGCshiy1M/ooYjeLDQhgMBFxFhGwZCaofQwOETV0dMXEBIpvsCCXKkbVOWoAyD2BMaW7Q6zFiX1r2aYaq26BSbekBKhiK/4pf8ln/hn/gN//nXWnFao+elS7PZ1wpfz5/P7Nz/V+XQHOH4t+qfniM0sZx6leTdT5neLay+vnN2cbuzUinGc/wd/0H+3/Jr/plu4HburA/bovIGOfoAbfC5h8FeuaQR3l4srK1nXzGOWTzHPL33EtawgS1U6dz3+Ipv+K4UlU2louz2U5WRTPMMf4RS/wXUzKB5</latexit><latexit sha1_base64="mqoVWZNV3XgkliJsHW1/TpWKMMo=">AAACo3ichVFNSxtBGH5c22pTbVZ7EbwMDRGlNMwGQREsYi+CF41GBZMsu+skDu4Xu5tgXPYP+Ac89NTSUqQ/o5fSa+vBnyA9KnjpoW82C6UJbd9hZp555n3eeWbG9G0ZRpxfjyijDx4+Ght/nHsyMfk0r05N74VeO7BE1fJsLzgwjVDY0hXVSEa2OPADYTimLfbNk9e9/f2OCELpubtR1xd1x2i5siktIyJKV1/Vwrajx3JVSxqxmzChy0aZrbIBOq7FXV2yl2zeYC+YearLhVrSKCe6WuAlngYbBloGCshiy1M/ooYjeLDQhgMBFxFhGwZCaofQwOETV0dMXEBIpvsCCXKkbVOWoAyD2BMaW7Q6zFiX1r2aYaq26BSbekBKhiK/4pf8ln/hn/gN//nXWnFao+elS7PZ1wpfz5/P7Nz/V+XQHOH4t+qfniM0sZx6leTdT5neLay+vnN2cbuzUinGc/wd/0H+3/Jr/plu4HburA/bovIGOfoAbfC5h8FeuaQR3l4srK1nXzGOWTzHPL33EtawgS1U6dz3+Ipv+K4UlU2louz2U5WRTPMMf4RS/wXUzKB5</latexit>
takemikamiʼs note ‒ http://takemikami.com/
ロジスティック回帰による分類
• ロジスティック関数で回帰直線を所属確率に変換、分類問題に適⽤
Copyright (C) Takeshi Mikami. All rights reserved. 26
ロジスティック回帰による分類を紹介します
f(x) = a + bx<latexit sha1_base64="VhiKDeOA+vC91HwvYF89lEYlB9o=">AAACcXichVHLSsNAFD2Nr1ofrbpR3ISWiiKUqQiKIBTduLStfUCtksRpDaZJSNJiLf6AP6DgqoKI+Blu/AEX/QRxWcGNC2/SgGhR7zAzZ87cc+fMjGxqqu0w1gkIA4NDwyPB0dDY+MRkODI1nbeNuqXwnGJohlWUJZtrqs5zjupovGhaXKrJGi/IJ9vufqHBLVs19D2nafJyTarqakVVJIeog8ri6ZK4KUrisiifhg4jMZZgXoj9IOmDGPzYNSJ32McRDCioowYOHQ5hDRJsaiUkwWASV0aLOIuQ6u1znCNE2jplccqQiD2hsUqrks/qtHZr2p5aoVM06hYpRcTZM7tnXfbEHtgL+/i1Vsur4Xpp0iz3tNw8DF/MZt//VdVodnD8pfrTs4MK1j2vKnk3Pca9hdLTN84uu9mNTLy1wG7YK/lvsw57pBvojTflNs0z13A/IPnzuftBfiWRJJxejaW2/K8IYh5RLNJ7ryGFHewiR+dauEIbN4GuMCeIQrSXKgR8zQy+hbD8CbwojV4=</latexit><latexit sha1_base64="VhiKDeOA+vC91HwvYF89lEYlB9o=">AAACcXichVHLSsNAFD2Nr1ofrbpR3ISWiiKUqQiKIBTduLStfUCtksRpDaZJSNJiLf6AP6DgqoKI+Blu/AEX/QRxWcGNC2/SgGhR7zAzZ87cc+fMjGxqqu0w1gkIA4NDwyPB0dDY+MRkODI1nbeNuqXwnGJohlWUJZtrqs5zjupovGhaXKrJGi/IJ9vufqHBLVs19D2nafJyTarqakVVJIeog8ri6ZK4KUrisiifhg4jMZZgXoj9IOmDGPzYNSJ32McRDCioowYOHQ5hDRJsaiUkwWASV0aLOIuQ6u1znCNE2jplccqQiD2hsUqrks/qtHZr2p5aoVM06hYpRcTZM7tnXfbEHtgL+/i1Vsur4Xpp0iz3tNw8DF/MZt//VdVodnD8pfrTs4MK1j2vKnk3Pca9hdLTN84uu9mNTLy1wG7YK/lvsw57pBvojTflNs0z13A/IPnzuftBfiWRJJxejaW2/K8IYh5RLNJ7ryGFHewiR+dauEIbN4GuMCeIQrSXKgR8zQy+hbD8CbwojV4=</latexit><latexit sha1_base64="VhiKDeOA+vC91HwvYF89lEYlB9o=">AAACcXichVHLSsNAFD2Nr1ofrbpR3ISWiiKUqQiKIBTduLStfUCtksRpDaZJSNJiLf6AP6DgqoKI+Blu/AEX/QRxWcGNC2/SgGhR7zAzZ87cc+fMjGxqqu0w1gkIA4NDwyPB0dDY+MRkODI1nbeNuqXwnGJohlWUJZtrqs5zjupovGhaXKrJGi/IJ9vufqHBLVs19D2nafJyTarqakVVJIeog8ri6ZK4KUrisiifhg4jMZZgXoj9IOmDGPzYNSJ32McRDCioowYOHQ5hDRJsaiUkwWASV0aLOIuQ6u1znCNE2jplccqQiD2hsUqrks/qtHZr2p5aoVM06hYpRcTZM7tnXfbEHtgL+/i1Vsur4Xpp0iz3tNw8DF/MZt//VdVodnD8pfrTs4MK1j2vKnk3Pca9hdLTN84uu9mNTLy1wG7YK/lvsw57pBvojTflNs0z13A/IPnzuftBfiWRJJxejaW2/K8IYh5RLNJ7ryGFHewiR+dauEIbN4GuMCeIQrSXKgR8zQy+hbD8CbwojV4=</latexit><latexit sha1_base64="VhiKDeOA+vC91HwvYF89lEYlB9o=">AAACcXichVHLSsNAFD2Nr1ofrbpR3ISWiiKUqQiKIBTduLStfUCtksRpDaZJSNJiLf6AP6DgqoKI+Blu/AEX/QRxWcGNC2/SgGhR7zAzZ87cc+fMjGxqqu0w1gkIA4NDwyPB0dDY+MRkODI1nbeNuqXwnGJohlWUJZtrqs5zjupovGhaXKrJGi/IJ9vufqHBLVs19D2nafJyTarqakVVJIeog8ri6ZK4KUrisiifhg4jMZZgXoj9IOmDGPzYNSJ32McRDCioowYOHQ5hDRJsaiUkwWASV0aLOIuQ6u1znCNE2jplccqQiD2hsUqrks/qtHZr2p5aoVM06hYpRcTZM7tnXfbEHtgL+/i1Vsur4Xpp0iz3tNw8DF/MZt//VdVodnD8pfrTs4MK1j2vKnk3Pca9hdLTN84uu9mNTLy1wG7YK/lvsw57pBvojTflNs0z13A/IPnzuftBfiWRJJxejaW2/K8IYh5RLNJ7ryGFHewiR+dauEIbN4GuMCeIQrSXKgR8zQy+hbD8CbwojV4=</latexit>
※シグモイド関数
(a) =
1
1 + e a
<latexit sha1_base64="o1wcc+FSB+1vahwU7g3kUpQTLVQ=">AAAChnichVFNSxtBGH5ctU1TW1d7EbyshhRLMcwWRRGEoBePJpoPSGyYXSdxcL/Y3QR02XPBP+ChJwUpRby2P6CX/gEP/gTxmEIvPfhmsyCttH2HmXnmmfd555kZw7NkEDJ2M6KMjo0/eZp5ln0+8eLlpDo1XQ3crm+Kiularl83eCAs6YhKKENL1D1fcNuwRM043Bzs13rCD6Tr7IZHntizeceRbWnykKiWOtcMZMfmC/yNtq412z43tUiPtUjT34r30SKP45aaYwWWhPYY6CnIIY1tV/2EJvbhwkQXNgQchIQtcATUGtDB4BG3h4g4n5BM9gViZEnbpSxBGZzYQxo7tGqkrEPrQc0gUZt0ikXdJ6WGPLtmn1mffWeX7Jb9+mutKKkx8HJEszHUCq81eTKz8/O/KpvmEAcPqn96DtHGauJVkncvYQa3MIf63vFpf2etnI9es3N2R/7P2A37Rjdwej/Mi5Iof0SWPkD/87kfg+q7gk64tJQrbqRfkcEs5rFA772CIrawjQqd+wFX+IKvSkYpKMvKyjBVGUk1r/BbKMV7N8GUrA==</latexit><latexit sha1_base64="o1wcc+FSB+1vahwU7g3kUpQTLVQ=">AAAChnichVFNSxtBGH5ctU1TW1d7EbyshhRLMcwWRRGEoBePJpoPSGyYXSdxcL/Y3QR02XPBP+ChJwUpRby2P6CX/gEP/gTxmEIvPfhmsyCttH2HmXnmmfd555kZw7NkEDJ2M6KMjo0/eZp5ln0+8eLlpDo1XQ3crm+Kiularl83eCAs6YhKKENL1D1fcNuwRM043Bzs13rCD6Tr7IZHntizeceRbWnykKiWOtcMZMfmC/yNtq412z43tUiPtUjT34r30SKP45aaYwWWhPYY6CnIIY1tV/2EJvbhwkQXNgQchIQtcATUGtDB4BG3h4g4n5BM9gViZEnbpSxBGZzYQxo7tGqkrEPrQc0gUZt0ikXdJ6WGPLtmn1mffWeX7Jb9+mutKKkx8HJEszHUCq81eTKz8/O/KpvmEAcPqn96DtHGauJVkncvYQa3MIf63vFpf2etnI9es3N2R/7P2A37Rjdwej/Mi5Iof0SWPkD/87kfg+q7gk64tJQrbqRfkcEs5rFA772CIrawjQqd+wFX+IKvSkYpKMvKyjBVGUk1r/BbKMV7N8GUrA==</latexit><latexit sha1_base64="o1wcc+FSB+1vahwU7g3kUpQTLVQ=">AAAChnichVFNSxtBGH5ctU1TW1d7EbyshhRLMcwWRRGEoBePJpoPSGyYXSdxcL/Y3QR02XPBP+ChJwUpRby2P6CX/gEP/gTxmEIvPfhmsyCttH2HmXnmmfd555kZw7NkEDJ2M6KMjo0/eZp5ln0+8eLlpDo1XQ3crm+Kiularl83eCAs6YhKKENL1D1fcNuwRM043Bzs13rCD6Tr7IZHntizeceRbWnykKiWOtcMZMfmC/yNtq412z43tUiPtUjT34r30SKP45aaYwWWhPYY6CnIIY1tV/2EJvbhwkQXNgQchIQtcATUGtDB4BG3h4g4n5BM9gViZEnbpSxBGZzYQxo7tGqkrEPrQc0gUZt0ikXdJ6WGPLtmn1mffWeX7Jb9+mutKKkx8HJEszHUCq81eTKz8/O/KpvmEAcPqn96DtHGauJVkncvYQa3MIf63vFpf2etnI9es3N2R/7P2A37Rjdwej/Mi5Iof0SWPkD/87kfg+q7gk64tJQrbqRfkcEs5rFA772CIrawjQqd+wFX+IKvSkYpKMvKyjBVGUk1r/BbKMV7N8GUrA==</latexit><latexit sha1_base64="o1wcc+FSB+1vahwU7g3kUpQTLVQ=">AAAChnichVFNSxtBGH5ctU1TW1d7EbyshhRLMcwWRRGEoBePJpoPSGyYXSdxcL/Y3QR02XPBP+ChJwUpRby2P6CX/gEP/gTxmEIvPfhmsyCttH2HmXnmmfd555kZw7NkEDJ2M6KMjo0/eZp5ln0+8eLlpDo1XQ3crm+Kiularl83eCAs6YhKKENL1D1fcNuwRM043Bzs13rCD6Tr7IZHntizeceRbWnykKiWOtcMZMfmC/yNtq412z43tUiPtUjT34r30SKP45aaYwWWhPYY6CnIIY1tV/2EJvbhwkQXNgQchIQtcATUGtDB4BG3h4g4n5BM9gViZEnbpSxBGZzYQxo7tGqkrEPrQc0gUZt0ikXdJ6WGPLtmn1mffWeX7Jb9+mutKKkx8HJEszHUCq81eTKz8/O/KpvmEAcPqn96DtHGauJVkncvYQa3MIf63vFpf2etnI9es3N2R/7P2A37Rjdwej/Mi5Iof0SWPkD/87kfg+q7gk64tJQrbqRfkcEs5rFA772CIrawjQqd+wFX+IKvSkYpKMvKyjBVGUk1r/BbKMV7N8GUrA==</latexit>
x<latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit><latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit><latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit><latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit>
x<latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit><latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit><latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit><latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit>
1.0
0.0
ロジスティック回帰回帰
(f(x)) =
1
1 + e (a+bx)
<latexit sha1_base64="N+oLuaC5bW/Rj4lOqP8XEYQLbcQ=">AAACjnicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoxhRnpucmaqRpVGhqKtgqxKQVJSYrVBvWArF2aly1rkaidlKFZm0tV7yAsoGeARgoYDIMoQxlBigIyBdYzhDDkMKQz5DMUMqQy5DKkMdQAmTnMCQyFANhNIMhgwFDAVAslqEaKFYEZGWC5VMZahm4gHpLgapSgSoSgaLZQDIdyIuGiuYB+SAzi8G6k4G25ABxEVCnAoOqwVWDlQafDU4YrDZ4afAHp1nVYDNAbqkE0kkQvakF8fxdEsHfCerKBdIlDBkIXXjdXMKQxmABdmsm0O0FYBGQL5Ih+suqpn8OtgpSrVYzWGTwGuj+hQY3DQ4DfZBX9iV5aWBq0GwGUAQYogc3JiPMSM8QyA40UXZwgkYFB4M0gxKDBjC8zRkcGDwYAhhCgfb2M2xl2Mewn0mAyYzJlskeopSJEapHmAEFMHkAANxhlwo=</latexit><latexit sha1_base64="N+oLuaC5bW/Rj4lOqP8XEYQLbcQ=">AAACjnicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoxhRnpucmaqRpVGhqKtgqxKQVJSYrVBvWArF2aly1rkaidlKFZm0tV7yAsoGeARgoYDIMoQxlBigIyBdYzhDDkMKQz5DMUMqQy5DKkMdQAmTnMCQyFANhNIMhgwFDAVAslqEaKFYEZGWC5VMZahm4gHpLgapSgSoSgaLZQDIdyIuGiuYB+SAzi8G6k4G25ABxEVCnAoOqwVWDlQafDU4YrDZ4afAHp1nVYDNAbqkE0kkQvakF8fxdEsHfCerKBdIlDBkIXXjdXMKQxmABdmsm0O0FYBGQL5Ih+suqpn8OtgpSrVYzWGTwGuj+hQY3DQ4DfZBX9iV5aWBq0GwGUAQYogc3JiPMSM8QyA40UXZwgkYFB4M0gxKDBjC8zRkcGDwYAhhCgfb2M2xl2Mewn0mAyYzJlskeopSJEapHmAEFMHkAANxhlwo=</latexit><latexit sha1_base64="N+oLuaC5bW/Rj4lOqP8XEYQLbcQ=">AAACjnicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoxhRnpucmaqRpVGhqKtgqxKQVJSYrVBvWArF2aly1rkaidlKFZm0tV7yAsoGeARgoYDIMoQxlBigIyBdYzhDDkMKQz5DMUMqQy5DKkMdQAmTnMCQyFANhNIMhgwFDAVAslqEaKFYEZGWC5VMZahm4gHpLgapSgSoSgaLZQDIdyIuGiuYB+SAzi8G6k4G25ABxEVCnAoOqwVWDlQafDU4YrDZ4afAHp1nVYDNAbqkE0kkQvakF8fxdEsHfCerKBdIlDBkIXXjdXMKQxmABdmsm0O0FYBGQL5Ih+suqpn8OtgpSrVYzWGTwGuj+hQY3DQ4DfZBX9iV5aWBq0GwGUAQYogc3JiPMSM8QyA40UXZwgkYFB4M0gxKDBjC8zRkcGDwYAhhCgfb2M2xl2Mewn0mAyYzJlskeopSJEapHmAEFMHkAANxhlwo=</latexit><latexit sha1_base64="N+oLuaC5bW/Rj4lOqP8XEYQLbcQ=">AAACjnicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoxhRnpucmaqRpVGhqKtgqxKQVJSYrVBvWArF2aly1rkaidlKFZm0tV7yAsoGeARgoYDIMoQxlBigIyBdYzhDDkMKQz5DMUMqQy5DKkMdQAmTnMCQyFANhNIMhgwFDAVAslqEaKFYEZGWC5VMZahm4gHpLgapSgSoSgaLZQDIdyIuGiuYB+SAzi8G6k4G25ABxEVCnAoOqwVWDlQafDU4YrDZ4afAHp1nVYDNAbqkE0kkQvakF8fxdEsHfCerKBdIlDBkIXXjdXMKQxmABdmsm0O0FYBGQL5Ih+suqpn8OtgpSrVYzWGTwGuj+hQY3DQ4DfZBX9iV5aWBq0GwGUAQYogc3JiPMSM8QyA40UXZwgkYFB4M0gxKDBjC8zRkcGDwYAhhCgfb2M2xl2Mewn0mAyYzJlskeopSJEapHmAEFMHkAANxhlwo=</latexit>
takemikamiʼs note ‒ http://takemikami.com/
単純パーセプトロン
• パーセプトロンとは、視覚と脳の機能をモデル化したもの
• ⼊⼒信号(x)と重み(w)の乗算の総和に対して、出⼒信号(y)が決まる
Copyright (C) Takeshi Mikami. All rights reserved. 27
単純パーセプトロンを紹介します
𝑥%
𝑥&
𝑣
𝑤%
𝑤&
⼊⼒層 出⼒層
𝑦𝜎
活性化関数
1
𝑤+ = 𝑎
…
重み
y = (
pX
i=1
wixi + w0)
<latexit sha1_base64="Pp0TLYdFS03hQvHtL3HbO7OzeZ8=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoVyrYKsQUZ6bnJipoABmlufHVmbaGtXHVBbUK5fGZChVArA1kGShoxgsoG+gZgIECJsMQylBmgIKAfIHlDDEMKQz5DMkMpQy5DKkMeQwlQHYOQyJDMRBGMxgyGDAUAMViGaqBYkVAViZYPpWhloELqLcUqCoVqCIRKJoNJNOBvGioaB6QDzKzGKw7GWhLDhAXAXUqMKgaXDVYafDZ4ITBaoOXBn9wmlUNNgPklkognQTRm1oQz98lEfydoK5cIF3CkIHQhdfNJQxpDBZgt2YC3V4AFgH5Ihmiv6xq+udgqyDVajWDRQavge5faHDT4DDQB3llX5KXBqYGzWbgAkaAIXpwYzLCjPQMgexAE2UHJ2hUcDBIMygxaADD25zBgcGDIYAhFGjvRIbtDAcYDjIJMVkw2TM5QpQyMUL1CDOgACYvAJOImD8=</latexit><latexit sha1_base64="Pp0TLYdFS03hQvHtL3HbO7OzeZ8=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoVyrYKsQUZ6bnJipoABmlufHVmbaGtXHVBbUK5fGZChVArA1kGShoxgsoG+gZgIECJsMQylBmgIKAfIHlDDEMKQz5DMkMpQy5DKkMeQwlQHYOQyJDMRBGMxgyGDAUAMViGaqBYkVAViZYPpWhloELqLcUqCoVqCIRKJoNJNOBvGioaB6QDzKzGKw7GWhLDhAXAXUqMKgaXDVYafDZ4ITBaoOXBn9wmlUNNgPklkognQTRm1oQz98lEfydoK5cIF3CkIHQhdfNJQxpDBZgt2YC3V4AFgH5Ihmiv6xq+udgqyDVajWDRQavge5faHDT4DDQB3llX5KXBqYGzWbgAkaAIXpwYzLCjPQMgexAE2UHJ2hUcDBIMygxaADD25zBgcGDIYAhFGjvRIbtDAcYDjIJMVkw2TM5QpQyMUL1CDOgACYvAJOImD8=</latexit><latexit sha1_base64="Pp0TLYdFS03hQvHtL3HbO7OzeZ8=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoVyrYKsQUZ6bnJipoABmlufHVmbaGtXHVBbUK5fGZChVArA1kGShoxgsoG+gZgIECJsMQylBmgIKAfIHlDDEMKQz5DMkMpQy5DKkMeQwlQHYOQyJDMRBGMxgyGDAUAMViGaqBYkVAViZYPpWhloELqLcUqCoVqCIRKJoNJNOBvGioaB6QDzKzGKw7GWhLDhAXAXUqMKgaXDVYafDZ4ITBaoOXBn9wmlUNNgPklkognQTRm1oQz98lEfydoK5cIF3CkIHQhdfNJQxpDBZgt2YC3V4AFgH5Ihmiv6xq+udgqyDVajWDRQavge5faHDT4DDQB3llX5KXBqYGzWbgAkaAIXpwYzLCjPQMgexAE2UHJ2hUcDBIMygxaADD25zBgcGDIYAhFGjvRIbtDAcYDjIJMVkw2TM5QpQyMUL1CDOgACYvAJOImD8=</latexit><latexit sha1_base64="Pp0TLYdFS03hQvHtL3HbO7OzeZ8=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoVyrYKsQUZ6bnJipoABmlufHVmbaGtXHVBbUK5fGZChVArA1kGShoxgsoG+gZgIECJsMQylBmgIKAfIHlDDEMKQz5DMkMpQy5DKkMeQwlQHYOQyJDMRBGMxgyGDAUAMViGaqBYkVAViZYPpWhloELqLcUqCoVqCIRKJoNJNOBvGioaB6QDzKzGKw7GWhLDhAXAXUqMKgaXDVYafDZ4ITBaoOXBn9wmlUNNgPklkognQTRm1oQz98lEfydoK5cIF3CkIHQhdfNJQxpDBZgt2YC3V4AFgH5Ihmiv6xq+udgqyDVajWDRQavge5faHDT4DDQB3llX5KXBqYGzWbgAkaAIXpwYzLCjPQMgexAE2UHJ2hUcDBIMygxaADD25zBgcGDIYAhFGjvRIbtDAcYDjIJMVkw2TM5QpQyMUL1CDOgACYvAJOImD8=</latexit>
= 𝑏
ロジスティック回帰と
単純パーセプトロンは等価
takemikamiʼs note ‒ http://takemikami.com/
単純パーセプトロン
• 説明変数ベクトルと回帰係数ベクトルの内積を求め、
活性化関数に渡した写像が⽬的変数(クラスへの所属確率)となる
Copyright (C) Takeshi Mikami. All rights reserved. 28
単純パーセプトロンの計算イメージを⽰します
次元0 次元1 次元2 … 次元p
1 𝑥% 𝑥. 𝑥&
回帰係数
重み0 𝑤+
重み1 𝑤%
重み2 𝑤.
…
重みp 𝑤&
× = 𝑣
所属確率
𝑦
𝜎
説明変数 ⽬的変数
takemikamiʼs note ‒ http://takemikami.com/
整然データ(TidyData)とは
• 機械学習に⽤いるのに適したデータ形式、次の条件に合致
• 1つの変数が1つの列になっている
• 1つの観測が1つの⾏になっている
• これらが⼀つの表にまとまっている
Copyright (C) Takeshi Mikami. All rights reserved. 29
整然データについて説明します
x1 x2 x3 … xp y
#1 1 3 1 … 2 2
#2 2 5 4 … 4 1
… … … … … … …
#n-1 4 8 4 … 8 3
#n 5 11 2 … 10 5
説明変数 ⽬的変数
観測事象
takemikamiʼs note ‒ http://takemikami.com/
整然データ(TidyData)への変換イメージ
• 例:模擬試験の点数から⽣徒毎の合格確率を予測したい
「模擬試験種別 × ⽣徒IDの複合キーのデータ」ならば、
⽣徒を1観測とするデータに変換する必要がある
Copyright (C) Takeshi Mikami. All rights reserved. 30
整然データへの変換イメージを説明します
⽣徒ID 模試① 模試② … 模試p 合格確率
#1 1 3 … 2 ?
#2 2 5 … 4 ?
… … … … … …
#n-1 4 8 … 8 ?
#n 5 11 … 10 ?
模試種別 ⽣徒ID 得点
① #1 1
① #2 2
… … …
p #n-1 8
p #n 11
⽬的変数複合キー 説明変数得点データ
takemikamiʼs note ‒ http://takemikami.com/Copyright (C) Takeshi Mikami. All rights reserved. 31
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
アイドルマスター シンデレラガールズ U149 (UNDER 149)
takemikamiʼs note ‒ http://takemikami.com/
アイドルの整然データ
• im@sparqlからアイドルを観測事象とする整然データを作成
• 年齢、⾝⻑、体重、スリーサイズ、誕⽣⽇、出⾝地
Copyright (C) Takeshi Mikami. All rights reserved. 32
アイドルの整然データを⽤意するイメージを⽰します
label title div age height weight bust waist hip birthdate birthplace
0 ⼤⽯泉 CinderellaGirls 15.0 157.0 41.0 83.0 55.0 82.0 --11-11 静岡
1 双葉杏 CinderellaGirls 17.0 139.0 30.0 NaN NaN NaN --09-02 北海道
2 相葉⼣美 CinderellaGirls 18.0 158.0 42.0 81.0 57.0 80.0 --04-15 神奈川
3 詩花 961ProIdols 17.0 158.0 43.0 82.0 53.0 80.0 --09-16 オーストリア
4 柊志乃 CinderellaGirls 31.0 167.0 43.0 84.0 54.0 83.0 --12-25 ⼭梨
5 村上巴 CinderellaGirls 13.0 146.0 37.0 74.0 53.0 76.0 --01-03 広島
6 東豪寺麗華 1054Pro NaN NaN NaN NaN NaN NaN
7 浜⼝あやめ CinderellaGirls 15.0 154.0 42.0 78.0 55.0 80.0 --01-13 三重
8 ライラ CinderellaGirls 16.0 150.0 40.0 75.0 54.0 78.0 --05-21 ドバイ
9 ⼀ノ瀬志希 CinderellaGirls 18.0 161.0 43.0 83.0 57.0 82.0 --05-30 岩⼿
takemikamiʼs note ‒ http://takemikami.com/
前処理(名義尺度を定量データに変換)
• 名義尺度を、定量データに変換
• 誕⽣⽇→誕⽣⽉の東京の平均気温、出⾝地→出⾝都道府県の⼈⼝
Copyright (C) Takeshi Mikami. All rights reserved. 33
データの前処理を⾏うイメージを⽰します
label title div age height weight bust waist hip birthtemp population
0 ⼤⽯泉 CinderellaGirls 15.0 157.0 41.0 83.0 55.0 82.0 12.800 3626991.0
1 双葉杏 CinderellaGirls 17.0 139.0 30.0 NaN NaN NaN 23.175 5348768.0
2 相葉⼣美 CinderellaGirls 18.0 158.0 42.0 81.0 57.0 80.0 15.400 8887304.0
3 詩花 961ProIdols 17.0 158.0 43.0 82.0 53.0 80.0 23.175 NaN
4 柊志乃 CinderellaGirls 31.0 167.0 43.0 84.0 54.0 83.0 8.275 819205.0
5 村上巴 CinderellaGirls 13.0 146.0 37.0 74.0 53.0 76.0 5.600 2795626.0
6 東豪寺麗華 1054Pro NaN NaN NaN NaN NaN NaN NaN NaN
7 浜⼝あやめ CinderellaGirls 15.0 154.0 42.0 78.0 55.0 80.0 5.600 1776805.0
8 ライラ CinderellaGirls 16.0 150.0 40.0 75.0 54.0 78.0 20.275 NaN
9 ⼀ノ瀬志希 CinderellaGirls 18.0 161.0 43.0 83.0 57.0 82.0 20.275 1272745.0
takemikamiʼs note ‒ http://takemikami.com/
前処理(正規化、⽋損値補完)
• 各特徴量の最⼤値=1, 最⼩値=0に揃える、⽋損値を算術平均で補完
• scikit-learnのMinMaxScaler, SimpleImputerを使⽤
Copyright (C) Takeshi Mikami. All rights reserved. 34
データの前処理を⾏うイメージを⽰します
name age height weight bust waist hip birttemp popu
0 ⼤⽯泉 0.272727 0.545455 0.40625 0.511111 0.444444 0.607143 0.335274 0.247083
1 双葉杏 0.363636 0.218182 0.06250 0.466497 0.515267 0.583969 0.818393 0.386155
2 相葉⼣美 0.409091 0.563636 0.43750 0.466667 0.555556 0.535714 0.456345 0.671971
3 詩花 0.363636 0.563636 0.46875 0.488889 0.333333 0.535714 0.818393 0.378733
4 柊志乃 1.000000 0.727273 0.46875 0.533333 0.388889 0.642857 0.124563 0.020291
5 村上巴 0.181818 0.345455 0.28125 0.311111 0.333333 0.392857 0.000000 0.179931
6 東豪寺麗華 0.369125 0.535885 0.48608 0.466497 0.515267 0.583969 0.522762 0.378733
7 浜⼝あやめ 0.272727 0.490909 0.43750 0.400000 0.444444 0.535714 0.000000 0.097639
8 ライラ 0.318182 0.418182 0.37500 0.333333 0.388889 0.464286 0.683353 0.378733
9 ⼀ノ瀬志希 0.409091 0.618182 0.46875 0.511111 0.555556 0.607143 0.683353 0.056924
takemikamiʼs note ‒ http://takemikami.com/
教師データの作成
• 教師ラベル(U149=1.0, notU149=0.0)を付与します
Copyright (C) Takeshi Mikami. All rights reserved. 35
教師データ作成のイメージを⽰します
name age height weight bust waist hip birttemp popu label
0 ⼤⽯泉 0.272727 0.545455 0.40625 0.511111 0.444444 0.607143 0.335274 0.247083 0.0
1 双葉杏 0.363636 0.218182 0.06250 0.466497 0.515267 0.583969 0.818393 0.386155 0.0
2 相葉⼣美 0.409091 0.563636 0.43750 0.466667 0.555556 0.535714 0.456345 0.671971 0.0
3 詩花 0.363636 0.563636 0.46875 0.488889 0.333333 0.535714 0.818393 0.378733 0.0
4 柊志乃 1.000000 0.727273 0.46875 0.533333 0.388889 0.642857 0.124563 0.020291 0.0
5 村上巴 0.181818 0.345455 0.28125 0.311111 0.333333 0.392857 0.000000 0.179931 0.0
… … … … … … … … … … …
10 結城晴 0.136364 0.236364 0.28125 0.311111 0.444444 0.464286 0.987194 0.064417 1.0
56 市原仁奈 0.000000 0.018182 0.03125 0.022222 0.555556 0.071429 0.032596 0.247083 1.0
63 櫻井桃華 0.136364 0.327273 0.34375 0.266667 0.333333 0.357143 0.456345 0.378733 1.0
⽬的変数
takemikamiʼs note ‒ http://takemikami.com/
学習、回帰係数
• 学習を⾏い、回帰係数を確認します
Copyright (C) Takeshi Mikami. All rights reserved. 36
学習を⾏い、回帰係数を確認するイメージを⽰します
features coef coef_abs
1 height -1.798227 1.798227
0 age -1.511122 1.511122
5 hip -1.361567 1.361567
2 weight -1.319067 1.319067
3 bust -1.196319 1.196319
4 waist -0.226767 0.226767
6 birthtemp 0.033735 0.033735
7 population 0.016875 0.016875
回帰係数の絶対値降順でソート
⾝⻑、年齢が⼩さいほど
U149のメンバーへの所属確率が⾼い
※体重、ヒップ、バストの回帰係数も⼤きいが、
⾝⻑や年齢との相関が強いので深く考えないことにする
takemikamiʼs note ‒ http://takemikami.com/
予測 MillionStarsメンバのU149所属確率
• MillionStarsのU149所属確率を予測します
Copyright (C) Takeshi Mikami. All rights reserved. 37
MillionStarsメンバのU149所属確率の予測結果を⽰します
name height age 所属確率
17 中⾕育 142.0 10.0 0.194902
15 周防桃⼦ 140.0 11.0 0.194658
18 箱崎星梨花 146.0 13.0 0.121036
38 ⼤神環 147.0 12.0 0.109569
1 ⽊下ひなた 146.0 14.0 0.096007
32 エミリー 156.0 13.0 0.076840
33 望⽉杏奈 152.0 14.0 0.066882
24 ⽮吹可奈 155.0 14.0 0.066262
13 春⽇未来 156.0 14.0 0.062132
35 ロコ 154.0 15.0 0.058718
0 永吉昴 154.0 15.0 0.056618
37 ⾺場このみ 143.0 24.0 0.056469
10 七尾百合⼦ 154.0 15.0 0.053832
※⾝⻑<149 を⾚字で⽰す
⾺場このみU149所属確率
39⼈中12位
※正例の少ない不均衡データで学習した
モデルなので所属確率は低めに出ています
1. 中⾕育
2. 周防桃⼦
3. 箱崎星梨花
4. ⼤神環
5. ⽊下ひなた
takemikamiʼs note ‒ http://takemikami.com/
im@sparqlのデータのみで学習した場合の問題点
• ⽤意した説明変数(特徴量)との回帰係数しかわからない
(⽤意できる説明変数の次元には限りがある)
→予想外の発⾒=セレンディピティーが欲しい!
Copyright (C) Takeshi Mikami. All rights reserved. 38
im@sparqlのデータのみで学習した場合の問題点を⽰します
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
アイドルマスター シンデレラガールズ
6th LIVE TOUR
セレンディピティー パレード
takemikamiʼs note ‒ http://takemikami.com/
アイドル「⼩⽇向美穂」の紹介、再び
Copyright (C) Takeshi Mikami. All rights reserved. 39
takemikamiʼs note ‒ http://takemikami.com/
⼩⽇向美穂と⾔えば
Copyright (C) Takeshi Mikami. All rights reserved. 40
⼩⽇向美穂といえば⾃然⾔語処理アイドルです
⾃然⾔語処理アイドル
⼩⽇向美穂と⾔えば
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
takemikamiʼs note ‒ http://takemikami.com/Copyright (C) Takeshi Mikami. All rights reserved. 41
ですよね
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
takemikamiʼs note ‒ http://takemikami.com/
⼩⽇向美穂のプロフィール
Copyright (C) Takeshi Mikami. All rights reserved. 42
⼩⽇向美穂と⾔えば「熊本県」出⾝
名前 ⼩⽇向美穂
タイプ キュート
⾝⻑ 155cm
体重 42kg
⾎液型 O
年齢 17歳
誕⽣⽇ 12⽉16⽇
利き⼿ 左
スリーサイズ 82/59/86
星座 射⼿座
出⾝地 熊本
趣味 ひなたぼっこ
CV 津⽥美波
熊本県
takemikamiʼs note ‒ http://takemikami.com/
熊本県で有名なもの
Copyright (C) Takeshi Mikami. All rights reserved. 43
熊本県で有名なものと⾔えば、阿蘇⼭、⾟⼦蓮根、神崎蘭⼦ etc
阿蘇⼭ ⾟⼦蓮根 神崎蘭⼦
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
闇に飲まれよ!
※お疲れ様です
takemikamiʼs note ‒ http://takemikami.com/
⾃然⾔語(熊本弁&標準語)に詳しい美穂
Copyright (C) Takeshi Mikami. All rights reserved. 44
2種類の⾃然⾔語を使いこなす⼩⽇向美穂
熊本弁 標準語
熊本弁&標準語
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
神崎蘭⼦ ⼩⽇向美穂 渋⾕凛
takemikamiʼs note ‒ http://takemikami.com/
⼩⽇向美穂の⾃然⾔語処理
Copyright (C) Takeshi Mikami. All rights reserved. 45
⼩⽇向美穂の⾃然⾔語処理を紹介します
•⾃然⾔語処理で「何つながりなのかな?」を探る
•アイドルを説明する⽂書からアイドルの特徴語を抽出
•選んだアイドルとそれ以外のグループで、
特徴語にどのような違いがあるのかを探す
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
takemikamiʼs note ‒ http://takemikami.com/
⾃然⾔語処理を⽤いた特徴の表現⽅法
Copyright (C) Takeshi Mikami. All rights reserved. 46
takemikamiʼs note ‒ http://takemikami.com/
TF-IDF重み付け とは
• テキスト中の単語の重要度を⽰す指標
• 以下の2指標の組み合わせ
• TF: テキストにおける単語の出現頻度
• IDF:単語がどのくらいのテキストに出現しているかの度合
Copyright (C) Takeshi Mikami. All rights reserved. 47
TF-IDF重み付けについて説明します
単語1 単語2 単語3 … 単語P
⽂書1 0.134322 0.00000 0.022387 … 0.000000
⽂書2 0.120288 0.00000 0.020048 … 0.210365
… … … … … …
⽂書N-1 0.086727 0.00000 0.138762 … 0.000000
⽂書N 0.117204 0.29516 0.023441 … 0.000000
TF-IDF⾏列の
イメージ
※TF=Term Frequency、IDF=Inverted Document Frequency
特徴語を探すための指標
takemikamiʼs note ‒ http://takemikami.com/
TF(Term Frequency)とは
• テキストにおける単語の出現頻度
Copyright (C) Takeshi Mikami. All rights reserved. 48
TF(Term Frequency)について説明します
テキスト
⽂書1
⽂書2
… …
⽂書i
… …
⽂書N
単語1 単語2 … 単語j … 単語P
⽂書1 … …
⽂書2 … …
… … … … … … …
⽂書i … …
… … … … … … …
⽂書N … …
単語の
出現回数を
数える
⽂書 TF
TFij<latexit sha1_base64="+wYmJFlLk+H+OgcrQbpAgz8Dtvk=">AAACcXichVHLSgMxFD0d3/XRqhvFTWlRBEFSERRXoiAuffQFrZaZMdbodGaYSYt16A/4AwquKoiIn+HGH3DRTxCXFdy48HY6ICrqDUlOTu65OUk02xCuZKwZUrq6e3r7+gfCg0PDI5Ho6FjGtSqOztO6ZVhOTlNdbgiTp6WQBs/ZDlfLmsGz2sl6ez9b5Y4rLDMlazbfK6slUxwKXZVE7RckP5VeaqNe9MRxvRhNsHnmR+wnSAYggSC2rOgtCjiABR0VlMFhQhI2oMKllkcSDDZxe/CIcwgJf5+jjjBpK5TFKUMl9oTGEq3yAWvSul3T9dU6nWJQd0gZwzR7YnesxR7ZPXtm77/W8vwabS81mrWOltvFyPnE7tu/qjLNEkefqj89Sxxi2fcqyLvtM+1b6B199eyitbuyM+3NsGv2Qv4brMke6AZm9VW/2eY7VwjTByS/P/dPkFmYTxLeXkysrgVf0Y8pxDFL772EVWxiC2k618ElGrgOtZRJJabEO6lKKNCM40socx/NJo/f</latexit><latexit sha1_base64="+wYmJFlLk+H+OgcrQbpAgz8Dtvk=">AAACcXichVHLSgMxFD0d3/XRqhvFTWlRBEFSERRXoiAuffQFrZaZMdbodGaYSYt16A/4AwquKoiIn+HGH3DRTxCXFdy48HY6ICrqDUlOTu65OUk02xCuZKwZUrq6e3r7+gfCg0PDI5Ho6FjGtSqOztO6ZVhOTlNdbgiTp6WQBs/ZDlfLmsGz2sl6ez9b5Y4rLDMlazbfK6slUxwKXZVE7RckP5VeaqNe9MRxvRhNsHnmR+wnSAYggSC2rOgtCjiABR0VlMFhQhI2oMKllkcSDDZxe/CIcwgJf5+jjjBpK5TFKUMl9oTGEq3yAWvSul3T9dU6nWJQd0gZwzR7YnesxR7ZPXtm77/W8vwabS81mrWOltvFyPnE7tu/qjLNEkefqj89Sxxi2fcqyLvtM+1b6B199eyitbuyM+3NsGv2Qv4brMke6AZm9VW/2eY7VwjTByS/P/dPkFmYTxLeXkysrgVf0Y8pxDFL772EVWxiC2k618ElGrgOtZRJJabEO6lKKNCM40socx/NJo/f</latexit><latexit sha1_base64="+wYmJFlLk+H+OgcrQbpAgz8Dtvk=">AAACcXichVHLSgMxFD0d3/XRqhvFTWlRBEFSERRXoiAuffQFrZaZMdbodGaYSYt16A/4AwquKoiIn+HGH3DRTxCXFdy48HY6ICrqDUlOTu65OUk02xCuZKwZUrq6e3r7+gfCg0PDI5Ho6FjGtSqOztO6ZVhOTlNdbgiTp6WQBs/ZDlfLmsGz2sl6ez9b5Y4rLDMlazbfK6slUxwKXZVE7RckP5VeaqNe9MRxvRhNsHnmR+wnSAYggSC2rOgtCjiABR0VlMFhQhI2oMKllkcSDDZxe/CIcwgJf5+jjjBpK5TFKUMl9oTGEq3yAWvSul3T9dU6nWJQd0gZwzR7YnesxR7ZPXtm77/W8vwabS81mrWOltvFyPnE7tu/qjLNEkefqj89Sxxi2fcqyLvtM+1b6B199eyitbuyM+3NsGv2Qv4brMke6AZm9VW/2eY7VwjTByS/P/dPkFmYTxLeXkysrgVf0Y8pxDFL772EVWxiC2k618ElGrgOtZRJJabEO6lKKNCM40socx/NJo/f</latexit><latexit sha1_base64="+wYmJFlLk+H+OgcrQbpAgz8Dtvk=">AAACcXichVHLSgMxFD0d3/XRqhvFTWlRBEFSERRXoiAuffQFrZaZMdbodGaYSYt16A/4AwquKoiIn+HGH3DRTxCXFdy48HY6ICrqDUlOTu65OUk02xCuZKwZUrq6e3r7+gfCg0PDI5Ho6FjGtSqOztO6ZVhOTlNdbgiTp6WQBs/ZDlfLmsGz2sl6ez9b5Y4rLDMlazbfK6slUxwKXZVE7RckP5VeaqNe9MRxvRhNsHnmR+wnSAYggSC2rOgtCjiABR0VlMFhQhI2oMKllkcSDDZxe/CIcwgJf5+jjjBpK5TFKUMl9oTGEq3yAWvSul3T9dU6nWJQd0gZwzR7YnesxR7ZPXtm77/W8vwabS81mrWOltvFyPnE7tu/qjLNEkefqj89Sxxi2fcqyLvtM+1b6B199eyitbuyM+3NsGv2Qv4brMke6AZm9VW/2eY7VwjTByS/P/dPkFmYTxLeXkysrgVf0Y8pxDFL772EVWxiC2k618ElGrgOtZRJJabEO6lKKNCM40socx/NJo/f</latexit>
: ⽂書iにおける単語jの出現回数
takemikamiʼs note ‒ http://takemikami.com/
IDF(Inverted Document Frequency)とは
• 語句がどのくらいのテキストに出現しているかの度合
Copyright (C) Takeshi Mikami. All rights reserved. 49
IDF(Inverted Document Frequency)について説明します
単語の
出現回数を
数える
⽂書 TF
単語が出現した⽂書数を数える
テキスト
⽂書1
⽂書2
… …
⽂書i
… …
⽂書N
単語1 単語2 … 単語j … 単語P
⽂書1 … …
⽂書2 … …
… … … … … … …
⽂書i … …
… … … … … … …
⽂書N … …
単語1 単語2 … 単語j … 単語P
IDF … …
IDFj = log
N
dfj<latexit sha1_base64="iWqdNVjl8ZhGPjeSFS/YKCKXi7Q=">AAACiHichVFNS+tAFD3G7/pV39sIboJFcSW38qBP4YH4HqIb8asqWClJnNbYNAnJtOgL/QH6B1y4UhARF2517cY/4MKfIC4V3LjwJg2IinqHmTlz5p47Z2Z01zJ9SXTboDQ2Nbe0trUnOjq7unuSvT+WfafiGSJrOJbjreqaLyzTFllpSkusup7QyrolVvTS33B/pSo833TsJbnjivWyVrTNgmlokql8MpWTYlsGM/+mavkt9Y+as5yimit4mhHM1oKNQn6rluAsGqEo1I8gHYMU4phzkifIYQMODFRQhoANydiCBp/bGtIguMytI2DOY2RG+wI1JFhb4SzBGRqzJR6LvFqLWZvXYU0/Uht8isXdY6WKQbqhU3qgazqjO3r+tFYQ1Qi97PCs17XCzffs9S0+fasq8yyx+ar60rNEAb8jryZ7dyMmvIVR11f/7z8sji8MBkN0RPfs/5Bu6YpvYFcfjeN5sXCA8APS75/7I1geHUkznv+VmpiMv6IN/RjAML93BhOYxhyyfO4uznGBSyWhkJJRxuqpSkOs+Yk3oUy+AMVNlsk=</latexit><latexit sha1_base64="iWqdNVjl8ZhGPjeSFS/YKCKXi7Q=">AAACiHichVFNS+tAFD3G7/pV39sIboJFcSW38qBP4YH4HqIb8asqWClJnNbYNAnJtOgL/QH6B1y4UhARF2517cY/4MKfIC4V3LjwJg2IinqHmTlz5p47Z2Z01zJ9SXTboDQ2Nbe0trUnOjq7unuSvT+WfafiGSJrOJbjreqaLyzTFllpSkusup7QyrolVvTS33B/pSo833TsJbnjivWyVrTNgmlokql8MpWTYlsGM/+mavkt9Y+as5yimit4mhHM1oKNQn6rluAsGqEo1I8gHYMU4phzkifIYQMODFRQhoANydiCBp/bGtIguMytI2DOY2RG+wI1JFhb4SzBGRqzJR6LvFqLWZvXYU0/Uht8isXdY6WKQbqhU3qgazqjO3r+tFYQ1Qi97PCs17XCzffs9S0+fasq8yyx+ar60rNEAb8jryZ7dyMmvIVR11f/7z8sji8MBkN0RPfs/5Bu6YpvYFcfjeN5sXCA8APS75/7I1geHUkznv+VmpiMv6IN/RjAML93BhOYxhyyfO4uznGBSyWhkJJRxuqpSkOs+Yk3oUy+AMVNlsk=</latexit><latexit sha1_base64="iWqdNVjl8ZhGPjeSFS/YKCKXi7Q=">AAACiHichVFNS+tAFD3G7/pV39sIboJFcSW38qBP4YH4HqIb8asqWClJnNbYNAnJtOgL/QH6B1y4UhARF2517cY/4MKfIC4V3LjwJg2IinqHmTlz5p47Z2Z01zJ9SXTboDQ2Nbe0trUnOjq7unuSvT+WfafiGSJrOJbjreqaLyzTFllpSkusup7QyrolVvTS33B/pSo833TsJbnjivWyVrTNgmlokql8MpWTYlsGM/+mavkt9Y+as5yimit4mhHM1oKNQn6rluAsGqEo1I8gHYMU4phzkifIYQMODFRQhoANydiCBp/bGtIguMytI2DOY2RG+wI1JFhb4SzBGRqzJR6LvFqLWZvXYU0/Uht8isXdY6WKQbqhU3qgazqjO3r+tFYQ1Qi97PCs17XCzffs9S0+fasq8yyx+ar60rNEAb8jryZ7dyMmvIVR11f/7z8sji8MBkN0RPfs/5Bu6YpvYFcfjeN5sXCA8APS75/7I1geHUkznv+VmpiMv6IN/RjAML93BhOYxhyyfO4uznGBSyWhkJJRxuqpSkOs+Yk3oUy+AMVNlsk=</latexit><latexit sha1_base64="iWqdNVjl8ZhGPjeSFS/YKCKXi7Q=">AAACiHichVFNS+tAFD3G7/pV39sIboJFcSW38qBP4YH4HqIb8asqWClJnNbYNAnJtOgL/QH6B1y4UhARF2517cY/4MKfIC4V3LjwJg2IinqHmTlz5p47Z2Z01zJ9SXTboDQ2Nbe0trUnOjq7unuSvT+WfafiGSJrOJbjreqaLyzTFllpSkusup7QyrolVvTS33B/pSo833TsJbnjivWyVrTNgmlokql8MpWTYlsGM/+mavkt9Y+as5yimit4mhHM1oKNQn6rluAsGqEo1I8gHYMU4phzkifIYQMODFRQhoANydiCBp/bGtIguMytI2DOY2RG+wI1JFhb4SzBGRqzJR6LvFqLWZvXYU0/Uht8isXdY6WKQbqhU3qgazqjO3r+tFYQ1Qi97PCs17XCzffs9S0+fasq8yyx+ar60rNEAb8jryZ7dyMmvIVR11f/7z8sji8MBkN0RPfs/5Bu6YpvYFcfjeN5sXCA8APS75/7I1geHUkznv+VmpiMv6IN/RjAML93BhOYxhyyfO4uznGBSyWhkJJRxuqpSkOs+Yk3oUy+AMVNlsk=</latexit>
dfj<latexit sha1_base64="GfSSjaei2tjDcNfLlBpw7DBKZ5I=">AAACaHichVG7SgNBFD1ZXzE+ErVQsQkJESuZiKBYiTaWeRgTiCHsbiZxzGZ32d0ENPgDNpYqVgoi4mfY+AMWfoJaRrCx8O5mQTSod5iZM2fuuXNmRjE1YTuMPQWkvv6BwaHgcGhkdGw8HJmY3LGNpqXynGpohlVQZJtrQuc5RzgaL5gWlxuKxvNKfdPdz7e4ZQtD33YOTF5qyDVdVIUqO0TlKtXyfqgcibNF5kW0FyR9EIcfKSNyg11UYEBFEw1w6HAIa5BhUysiCQaTuBLaxFmEhLfPcYQQaZuUxSlDJrZOY41WRZ/Vae3WtD21Sqdo1C1SRpFgj+yWddgDu2PP7OPXWm2vhuvlgGalq+VmOXw8k33/V9Wg2cHel+pPzw6qWPW8CvJueox7C7Wrbx2edrJrmUR7nl2xV/J/yZ7YPd1Ab72p12meuYD7Acmfz90LdpYWk4TTy/H1Df8rgphDDAv03itYxxZSyNG5Aic4w3ngRYpI09JsN1UK+JopfAsp9gnZ8YtF</latexit><latexit sha1_base64="GfSSjaei2tjDcNfLlBpw7DBKZ5I=">AAACaHichVG7SgNBFD1ZXzE+ErVQsQkJESuZiKBYiTaWeRgTiCHsbiZxzGZ32d0ENPgDNpYqVgoi4mfY+AMWfoJaRrCx8O5mQTSod5iZM2fuuXNmRjE1YTuMPQWkvv6BwaHgcGhkdGw8HJmY3LGNpqXynGpohlVQZJtrQuc5RzgaL5gWlxuKxvNKfdPdz7e4ZQtD33YOTF5qyDVdVIUqO0TlKtXyfqgcibNF5kW0FyR9EIcfKSNyg11UYEBFEw1w6HAIa5BhUysiCQaTuBLaxFmEhLfPcYQQaZuUxSlDJrZOY41WRZ/Vae3WtD21Sqdo1C1SRpFgj+yWddgDu2PP7OPXWm2vhuvlgGalq+VmOXw8k33/V9Wg2cHel+pPzw6qWPW8CvJueox7C7Wrbx2edrJrmUR7nl2xV/J/yZ7YPd1Ab72p12meuYD7Acmfz90LdpYWk4TTy/H1Df8rgphDDAv03itYxxZSyNG5Aic4w3ngRYpI09JsN1UK+JopfAsp9gnZ8YtF</latexit><latexit sha1_base64="GfSSjaei2tjDcNfLlBpw7DBKZ5I=">AAACaHichVG7SgNBFD1ZXzE+ErVQsQkJESuZiKBYiTaWeRgTiCHsbiZxzGZ32d0ENPgDNpYqVgoi4mfY+AMWfoJaRrCx8O5mQTSod5iZM2fuuXNmRjE1YTuMPQWkvv6BwaHgcGhkdGw8HJmY3LGNpqXynGpohlVQZJtrQuc5RzgaL5gWlxuKxvNKfdPdz7e4ZQtD33YOTF5qyDVdVIUqO0TlKtXyfqgcibNF5kW0FyR9EIcfKSNyg11UYEBFEw1w6HAIa5BhUysiCQaTuBLaxFmEhLfPcYQQaZuUxSlDJrZOY41WRZ/Vae3WtD21Sqdo1C1SRpFgj+yWddgDu2PP7OPXWm2vhuvlgGalq+VmOXw8k33/V9Wg2cHel+pPzw6qWPW8CvJueox7C7Wrbx2edrJrmUR7nl2xV/J/yZ7YPd1Ab72p12meuYD7Acmfz90LdpYWk4TTy/H1Df8rgphDDAv03itYxxZSyNG5Aic4w3ngRYpI09JsN1UK+JopfAsp9gnZ8YtF</latexit><latexit sha1_base64="GfSSjaei2tjDcNfLlBpw7DBKZ5I=">AAACaHichVG7SgNBFD1ZXzE+ErVQsQkJESuZiKBYiTaWeRgTiCHsbiZxzGZ32d0ENPgDNpYqVgoi4mfY+AMWfoJaRrCx8O5mQTSod5iZM2fuuXNmRjE1YTuMPQWkvv6BwaHgcGhkdGw8HJmY3LGNpqXynGpohlVQZJtrQuc5RzgaL5gWlxuKxvNKfdPdz7e4ZQtD33YOTF5qyDVdVIUqO0TlKtXyfqgcibNF5kW0FyR9EIcfKSNyg11UYEBFEw1w6HAIa5BhUysiCQaTuBLaxFmEhLfPcYQQaZuUxSlDJrZOY41WRZ/Vae3WtD21Sqdo1C1SRpFgj+yWddgDu2PP7OPXWm2vhuvlgGalq+VmOXw8k33/V9Wg2cHel+pPzw6qWPW8CvJueox7C7Wrbx2edrJrmUR7nl2xV/J/yZ7YPd1Ab72p12meuYD7Acmfz90LdpYWk4TTy/H1Df8rgphDDAv03itYxxZSyNG5Aic4w3ngRYpI09JsN1UK+JopfAsp9gnZ8YtF</latexit>
: 単語jを含む⽂書数
takemikamiʼs note ‒ http://takemikami.com/
TF-IDFとは
• TFとIDFを組み合わせた指標
Copyright (C) Takeshi Mikami. All rights reserved. 50
TF-IDFについて説明します
TF-IDFij = TFij ⇥ IDFj<latexit sha1_base64="GVQZHdFmBnY7wt63HoVwIFry/w0=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtox5SkVpRUh7jperq41cZXZ2bVKtgqhLhBWDElmbmpxQpAqfjqrNp4AWUDPQMwUMBkGEIZygxQEJAvsJwhhiGFIZ8hmaGUIZchlSGPoQTIzmFIZCgGwmgGQwYDhgKgWCxDNVCsCMjKBMunMtQycAH1lgJVpQJVJAJFs4FkOpAXDRXNA/JBZhaDdScDbckB4iKgTgUGVYOrBisNPhucMFht8NLgD06zqsFmgNxSCaSTIHpTC+L5uySCvxPUlQukSxgyELrwurmEIY3BAuzWTKDbC8AiIF8kQ/SXVU3/HGwVpFqtZrDI4DXQ/QsNbhocBvogr+xL8tLA1KDZDFzACDBED25MRpiRniGQHWii7OAEjQoOBmkGJQYNYHibMzgweDAEMIQC7Z3IsJ3hAMNBJiEmCyZ7JkeIUiZGqB5hBhTA5AUAuSWZxg==</latexit><latexit sha1_base64="GVQZHdFmBnY7wt63HoVwIFry/w0=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtox5SkVpRUh7jperq41cZXZ2bVKtgqhLhBWDElmbmpxQpAqfjqrNp4AWUDPQMwUMBkGEIZygxQEJAvsJwhhiGFIZ8hmaGUIZchlSGPoQTIzmFIZCgGwmgGQwYDhgKgWCxDNVCsCMjKBMunMtQycAH1lgJVpQJVJAJFs4FkOpAXDRXNA/JBZhaDdScDbckB4iKgTgUGVYOrBisNPhucMFht8NLgD06zqsFmgNxSCaSTIHpTC+L5uySCvxPUlQukSxgyELrwurmEIY3BAuzWTKDbC8AiIF8kQ/SXVU3/HGwVpFqtZrDI4DXQ/QsNbhocBvogr+xL8tLA1KDZDFzACDBED25MRpiRniGQHWii7OAEjQoOBmkGJQYNYHibMzgweDAEMIQC7Z3IsJ3hAMNBJiEmCyZ7JkeIUiZGqB5hBhTA5AUAuSWZxg==</latexit><latexit sha1_base64="GVQZHdFmBnY7wt63HoVwIFry/w0=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtox5SkVpRUh7jperq41cZXZ2bVKtgqhLhBWDElmbmpxQpAqfjqrNp4AWUDPQMwUMBkGEIZygxQEJAvsJwhhiGFIZ8hmaGUIZchlSGPoQTIzmFIZCgGwmgGQwYDhgKgWCxDNVCsCMjKBMunMtQycAH1lgJVpQJVJAJFs4FkOpAXDRXNA/JBZhaDdScDbckB4iKgTgUGVYOrBisNPhucMFht8NLgD06zqsFmgNxSCaSTIHpTC+L5uySCvxPUlQukSxgyELrwurmEIY3BAuzWTKDbC8AiIF8kQ/SXVU3/HGwVpFqtZrDI4DXQ/QsNbhocBvogr+xL8tLA1KDZDFzACDBED25MRpiRniGQHWii7OAEjQoOBmkGJQYNYHibMzgweDAEMIQC7Z3IsJ3hAMNBJiEmCyZ7JkeIUiZGqB5hBhTA5AUAuSWZxg==</latexit><latexit sha1_base64="GVQZHdFmBnY7wt63HoVwIFry/w0=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtox5SkVpRUh7jperq41cZXZ2bVKtgqhLhBWDElmbmpxQpAqfjqrNp4AWUDPQMwUMBkGEIZygxQEJAvsJwhhiGFIZ8hmaGUIZchlSGPoQTIzmFIZCgGwmgGQwYDhgKgWCxDNVCsCMjKBMunMtQycAH1lgJVpQJVJAJFs4FkOpAXDRXNA/JBZhaDdScDbckB4iKgTgUGVYOrBisNPhucMFht8NLgD06zqsFmgNxSCaSTIHpTC+L5uySCvxPUlQukSxgyELrwurmEIY3BAuzWTKDbC8AiIF8kQ/SXVU3/HGwVpFqtZrDI4DXQ/QsNbhocBvogr+xL8tLA1KDZDFzACDBED25MRpiRniGQHWii7OAEjQoOBmkGJQYNYHibMzgweDAEMIQC7Z3IsJ3hAMNBJiEmCyZ7JkeIUiZGqB5hBhTA5AUAuSWZxg==</latexit>
単語1 単語2 単語3 … 単語P
⽂書1 0.134322 0.00000 0.022387 … 0.000000
⽂書2 0.120288 0.00000 0.020048 … 0.210365
… … … … … …
⽂書N-1 0.086727 0.00000 0.138762 … 0.000000
⽂書N 0.117204 0.29516 0.023441 … 0.000000
TF-IDF⾏列の
イメージ
→テキスト中の単語の重要度を⽰す
takemikamiʼs note ‒ http://takemikami.com/Copyright (C) Takeshi Mikami. All rights reserved. 51
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
放課後クライマックスガールズ
takemikamiʼs note ‒ http://takemikami.com/
TF-IDFの例: 放課後クライマックスガールズ 1/6
• アイドルを説明するテキストを⽤意
Copyright (C) Takeshi Mikami. All rights reserved. 52
「放課後クライマックスガールズ」を題材にTF-IDFを計算します
label desc
0 有栖川夏葉
裕福な家庭に⽣まれた社⻑令嬢。家名に誇りを持ち、⾃らもその肩書に恥じぬ
よう⽇々鍛錬を積んでいる。スタイルがよく、引き締まっている。⼤学2年⽣。
1 ⻄城樹⾥
ボーイッシュでクールな⼥の⼦。⾔葉遣いが乱暴なので⼈に怖がられることが
多いが、根は純情で、素直になれないタイプ。⾼校2年⽣。
2 園⽥智代⼦
クラスに⼀⼈はいるごく普通の⼥の⼦。明るく親しみやすい性格で、⽢いもの
が⼤好き。名前にちなんで、チョコ好きアイドルを売りにしている。⾼校2年⽣。
3 ⼩宮果穂
⼤⼈びた容姿と⾼い⾝⻑が特徴の⼥の⼦。何にでも興味津々で純粋な様⼦は、
まるで⼦⽝のよう。特撮モノが⼤好きでヒーローに憧れている。⼩学6年⽣。
4 杜野凛世
落ち着いた佇まいの⼤和撫⼦。常に礼儀正しく、⼀歩引いて相⼿を⽴てる性格。
少⼥漫画好きという意外な趣味を持つ。⾼校1年⽣。
takemikamiʼs note ‒ http://takemikami.com/
TF-IDFの例: 放課後クライマックスガールズ 2/6
• テキストを語句に分かち書き
Copyright (C) Takeshi Mikami. All rights reserved. 53
「放課後クライマックスガールズ」を題材にTF-IDFを計算します
label desc
0 有栖川夏葉
裕福 家庭 ⽣まれる 社⻑ 令嬢 家名 誇り 持つ ⾃ら その 肩書 恥じる ⽇々 鍛錬
積む スタイル よい 引き締まる ⼤学
1 ⻄城樹⾥
ボーイッシュ クール ⼥の⼦ ⾔葉 乱暴 ⼈ 怖がる 多い 根 純情 素直 なれる タイ
プ ⾼校
2 園⽥智代⼦
クラス ごく 普通 ⼥の⼦ 明るい 親しむ 性格 ⽢い ⼤好き 名前 ちなむ チョコ 売
る ⾼校
3 ⼩宮果穂
⼤⼈びる 容姿 ⾼い ⾝⻑ 特徴 ⼥の⼦ 何 興味津々 純粋 様⼦ まるで ⼦⽝ 特撮
モノ ⼤好き ヒーロー 憧れる ⼩学
4 杜野凛世
落ち着く 佇まい ⼤和撫⼦ 常に 礼儀 正しい 引く 相⼿ ⽴てる 性格 少⼥ 漫画 意
外 趣味 持つ ⾼校
takemikamiʼs note ‒ http://takemikami.com/
TF-IDFの例: 放課後クライマックスガールズ 3/6
• TFを計算
Copyright (C) Takeshi Mikami. All rights reserved. 54
「放課後クライマックスガールズ」を題材にTF-IDFを計算します
label
クライマッ
クスガール
ズ
⼤和撫⼦ ⾝⻑ チョコ 鍛錬
ボーイッ
シュ
0 有栖川夏葉 6 0 1 0 2 0
1 ⻄城樹⾥ 6 0 1 0 0 5
2 園⽥智代⼦ 5 0 4 8 0 0
3 ⼩宮果穂 5 0 8 0 0 0
4 杜野凛世 5 6 1 0 0 0
※公式の紹介⽂にピクシブ百科事典の内容を追加し、集計しています
takemikamiʼs note ‒ http://takemikami.com/
TF-IDFの例: 放課後クライマックスガールズ 4/6
• TF-IDFを計算
Copyright (C) Takeshi Mikami. All rights reserved. 55
「放課後クライマックスガールズ」を題材にTF-IDFを計算します
label
クライマッ
クスガール
ズ
⼤和撫⼦ ⾝⻑ チョコ 鍛錬
ボーイッ
シュ
0 有栖川夏葉 0.134322 0.00000 0.022387 0.000000 0.093963 0.000000
1 ⻄城樹⾥ 0.120288 0.00000 0.020048 0.000000 0.000000 0.210365
2 園⽥智代⼦ 0.090495 0.00000 0.072396 0.303863 0.000000 0.000000
3 ⼩宮果穂 0.086727 0.00000 0.138762 0.000000 0.000000 0.000000
4 杜野凛世 0.117204 0.29516 0.023441 0.000000 0.000000 0.000000
TFでは、クライマックスガールズ > ボーイッシュ
TF-IDFでは、クライマックスガールズ < ボーイッシュ
→出現する⽂書が少ない語句が重視される
takemikamiʼs note ‒ http://takemikami.com/
TF-IDFの例: 放課後クライマックスガールズ 5/6
Copyright (C) Takeshi Mikami. All rights reserved. 56
「放課後クライマックスガールズ」を題材にTF-IDFを計算します
TFの
ワードクラウド
takemikamiʼs note ‒ http://takemikami.com/
TF-IDFの例: 放課後クライマックスガールズ 6/6
Copyright (C) Takeshi Mikami. All rights reserved. 57
「放課後クライマックスガールズ」を題材にTF-IDFを計算します
TF-IDFの
ワードクラウド
takemikamiʼs note ‒ http://takemikami.com/
TF-IDF重み付けを特徴量とした場合の問題点
•出現単語の次元を持つので⾼次元になる
•同じ単語が出現しなければ共通の特徴を抽出できない
(似た単語を考慮できない)
Copyright (C) Takeshi Mikami. All rights reserved. 58
TF-IDF重み付けを特徴量とした場合の問題点を⽰します
x1 x2 x3 … xp y
#1 1 3 1 … 2 2
#2 2 5 4 … 4 1
… … … … … … …
#n-1 4 8 4 … 8 3
#n 5 11 2 … 10 5
説明変数 ⽬的変数
観測事象
TF-IDF ?
takemikamiʼs note ‒ http://takemikami.com/
単語の分散表現
• 「単語の意味」をベクトルで表現したもの
• 単語同⼠の数値的な⽐較、加減算が可能になる
Copyright (C) Takeshi Mikami. All rights reserved. 59
単語の分散表現について説明します
次元x 次元y
単語a
単語b
単語c
単語d
単語b
単語c
単語d
単語a
単語の分散表現
次元X
次元Y
takemikamiʼs note ‒ http://takemikami.com/
単語の分散表現
• 単語同⼠の数値的な⽐較、加減算の例
Copyright (C) Takeshi Mikami. All rights reserved. 60
単語の分散表現について説明します
単語b
単語c
単語d
単語a
次元X
次元Y
Queen
King
次元X
次元Y
単語間の類似度計算 単語間の加減算
Woman
Man
Man
Woman
King-Man
Queen-Woman
類似度
単語c-a > 単語c-d
takemikamiʼs note ‒ http://takemikami.com/
1-of-N と bag-of-words表現
Copyright (C) Takeshi Mikami. All rights reserved. 61
1-of-N と bag-of-words表現について説明します
bag-of-wordは
TF(Term Frequency)と等価
label 1 2 3 4 5 6
クライマック
スガールズ
1 0 0 0 0 0
⼤和撫⼦ 0 1 0 0 0 0
⾝⻑ 0 0 1 0 0 0
チョコ 0 0 0 1 0 0
鍛錬 0 0 0 0 1 0
ボーイッシュ 0 0 0 0 0 1
label 1 2 3 4 5 6
杜野凛世 5 6 1 0 0 0
bag-of-words表現
1-of-N表現
単語をベクトルで表現する
シンプルな⽅法
⽂書をベクトルで表現
takemikamiʼs note ‒ http://takemikami.com/
スライド窓による単語列の分割
Copyright (C) Takeshi Mikami. All rights reserved. 62
スライド窓による単語列の分割について説明します
落ち着く 佇まい ⼤和撫⼦ 常に 礼儀 正しい 引く 相⼿ ⽴てる 性格 少⼥ 漫画 意外 趣味 持つ ⾼校
…
落ち着く 佇まい ⼤和撫⼦ 常に 礼儀
佇まい ⼤和撫⼦ 常に 礼儀 正しい
⼤和撫⼦ 常に 礼儀 正しい 引く
…
⽴てる 性格 少⼥ 漫画 意外
性格 少⼥ 漫画 意外 趣味
少⼥ 漫画 意外 趣味 持つ
漫画 意外 趣味 持つ ⾼校
⼀定単語数毎に
区切った
まとまりを作る
takemikamiʼs note ‒ http://takemikami.com/
skip-gram表現
• ある単語から前後の単語の組み合わせを予測することを考える
Copyright (C) Takeshi Mikami. All rights reserved. 63
skip-gram表現の考え⽅を説明します
n-2 n-1 n n+1 n+2
落ち着く 佇まい ⼤和撫⼦ 常に 礼儀
佇まい ⼤和撫⼦ 常に 礼儀 正しい
⼤和撫⼦ 常に 礼儀 正しい 引く
…
⽴てる 性格 少⼥ 漫画 意外
性格 少⼥ 漫画 意外 趣味
少⼥ 漫画 意外 趣味 持つ
漫画 意外 趣味 持つ ⾼校
takemikamiʼs note ‒ http://takemikami.com/
skip-gram表現
• 前後の単語の組み合わせを予測するニューラルネットを構成する
Copyright (C) Takeshi Mikami. All rights reserved. 64
skip-gram表現の考え⽅を説明します
…………
…
…
…
…
単語n
1-of-N
単語n-2
1-of-N
単語n-1
1-of-N
単語n+1
1-of-N
単語n+2
1-of-N
分散表現
takemikamiʼs note ‒ http://takemikami.com/
skip-gram表現
• skip-gramのニューラルネットを
ベクトル・⾏列で表現すると
Copyright (C) Takeshi Mikami. All rights reserved. 65
skip-gram表現の考え⽅を説明します
0 1 0 0 0 0
0 0 0 1 0 0
× →
× →
1 0 0 0 0 0× →
0 0 0 0 1 0× →
0 0 1 0 0 0× →
単語n
1-of-N
単語n-2
単語n-1
単語n+1
単語n+2
重み
重み
重み
重み
重み分散表現
takemikamiʼs note ‒ http://takemikami.com/
分散表現によるTF-IDFの次元削減
• 単語の分散表現との積をとることで、TF-IDFの次元削減が出来る
Copyright (C) Takeshi Mikami. All rights reserved. 66
単語の分散表現によるTF-IDFの次元削減イメージを⽰します
次元1 次元2
単語1 0.022 0.138
単語2 0.020 0.023
… … …
単語p 0.295 0.023
単語1 単語2 … 単語p
⽂書1 0.134 0.000 … 0.000
⽂書2 0.120 0.000 … 0.210
… … … … …
⽂書N-1 0.086 0.000 … 0.000
⽂書N 0.117 0.295 … 0.000
次元1 次元2
⽂書1 0.086 0.210
⽂書2 0.117 0.295
… … …
⽂書N-1 0.022 0.134
⽂書N 0.020 0.120
=×
単語の分散表現TF-IDF 特徴⾏列
※表中の数値はイメージを⽰すために⼊れているもの、意味はありません
takemikamiʼs note ‒ http://takemikami.com/
分散表現による回帰係数の説明
• 回帰係数を分散表現の空間に配置、類似単語から説明
Copyright (C) Takeshi Mikami. All rights reserved. 67
分散表現による回帰係数の説明イメージを⽰します
次元0 次元1 次元2 … 次元p
1 𝑥% 𝑥. 𝑥&
回帰係数
重み0 𝑤+
重み1 𝑤%
重み2 𝑤.
…
重みp 𝑤&
× = 𝑣
所属確率
𝑦
𝜎
特徴ベクトル
単語b
単語c
単語d
単語a
次元1
次元2
回帰係数ベクトル
回帰係数ベクトルを分散表現の空間に配置
類似単語から、回帰係数ベクトルを説明
takemikamiʼs note ‒ http://takemikami.com/
七尾百合⼦と誰かの「何つながりなのかな?」を探る
• プロセス
• 七尾百合⼦とミリオンライブに登場するアイドル誰か⼀⼈の組み合わせを作る
• 組み合わせと、それ以外のアイドルを分類するモデルの回帰係数を求める
• 回帰係数ベクトルに類似する単語を上位20位までをWordCloudで⽰す
• 対象データ
• 「ニコニコ⼤百科」
• ミリシタのアイドルの台詞テキスト
• 分散表現のモデル
• 学習対象テキスト:Wikipediaの⽂章
• 単語数: 約5万語
• 次元数: 300次元
Copyright (C) Takeshi Mikami. All rights reserved. 68
七尾百合⼦と誰かの「何つながりなのかな?」を探る⽅法を⽰します
Pre-trained word vectors https://github.com/Kyubyong/wordvectors
takemikamiʼs note ‒ http://takemikami.com/Copyright (C) Takeshi Mikami. All rights reserved. 69
七尾百合⼦
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
takemikamiʼs note ‒ http://takemikami.com/Copyright (C) Takeshi Mikami. All rights reserved. 70
七尾百合⼦
※Webサイト・ゲームソフトの
キャプチャ画像は公開を省略しています
takemikamiʼs note ‒ http://takemikami.com/
何つながりなのかな? 1/9
Copyright (C) Takeshi Mikami. All rights reserved. 71
天海春⾹, 如⽉千早, 星井美希, 萩原雪歩, ⾼槻やよい, 菊地真 x七尾百合⼦
takemikamiʼs note ‒ http://takemikami.com/
何つながりなのかな? 2/9
Copyright (C) Takeshi Mikami. All rights reserved. 72
⽔瀬伊織, 四条貴⾳, 秋⽉律⼦, 三浦あずさ, 双海亜美, 双海真美 x七尾百合⼦
takemikamiʼs note ‒ http://takemikami.com/
何つながりなのかな? 3/9
Copyright (C) Takeshi Mikami. All rights reserved. 73
我那覇響, 春⽇未来, 最上静⾹, 伊吹翼, ⽥中琴葉, 島原エレナ x七尾百合⼦
takemikamiʼs note ‒ http://takemikami.com/
何つながりなのかな? 4/9
Copyright (C) Takeshi Mikami. All rights reserved. 74
佐⽵美奈⼦, 所恵美, 徳川まつり, 箱崎星梨花, 野々原茜, 望⽉杏奈 x七尾百合⼦
takemikamiʼs note ‒ http://takemikami.com/
何つながりなのかな? 5/9
Copyright (C) Takeshi Mikami. All rights reserved. 75
ロコ, 七尾百合⼦, ⾼⼭紗代⼦, 松⽥亜利沙, ⾼坂海美, 中⾕育x七尾百合⼦
takemikamiʼs note ‒ http://takemikami.com/
何つながりなのかな? 6/9
Copyright (C) Takeshi Mikami. All rights reserved. 76
天空橋朋花, エミリー, 北沢志保, 舞浜歩, ⽊下ひなた, ⽮吹可奈 x七尾百合⼦
takemikamiʼs note ‒ http://takemikami.com/
何つながりなのかな? 7/9
Copyright (C) Takeshi Mikami. All rights reserved. 77
横⼭奈緒, ⼆階堂千鶴, ⾺場このみ, ⼤神環, 豊川⾵花, 宮尾美也 x七尾百合⼦
takemikamiʼs note ‒ http://takemikami.com/
何つながりなのかな? 8/9
Copyright (C) Takeshi Mikami. All rights reserved. 78
福⽥のり⼦, 真壁瑞希, 篠宮可憐, 百瀬莉緒, 永吉昴, 北上麗花 x七尾百合⼦
takemikamiʼs note ‒ http://takemikami.com/
何つながりなのかな? 9/9
Copyright (C) Takeshi Mikami. All rights reserved. 79
周防桃⼦, ジュリア, ⽩⽯紬, 桜守歌織 x七尾百合⼦
takemikamiʼs note ‒ http://takemikami.com/
まとめ
Copyright (C) Takeshi Mikami. All rights reserved. 80
takemikamiʼs note ‒ http://takemikami.com/
まとめ
•⼩⽇向美穂は
データサイエンス&⾃然⾔語処理アイドル
•セレンディピティーは楽しい!
•⼥の⼦はいつだって放課後がクライマックス!
•アイドル同⼠がどんなテーマで話をしてそうかを、
機械学習で(ある程度)探ることが出来る
Copyright (C) Takeshi Mikami. All rights reserved. 81
本セッションのまとめです
takemikamiʼs note ‒ http://takemikami.com/
参考⽂献・Webサイトリスト
• 参考⽂献
• ⾦明哲「テキストアナリティクス」共⽴出版 2018
• ⼩⾼知宏「⾃然⾔語処理と深層学習」オーム社 2017
• 参考Webサイト
• Hadley Wickham「Tidy Data」2014
https://www.jstatsoft.org/article/view/v059i10
• 三上威「『何つながりなのかな?』を探る⾃然⾔語処理 〜765PRO LIVE
THEATERに通りがかる⼩⽇向美穂〜」2019
https://takemikami.com/2019/02/21/765PRO-LIVE-THEATER.html
Copyright (C) Takeshi Mikami. All rights reserved. 82
本資料作成にあたって参考にした⽂献・Webサイトのリストです
takemikamiʼs note ‒ http://takemikami.com/Copyright (C) Takeshi Mikami. All rights reserved. 83
(よし、楽しく話せたな)

Weitere ähnliche Inhalte

Mehr von Takeshi Mikami

GitHubの機能を活用したGitHub Flowによる開発の進め方
GitHubの機能を活用したGitHub Flowによる開発の進め方GitHubの機能を活用したGitHub Flowによる開発の進め方
GitHubの機能を活用したGitHub Flowによる開発の進め方Takeshi Mikami
 
HBase CompleteBulkLoadその仕組み&発生した問題
HBase CompleteBulkLoadその仕組み&発生した問題HBase CompleteBulkLoadその仕組み&発生した問題
HBase CompleteBulkLoadその仕組み&発生した問題Takeshi Mikami
 
アーリース情報技術株式会社 会社案内 (2019/02/13)
アーリース情報技術株式会社 会社案内 (2019/02/13)アーリース情報技術株式会社 会社案内 (2019/02/13)
アーリース情報技術株式会社 会社案内 (2019/02/13)Takeshi Mikami
 
Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方
Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方
Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方Takeshi Mikami
 
センサーによるデータ計測と異常検知の基本
センサーによるデータ計測と異常検知の基本センサーによるデータ計測と異常検知の基本
センサーによるデータ計測と異常検知の基本Takeshi Mikami
 
Webサイトのアクセスログによるユーザー属性推定
Webサイトのアクセスログによるユーザー属性推定Webサイトのアクセスログによるユーザー属性推定
Webサイトのアクセスログによるユーザー属性推定Takeshi Mikami
 
Google Cloud Dataflowによる データ変換処理入門
Google Cloud Dataflowによる データ変換処理入門Google Cloud Dataflowによる データ変換処理入門
Google Cloud Dataflowによる データ変換処理入門Takeshi Mikami
 
IoTでの機械学習活用イメージと強化学習のご紹介
IoTでの機械学習活用イメージと強化学習のご紹介IoTでの機械学習活用イメージと強化学習のご紹介
IoTでの機械学習活用イメージと強化学習のご紹介Takeshi Mikami
 
協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介
協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介
協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介Takeshi Mikami
 
SparkMLlibで始めるビッグデータを対象とした機械学習入門
SparkMLlibで始めるビッグデータを対象とした機械学習入門SparkMLlibで始めるビッグデータを対象とした機械学習入門
SparkMLlibで始めるビッグデータを対象とした機械学習入門Takeshi Mikami
 
Ims@sparqlではじめるr markdownとgitbookによるレポート生成
Ims@sparqlではじめるr markdownとgitbookによるレポート生成Ims@sparqlではじめるr markdownとgitbookによるレポート生成
Ims@sparqlではじめるr markdownとgitbookによるレポート生成Takeshi Mikami
 
レコメンドアルゴリズムの基本と周辺知識と実装方法
レコメンドアルゴリズムの基本と周辺知識と実装方法レコメンドアルゴリズムの基本と周辺知識と実装方法
レコメンドアルゴリズムの基本と周辺知識と実装方法Takeshi Mikami
 
担当アイドルに反応してLチカさせる予測モデル開発
担当アイドルに反応してLチカさせる予測モデル開発担当アイドルに反応してLチカさせる予測モデル開発
担当アイドルに反応してLチカさせる予測モデル開発Takeshi Mikami
 
Apache Airflow入門 (マーケティングデータ分析基盤技術勉強会)
Apache Airflow入門  (マーケティングデータ分析基盤技術勉強会)Apache Airflow入門  (マーケティングデータ分析基盤技術勉強会)
Apache Airflow入門 (マーケティングデータ分析基盤技術勉強会)Takeshi Mikami
 
Apache Hbase バルクロードの使い方
Apache Hbase バルクロードの使い方Apache Hbase バルクロードの使い方
Apache Hbase バルクロードの使い方Takeshi Mikami
 
Apache Hadoop & Hive 入門 (マーケティングデータ分析基盤技術勉強会)
Apache Hadoop & Hive 入門 (マーケティングデータ分析基盤技術勉強会)Apache Hadoop & Hive 入門 (マーケティングデータ分析基盤技術勉強会)
Apache Hadoop & Hive 入門 (マーケティングデータ分析基盤技術勉強会)Takeshi Mikami
 
アグリゲート・コンピューティング風IoTでの戦い方
アグリゲート・コンピューティング風IoTでの戦い方アグリゲート・コンピューティング風IoTでの戦い方
アグリゲート・コンピューティング風IoTでの戦い方Takeshi Mikami
 
データウェアハウス入門 (マーケティングデータ分析基盤技術勉強会)
データウェアハウス入門 (マーケティングデータ分析基盤技術勉強会)データウェアハウス入門 (マーケティングデータ分析基盤技術勉強会)
データウェアハウス入門 (マーケティングデータ分析基盤技術勉強会)Takeshi Mikami
 
TensorFlowで遊びながら学んだ、はじめてのLED点滅
TensorFlowで遊びながら学んだ、はじめてのLED点滅TensorFlowで遊びながら学んだ、はじめてのLED点滅
TensorFlowで遊びながら学んだ、はじめてのLED点滅Takeshi Mikami
 

Mehr von Takeshi Mikami (20)

GitHubの機能を活用したGitHub Flowによる開発の進め方
GitHubの機能を活用したGitHub Flowによる開発の進め方GitHubの機能を活用したGitHub Flowによる開発の進め方
GitHubの機能を活用したGitHub Flowによる開発の進め方
 
HBase CompleteBulkLoadその仕組み&発生した問題
HBase CompleteBulkLoadその仕組み&発生した問題HBase CompleteBulkLoadその仕組み&発生した問題
HBase CompleteBulkLoadその仕組み&発生した問題
 
アーリース情報技術株式会社 会社案内 (2019/02/13)
アーリース情報技術株式会社 会社案内 (2019/02/13)アーリース情報技術株式会社 会社案内 (2019/02/13)
アーリース情報技術株式会社 会社案内 (2019/02/13)
 
Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方
Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方
Spark MLlib ML Pipelines の概要 及びpysparkからの扱い方
 
SPARQL入門
SPARQL入門SPARQL入門
SPARQL入門
 
センサーによるデータ計測と異常検知の基本
センサーによるデータ計測と異常検知の基本センサーによるデータ計測と異常検知の基本
センサーによるデータ計測と異常検知の基本
 
Webサイトのアクセスログによるユーザー属性推定
Webサイトのアクセスログによるユーザー属性推定Webサイトのアクセスログによるユーザー属性推定
Webサイトのアクセスログによるユーザー属性推定
 
Google Cloud Dataflowによる データ変換処理入門
Google Cloud Dataflowによる データ変換処理入門Google Cloud Dataflowによる データ変換処理入門
Google Cloud Dataflowによる データ変換処理入門
 
IoTでの機械学習活用イメージと強化学習のご紹介
IoTでの機械学習活用イメージと強化学習のご紹介IoTでの機械学習活用イメージと強化学習のご紹介
IoTでの機械学習活用イメージと強化学習のご紹介
 
協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介
協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介
協調フィルタリング・アソシエーション分析によるレコメンド手法の紹介
 
SparkMLlibで始めるビッグデータを対象とした機械学習入門
SparkMLlibで始めるビッグデータを対象とした機械学習入門SparkMLlibで始めるビッグデータを対象とした機械学習入門
SparkMLlibで始めるビッグデータを対象とした機械学習入門
 
Ims@sparqlではじめるr markdownとgitbookによるレポート生成
Ims@sparqlではじめるr markdownとgitbookによるレポート生成Ims@sparqlではじめるr markdownとgitbookによるレポート生成
Ims@sparqlではじめるr markdownとgitbookによるレポート生成
 
レコメンドアルゴリズムの基本と周辺知識と実装方法
レコメンドアルゴリズムの基本と周辺知識と実装方法レコメンドアルゴリズムの基本と周辺知識と実装方法
レコメンドアルゴリズムの基本と周辺知識と実装方法
 
担当アイドルに反応してLチカさせる予測モデル開発
担当アイドルに反応してLチカさせる予測モデル開発担当アイドルに反応してLチカさせる予測モデル開発
担当アイドルに反応してLチカさせる予測モデル開発
 
Apache Airflow入門 (マーケティングデータ分析基盤技術勉強会)
Apache Airflow入門  (マーケティングデータ分析基盤技術勉強会)Apache Airflow入門  (マーケティングデータ分析基盤技術勉強会)
Apache Airflow入門 (マーケティングデータ分析基盤技術勉強会)
 
Apache Hbase バルクロードの使い方
Apache Hbase バルクロードの使い方Apache Hbase バルクロードの使い方
Apache Hbase バルクロードの使い方
 
Apache Hadoop & Hive 入門 (マーケティングデータ分析基盤技術勉強会)
Apache Hadoop & Hive 入門 (マーケティングデータ分析基盤技術勉強会)Apache Hadoop & Hive 入門 (マーケティングデータ分析基盤技術勉強会)
Apache Hadoop & Hive 入門 (マーケティングデータ分析基盤技術勉強会)
 
アグリゲート・コンピューティング風IoTでの戦い方
アグリゲート・コンピューティング風IoTでの戦い方アグリゲート・コンピューティング風IoTでの戦い方
アグリゲート・コンピューティング風IoTでの戦い方
 
データウェアハウス入門 (マーケティングデータ分析基盤技術勉強会)
データウェアハウス入門 (マーケティングデータ分析基盤技術勉強会)データウェアハウス入門 (マーケティングデータ分析基盤技術勉強会)
データウェアハウス入門 (マーケティングデータ分析基盤技術勉強会)
 
TensorFlowで遊びながら学んだ、はじめてのLED点滅
TensorFlowで遊びながら学んだ、はじめてのLED点滅TensorFlowで遊びながら学んだ、はじめてのLED点滅
TensorFlowで遊びながら学んだ、はじめてのLED点滅
 

データサイエンスアイドル「小日向美穂」と考える「つながり」

  • 1. takemikamiʼs note ‒ http://takemikami.com/ データサイエンスアイドル 「⼩⽇向美穂」と考える「つながり」 Copyright (C) Takeshi Mikami. All rights reserved. 1 三上 威 - @takemikami アーリース情報技術株式会社 代表取締役 社⻑ IM@S Engineer Talks 2019 2019.7.6 @ Speee株式会社
  • 2. takemikamiʼs note ‒ http://takemikami.com/ はじめに •テーマ データサイエンスアイドル 「⼩⽇向美穂」と考える「つながり」 •内容 • アイドル共通の特徴を探る⽅法 • ⾃然⾔語処理を⽤いた特徴の表現⽅法 Copyright (C) Takeshi Mikami. All rights reserved. 2 本⽇のセッションでお話しする内容について説明します
  • 3. takemikamiʼs note ‒ http://takemikami.com/ 副業紹介 • みかみんP (@takemikamas) • データエンジニア・サイエンティスト • タスク: 分析・予測モデル開発・基盤構築 etc • 対象: マーケティングデータ etc • 略歴 • 甲南⼤学理学部応⽤数学科 卒 • EC, CRM等のシステム構築 @ NEC系SIer • ECサイトのマーケティングデータ分析 @ DeNA • データ分析・予測モデル開発・基盤構築 @アーリース情報技術(株) Copyright (C) Takeshi Mikami. All rights reserved. 3 発表者の副業を紹介します ※フリーランスの法⼈成り P
  • 4. takemikamiʼs note ‒ http://takemikami.com/ 副業紹介 開発プロダクト • rdflint • RDFデータのチェックツール • im@sparqlのデータチェックに利⽤中 • https://github.com/imas/rdflint • digdag-plugin-shresult • ワークフローエンジン「Digdag」のプラグイン • シェルスクリプトを実⾏し、標準出⼒をDigdagの変数に格納するオペレータ • https://github.com/takemikami/digdag-plugin-shresult • objectify-appengine-memcacheclient • Google Cloud DatastoreのJava⽤ライブラリ「Objectify」(v6以降)で、 Google AppEngine Memcache のキャッシュを利⽤するためのサービス • https://github.com/takemikami/objectify-appengine-memcacheclient Copyright (C) Takeshi Mikami. All rights reserved. 4 発表者が作ったプロダクトを紹介します etc
  • 5. takemikamiʼs note ‒ http://takemikami.com/ 本業紹介 • 担当アイドル:萩原雪歩・箱崎星梨花・杜野凛世・⼩⽇向美穂 Copyright (C) Takeshi Mikami. All rights reserved. 5 発表者の本業(プロデュース業)を紹介します ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています
  • 6. takemikamiʼs note ‒ http://takemikami.com/ IM@Studyでの発表 1/2 • 担当アイドルに反応してLチカさせる予測モデル開発 @2017.5.17 アイマスエンジニア MeetUp In Tokyo • ima@sparqlではじめるR Markdownとgitbookによるレポート⽣成 @2017.9.2 あいますえんじにあ Meetup in 京都 Copyright (C) Takeshi Mikami. All rights reserved. 6 発表者のIM@Studyでの過去の発表を紹介します ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています
  • 7. takemikamiʼs note ‒ http://takemikami.com/ IM@Studyでの発表 2/2 • 何つながりなのかな?を探る⾃然⾔語処理〜765PRO LIVE THEATERに通りがかる⼩⽇向美穂〜 @2019.4.14 週刊IM@Study 2019年5⽉ • RDFチェックツール「rdflint」のご紹介 @2019.4.21 アイマスハッカソン2019 in 名古屋 Copyright (C) Takeshi Mikami. All rights reserved. 7 発表者のIM@Studyでの過去の発表を紹介します
  • 8. takemikamiʼs note ‒ http://takemikami.com/ rdflintとは • 以下のチェックが⾃動化出来る • RDF、Turtle(ttl)ファイルの⽂法チェック • 未定義の主語が、⽬的語として使われていないかのチェック etc • CIに組み込んでPullRequestによるマスターデータ作成運⽤に利⽤可能 • im@sparqlのデータ作成運⽤に利⽤中 Copyright (C) Takeshi Mikami. All rights reserved. 8 rdflintの概要を⽰します RDFファイルの⾃動検査ツール https://github.com/imas/rdflint × に応募! 応援下さい!
  • 9. takemikamiʼs note ‒ http://takemikami.com/ アイドル「⼩⽇向美穂」の紹介 Copyright (C) Takeshi Mikami. All rights reserved. 9
  • 10. takemikamiʼs note ‒ http://takemikami.com/ ⼩⽇向美穂と⾔えば Copyright (C) Takeshi Mikami. All rights reserved. 10 ⼩⽇向美穂といえばデータサイエンスアイドルです データサイエンスアイドル ⼩⽇向美穂と⾔えば ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています
  • 11. takemikamiʼs note ‒ http://takemikami.com/Copyright (C) Takeshi Mikami. All rights reserved. 11 ですよね ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています
  • 12. takemikamiʼs note ‒ http://takemikami.com/ ⼩⽇向美穂@1コマ劇場 1/5 Copyright (C) Takeshi Mikami. All rights reserved. 12 1コマ劇場での⼩⽇向美穂と⾔えば「何繋がりなのかな?」 ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています 何 つ な が り な の か な ? 相原雪乃① A・お茶(紅茶、緑茶、珈琲)
  • 13. takemikamiʼs note ‒ http://takemikami.com/ ⼩⽇向美穂@1コマ劇場 2/5 Copyright (C) Takeshi Mikami. All rights reserved. 13 1コマ劇場での⼩⽇向美穂と⾔えば「何繋がりなのかな?」 ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています ス イ ツ の 話 し だ ♪ 槙原志保① 何つながりか…わかる
  • 14. takemikamiʼs note ‒ http://takemikami.com/ ⼩⽇向美穂@1コマ劇場 3/5 Copyright (C) Takeshi Mikami. All rights reserved. 14 1コマ劇場での⼩⽇向美穂と⾔えば「何繋がりなのかな?」 ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています 何 つ な が り な の か な ? 間中美⾥① あっ旅⾏の話♪
  • 15. takemikamiʼs note ‒ http://takemikami.com/ ⼩⽇向美穂@1コマ劇場 4/5 Copyright (C) Takeshi Mikami. All rights reserved. 15 1コマ劇場での⼩⽇向美穂と⾔えば「何繋がりなのかな?」 ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています 何 つ な が り な の か な ? 涼宮星花① A・ネイル無理繋がり
  • 16. takemikamiʼs note ‒ http://takemikami.com/ ⼩⽇向美穂@1コマ劇場 5/5 Copyright (C) Takeshi Mikami. All rights reserved. 16 1コマ劇場での⼩⽇向美穂と⾔えば「何繋がりなのかな?」 ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています 何 つ な が り な の か な ? 横⼭千佳① A・魔法少⼥アニメ
  • 17. takemikamiʼs note ‒ http://takemikami.com/ 何 つ な が り な の か な ? 横⼭千佳① A・魔法少⼥アニメ ⼩⽇向美穂@1コマ劇場 Copyright (C) Takeshi Mikami. All rights reserved. 17 1コマ劇場での⼩⽇向美穂と⾔えば「何繋がりなのかな?」 もしかして 機械学習? ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています
  • 18. takemikamiʼs note ‒ http://takemikami.com/ 何 つ な が り な の か な ? 横⼭千佳① A・魔法少⼥アニメ ⼩⽇向美穂@1コマ劇場 Copyright (C) Takeshi Mikami. All rights reserved. 18 1コマ劇場での⼩⽇向美穂と⾔えば「何繋がりなのかな?」 特徴量 その他のアイドル 2値分類2値分類 ⼩⽇向美穂 ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています
  • 19. takemikamiʼs note ‒ http://takemikami.com/ ⼩⽇向美穂のデータサイエンス Copyright (C) Takeshi Mikami. All rights reserved. 19 ⼩⽇向美穂のデータサイエンスアイドルを紹介します •「何つながりなのかな?」問題を解く⼿続き •アイドルを何⼈か選ぶ •選んだアイドルとそれ以外のグループに分ける •2つのグループを分ける最適な特徴量を探す ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています
  • 20. takemikamiʼs note ‒ http://takemikami.com/ アイドル共通の特徴を探る⽅法 Copyright (C) Takeshi Mikami. All rights reserved. 20
  • 21. takemikamiʼs note ‒ http://takemikami.com/ 教師あり学習と教師なし学習 •教師あり学習 •正解が分かっているデータから規則性を導き出す →正解が分からないデータの正解を予測する •教師なし学習 •データ群をグルーピングしたり特徴をまとめる →データを捉えやすくする(可視化などを⾏う際に) Copyright (C) Takeshi Mikami. All rights reserved. 21 教師あり学習と教師なし学習について説明します
  • 22. takemikamiʼs note ‒ http://takemikami.com/ 代表的な機械学習の⼿法 Copyright (C) Takeshi Mikami. All rights reserved. 22 scikit-learnによる機械学習 教師 種類 ⼿法 活⽤⽅法 教師あり (supervised learning) 分類 (classification) ロジスティック回帰 決定⽊ SVM ニューラルネットワーク 離脱顧客判定 スパムメールの判定 回帰 (regression) 線形回帰分析 ベイズ線形回帰分析 販売予測 教師なし (unsupervised learning) クラスタリング (clustering) k-means法 混合正規分布モデル 顧客のセグメント分け 次元削減 (dimentionality reduction) 主成分分析 特異値分解 商品の類似性を可視化 ※教師あり/なし以外にも強化学習(reinforcement learning)という⼿法もあります 代表的な機械学習の⼿法を紹介します
  • 23. takemikamiʼs note ‒ http://takemikami.com/ y = f(x)<latexit sha1_base64="avIj5XAps1N9LzLhuEjnUmfZI00=">AAACa3ichVHLSsNAFD2Nr1ofrXYj6qJYKropUxEUQSi6cdmHfUAtJYnTGpomIUmLtfgDLt24qBsFEfEz3PgDLvoJIq4quHHhbRoQLeoNkzlz5p47Z+5IhqpYNmMdjzA0PDI65h33TUxOTfsDM7NZS6+bMs/IuqqbeUm0uKpoPGMrtsrzhsnFmqTynFTd7e3nGty0FF3bt5sGL9bEiqaUFVm0ico3Q9uh8srxaikQZlHmRGgQxFwQhhsJPXCLAxxCh4w6auDQYBNWIcKir4AYGAziimgRZxJSnH2OU/hIW6csThkisVX6V2hVcFmN1r2alqOW6RSVhknKECLsid2xLntk9+yZffxaq+XU6Hlp0iz1tdwo+c/m0u//qmo02zj6Uv3p2UYZm45XhbwbDtO7hdzXN04uuumtVKS1zK7ZC/m/Yh32QDfQGm/yTZKn2vDRA8R+tnsQZNeiMcLJ9XB8x30KLxawhBXq9wbi2EMCGafP52jj0vMqBIV5YbGfKnhcTRDfQoh8Al4di+s=</latexit><latexit sha1_base64="avIj5XAps1N9LzLhuEjnUmfZI00=">AAACa3ichVHLSsNAFD2Nr1ofrXYj6qJYKropUxEUQSi6cdmHfUAtJYnTGpomIUmLtfgDLt24qBsFEfEz3PgDLvoJIq4quHHhbRoQLeoNkzlz5p47Z+5IhqpYNmMdjzA0PDI65h33TUxOTfsDM7NZS6+bMs/IuqqbeUm0uKpoPGMrtsrzhsnFmqTynFTd7e3nGty0FF3bt5sGL9bEiqaUFVm0ico3Q9uh8srxaikQZlHmRGgQxFwQhhsJPXCLAxxCh4w6auDQYBNWIcKir4AYGAziimgRZxJSnH2OU/hIW6csThkisVX6V2hVcFmN1r2alqOW6RSVhknKECLsid2xLntk9+yZffxaq+XU6Hlp0iz1tdwo+c/m0u//qmo02zj6Uv3p2UYZm45XhbwbDtO7hdzXN04uuumtVKS1zK7ZC/m/Yh32QDfQGm/yTZKn2vDRA8R+tnsQZNeiMcLJ9XB8x30KLxawhBXq9wbi2EMCGafP52jj0vMqBIV5YbGfKnhcTRDfQoh8Al4di+s=</latexit><latexit sha1_base64="avIj5XAps1N9LzLhuEjnUmfZI00=">AAACa3ichVHLSsNAFD2Nr1ofrXYj6qJYKropUxEUQSi6cdmHfUAtJYnTGpomIUmLtfgDLt24qBsFEfEz3PgDLvoJIq4quHHhbRoQLeoNkzlz5p47Z+5IhqpYNmMdjzA0PDI65h33TUxOTfsDM7NZS6+bMs/IuqqbeUm0uKpoPGMrtsrzhsnFmqTynFTd7e3nGty0FF3bt5sGL9bEiqaUFVm0ico3Q9uh8srxaikQZlHmRGgQxFwQhhsJPXCLAxxCh4w6auDQYBNWIcKir4AYGAziimgRZxJSnH2OU/hIW6csThkisVX6V2hVcFmN1r2alqOW6RSVhknKECLsid2xLntk9+yZffxaq+XU6Hlp0iz1tdwo+c/m0u//qmo02zj6Uv3p2UYZm45XhbwbDtO7hdzXN04uuumtVKS1zK7ZC/m/Yh32QDfQGm/yTZKn2vDRA8R+tnsQZNeiMcLJ9XB8x30KLxawhBXq9wbi2EMCGafP52jj0vMqBIV5YbGfKnhcTRDfQoh8Al4di+s=</latexit><latexit sha1_base64="avIj5XAps1N9LzLhuEjnUmfZI00=">AAACa3ichVHLSsNAFD2Nr1ofrXYj6qJYKropUxEUQSi6cdmHfUAtJYnTGpomIUmLtfgDLt24qBsFEfEz3PgDLvoJIq4quHHhbRoQLeoNkzlz5p47Z+5IhqpYNmMdjzA0PDI65h33TUxOTfsDM7NZS6+bMs/IuqqbeUm0uKpoPGMrtsrzhsnFmqTynFTd7e3nGty0FF3bt5sGL9bEiqaUFVm0ico3Q9uh8srxaikQZlHmRGgQxFwQhhsJPXCLAxxCh4w6auDQYBNWIcKir4AYGAziimgRZxJSnH2OU/hIW6csThkisVX6V2hVcFmN1r2alqOW6RSVhknKECLsid2xLntk9+yZffxaq+XU6Hlp0iz1tdwo+c/m0u//qmo02zj6Uv3p2UYZm45XhbwbDtO7hdzXN04uuumtVKS1zK7ZC/m/Yh32QDfQGm/yTZKn2vDRA8R+tnsQZNeiMcLJ9XB8x30KLxawhBXq9wbi2EMCGafP52jj0vMqBIV5YbGfKnhcTRDfQoh8Al4di+s=</latexit> 教師あり学習の基本 Copyright (C) Takeshi Mikami. All rights reserved. 23 教師あり学習の基本的な考え⽅を説明します やりたいこと: 「xの値」が与えられた時に「yの値」を予測したい → 𝑦 = 𝑓 𝑥 という関数を求めたい ⽬的変数 説明変数 予測モデル⽬的変数が離散値→分類 ⽬的変数が連続値→回帰
  • 24. takemikamiʼs note ‒ http://takemikami.com/ y = 2x<latexit sha1_base64="6ey09tPnw6uJouWfltsKpi6x1ZM=">AAACaXichVFNSwJBGH7cvsw+1LpIXSQxOskoQREEUpeOfuQHmMjuNtbmurvsrpJJf6BTt6hOBRHRz+jSH+jgTwiPBl069LouREn1DjPzzDPv884zM5KhKpbNWMcjjIyOjU94J31T0zOz/kBwLm/pDVPmOVlXdbMoiRZXFY3nbMVWedEwuViXVF6Qatv9/UKTm5aia7t2y+DlunigKVVFFm2i8q3wZjhxXAlEWIw5ER4GcRdE4EZKD9xjD/vQIaOBOjg02IRViLColRAHg0FcGW3iTEKKs89xCh9pG5TFKUMktkbjAa1KLqvRul/TctQynaJSN0kZRpS9sAfWY8/skb2yj19rtZ0afS8tmqWBlhsV/1ko+/6vqk6zjcMv1Z+ebVSx7nhVyLvhMP1byAN98+Sil93IRNvL7JZ1yf8N67AnuoHWfJPv0jxzDR99QPzncw+DfCIWJ5xejSS33K/wYhFLWKH3XkMSO0ghR+ce4RyXuPJ0haAQEhYGqYLH1czjWwiRTwWEi1I=</latexit><latexit sha1_base64="6ey09tPnw6uJouWfltsKpi6x1ZM=">AAACaXichVFNSwJBGH7cvsw+1LpIXSQxOskoQREEUpeOfuQHmMjuNtbmurvsrpJJf6BTt6hOBRHRz+jSH+jgTwiPBl069LouREn1DjPzzDPv884zM5KhKpbNWMcjjIyOjU94J31T0zOz/kBwLm/pDVPmOVlXdbMoiRZXFY3nbMVWedEwuViXVF6Qatv9/UKTm5aia7t2y+DlunigKVVFFm2i8q3wZjhxXAlEWIw5ER4GcRdE4EZKD9xjD/vQIaOBOjg02IRViLColRAHg0FcGW3iTEKKs89xCh9pG5TFKUMktkbjAa1KLqvRul/TctQynaJSN0kZRpS9sAfWY8/skb2yj19rtZ0afS8tmqWBlhsV/1ko+/6vqk6zjcMv1Z+ebVSx7nhVyLvhMP1byAN98+Sil93IRNvL7JZ1yf8N67AnuoHWfJPv0jxzDR99QPzncw+DfCIWJ5xejSS33K/wYhFLWKH3XkMSO0ghR+ce4RyXuPJ0haAQEhYGqYLH1czjWwiRTwWEi1I=</latexit><latexit sha1_base64="6ey09tPnw6uJouWfltsKpi6x1ZM=">AAACaXichVFNSwJBGH7cvsw+1LpIXSQxOskoQREEUpeOfuQHmMjuNtbmurvsrpJJf6BTt6hOBRHRz+jSH+jgTwiPBl069LouREn1DjPzzDPv884zM5KhKpbNWMcjjIyOjU94J31T0zOz/kBwLm/pDVPmOVlXdbMoiRZXFY3nbMVWedEwuViXVF6Qatv9/UKTm5aia7t2y+DlunigKVVFFm2i8q3wZjhxXAlEWIw5ER4GcRdE4EZKD9xjD/vQIaOBOjg02IRViLColRAHg0FcGW3iTEKKs89xCh9pG5TFKUMktkbjAa1KLqvRul/TctQynaJSN0kZRpS9sAfWY8/skb2yj19rtZ0afS8tmqWBlhsV/1ko+/6vqk6zjcMv1Z+ebVSx7nhVyLvhMP1byAN98+Sil93IRNvL7JZ1yf8N67AnuoHWfJPv0jxzDR99QPzncw+DfCIWJ5xejSS33K/wYhFLWKH3XkMSO0ghR+ce4RyXuPJ0haAQEhYGqYLH1czjWwiRTwWEi1I=</latexit><latexit sha1_base64="6ey09tPnw6uJouWfltsKpi6x1ZM=">AAACaXichVFNSwJBGH7cvsw+1LpIXSQxOskoQREEUpeOfuQHmMjuNtbmurvsrpJJf6BTt6hOBRHRz+jSH+jgTwiPBl069LouREn1DjPzzDPv884zM5KhKpbNWMcjjIyOjU94J31T0zOz/kBwLm/pDVPmOVlXdbMoiRZXFY3nbMVWedEwuViXVF6Qatv9/UKTm5aia7t2y+DlunigKVVFFm2i8q3wZjhxXAlEWIw5ER4GcRdE4EZKD9xjD/vQIaOBOjg02IRViLColRAHg0FcGW3iTEKKs89xCh9pG5TFKUMktkbjAa1KLqvRul/TctQynaJSN0kZRpS9sAfWY8/skb2yj19rtZ0afS8tmqWBlhsV/1ko+/6vqk6zjcMv1Z+ebVSx7nhVyLvhMP1byAN98+Sil93IRNvL7JZ1yf8N67AnuoHWfJPv0jxzDR99QPzncw+DfCIWJ5xejSS33K/wYhFLWKH3XkMSO0ghR+ce4RyXuPJ0haAQEhYGqYLH1czjWwiRTwWEi1I=</latexit> 教師あり学習の基本 Copyright (C) Takeshi Mikami. All rights reserved. 24 教師あり学習の基本的な考え⽅を説明します x y データ1 1 2 データ2 2 4 データ3 3 6 データ4 4 8 データ5 5 ? ①教師データを取得 教師あり学習の⼿続き: ②教師データから y=f(x) を導く 10 ③未知の値を予測する 予測(prediction) 学習 (fitting, training)
  • 25. takemikamiʼs note ‒ http://takemikami.com/ 線形回帰による回帰 • 線形回帰分析:データに当てはまりの良い直線(回帰直線)を引く • ⼿法:最⼩⼆乗法(残差の⼆乗和が最⼩になる係数を決定する) Copyright (C) Takeshi Mikami. All rights reserved. 25 線形回帰による回帰を紹介します 線形回帰の例 標本回帰直線からの残差の⼆乗和 これを最⼩にする、a,bを求める y = a + bx<latexit sha1_base64="YjNKByktGNZfn74w3E4yJfvBpyE=">AAACbXichVHLSsNAFD2N7/qqiiAoEiw+QCgTERRBEN24bNWq+ECSONWhaRKSabEWf8C14EIUFETEz3DjD7jwE8SFCwU3LrxJA6Ki3mFmzpy5586ZGcO1hC8Ze4gpNbV19Q2NTfHmlta29kRH57LvFD2TZ03HcrxVQ/e5JWyelUJafNX1uF4wLL5i5OeC/ZUS93zh2Euy7PLNgr5ji5wwdUnUWlmdVnV1VDX2thJJlmJhqD+BFoEkokg7iStsYBsOTBRRAIcNSdiCDp/aOjQwuMRtokKcR0iE+xwHiJO2SFmcMnRi8zTu0Go9Ym1aBzX9UG3SKRZ1j5QqBtk9u2Yv7I7dsEf2/mutSlgj8FKm2ahqubvVftiz+PavqkCzxO6n6k/PEjlMhl4FeXdDJriFWdWX9o9fFqcWBitD7II9kf9z9sBu6QZ26dW8zPCFE8TpA7Tvz/0TLI+lNMKZ8eTMbPQVjejFAEbovScwg3mkkaVzbRzhFGexZ6Vb6VP6q6lKLNJ04Usowx+ahIx2</latexit><latexit sha1_base64="YjNKByktGNZfn74w3E4yJfvBpyE=">AAACbXichVHLSsNAFD2N7/qqiiAoEiw+QCgTERRBEN24bNWq+ECSONWhaRKSabEWf8C14EIUFETEz3DjD7jwE8SFCwU3LrxJA6Ki3mFmzpy5586ZGcO1hC8Ze4gpNbV19Q2NTfHmlta29kRH57LvFD2TZ03HcrxVQ/e5JWyelUJafNX1uF4wLL5i5OeC/ZUS93zh2Euy7PLNgr5ji5wwdUnUWlmdVnV1VDX2thJJlmJhqD+BFoEkokg7iStsYBsOTBRRAIcNSdiCDp/aOjQwuMRtokKcR0iE+xwHiJO2SFmcMnRi8zTu0Go9Ym1aBzX9UG3SKRZ1j5QqBtk9u2Yv7I7dsEf2/mutSlgj8FKm2ahqubvVftiz+PavqkCzxO6n6k/PEjlMhl4FeXdDJriFWdWX9o9fFqcWBitD7II9kf9z9sBu6QZ26dW8zPCFE8TpA7Tvz/0TLI+lNMKZ8eTMbPQVjejFAEbovScwg3mkkaVzbRzhFGexZ6Vb6VP6q6lKLNJ04Usowx+ahIx2</latexit><latexit sha1_base64="YjNKByktGNZfn74w3E4yJfvBpyE=">AAACbXichVHLSsNAFD2N7/qqiiAoEiw+QCgTERRBEN24bNWq+ECSONWhaRKSabEWf8C14EIUFETEz3DjD7jwE8SFCwU3LrxJA6Ki3mFmzpy5586ZGcO1hC8Ze4gpNbV19Q2NTfHmlta29kRH57LvFD2TZ03HcrxVQ/e5JWyelUJafNX1uF4wLL5i5OeC/ZUS93zh2Euy7PLNgr5ji5wwdUnUWlmdVnV1VDX2thJJlmJhqD+BFoEkokg7iStsYBsOTBRRAIcNSdiCDp/aOjQwuMRtokKcR0iE+xwHiJO2SFmcMnRi8zTu0Go9Ym1aBzX9UG3SKRZ1j5QqBtk9u2Yv7I7dsEf2/mutSlgj8FKm2ahqubvVftiz+PavqkCzxO6n6k/PEjlMhl4FeXdDJriFWdWX9o9fFqcWBitD7II9kf9z9sBu6QZ26dW8zPCFE8TpA7Tvz/0TLI+lNMKZ8eTMbPQVjejFAEbovScwg3mkkaVzbRzhFGexZ6Vb6VP6q6lKLNJ04Usowx+ahIx2</latexit><latexit sha1_base64="YjNKByktGNZfn74w3E4yJfvBpyE=">AAACbXichVHLSsNAFD2N7/qqiiAoEiw+QCgTERRBEN24bNWq+ECSONWhaRKSabEWf8C14EIUFETEz3DjD7jwE8SFCwU3LrxJA6Ki3mFmzpy5586ZGcO1hC8Ze4gpNbV19Q2NTfHmlta29kRH57LvFD2TZ03HcrxVQ/e5JWyelUJafNX1uF4wLL5i5OeC/ZUS93zh2Euy7PLNgr5ji5wwdUnUWlmdVnV1VDX2thJJlmJhqD+BFoEkokg7iStsYBsOTBRRAIcNSdiCDp/aOjQwuMRtokKcR0iE+xwHiJO2SFmcMnRi8zTu0Go9Ym1aBzX9UG3SKRZ1j5QqBtk9u2Yv7I7dsEf2/mutSlgj8FKm2ahqubvVftiz+PavqkCzxO6n6k/PEjlMhl4FeXdDJriFWdWX9o9fFqcWBitD7II9kf9z9sBu6QZ26dW8zPCFE8TpA7Tvz/0TLI+lNMKZ8eTMbPQVjejFAEbovScwg3mkkaVzbRzhFGexZ6Vb6VP6q6lKLNJ04Usowx+ahIx2</latexit> yi = a + bxi + ei<latexit sha1_base64="D3Ru8iBacgECSwooiGbuMLygC6U=">AAACeXichVHLSsNAFD2N7/qqj4XgJloqxYJMVVAEoejGpVbbClpCEqc6mCYhSYu1+AP+gAs3KohUP8ONP+CinyAuFVzowts0IFrUO8zMmTP33Dkzo9mGcD3G6iGprb2js6u7J9zb1z8wGBkazrpWydF5RrcMy9nWVJcbwuQZT3gG37YdrhY1g+e0w9XGfq7MHVdY5pZXsXm+qO6boiB01SNKiYxWFCEvy6qckLUjggmZK0KJRNkM80NuBckARBHEuhW5wS72YEFHCUVwmPAIG1DhUttBEgw2cXlUiXMICX+f4wRh0pYoi1OGSuwhjfu02glYk9aNmq6v1ukUg7pDShkx9shq7IU9sDv2xD5+rVX1azS8VGjWmlpuK4OnY5tv/6qKNHs4+FL96dlDAYu+V0HebZ9p3EJv6svHZy+bS+lYdYpdsWfyf8nq7J5uYJZf9esNnj5HmD4g+fO5W0F2diZJeGM+mloJvqIb45hEnN57ASmsYR0ZOvcYF6jhNvQuTUhxabqZKoUCzQi+hTT3CRSKkDM=</latexit><latexit sha1_base64="D3Ru8iBacgECSwooiGbuMLygC6U=">AAACeXichVHLSsNAFD2N7/qqj4XgJloqxYJMVVAEoejGpVbbClpCEqc6mCYhSYu1+AP+gAs3KohUP8ONP+CinyAuFVzowts0IFrUO8zMmTP33Dkzo9mGcD3G6iGprb2js6u7J9zb1z8wGBkazrpWydF5RrcMy9nWVJcbwuQZT3gG37YdrhY1g+e0w9XGfq7MHVdY5pZXsXm+qO6boiB01SNKiYxWFCEvy6qckLUjggmZK0KJRNkM80NuBckARBHEuhW5wS72YEFHCUVwmPAIG1DhUttBEgw2cXlUiXMICX+f4wRh0pYoi1OGSuwhjfu02glYk9aNmq6v1ukUg7pDShkx9shq7IU9sDv2xD5+rVX1azS8VGjWmlpuK4OnY5tv/6qKNHs4+FL96dlDAYu+V0HebZ9p3EJv6svHZy+bS+lYdYpdsWfyf8nq7J5uYJZf9esNnj5HmD4g+fO5W0F2diZJeGM+mloJvqIb45hEnN57ASmsYR0ZOvcYF6jhNvQuTUhxabqZKoUCzQi+hTT3CRSKkDM=</latexit><latexit sha1_base64="D3Ru8iBacgECSwooiGbuMLygC6U=">AAACeXichVHLSsNAFD2N7/qqj4XgJloqxYJMVVAEoejGpVbbClpCEqc6mCYhSYu1+AP+gAs3KohUP8ONP+CinyAuFVzowts0IFrUO8zMmTP33Dkzo9mGcD3G6iGprb2js6u7J9zb1z8wGBkazrpWydF5RrcMy9nWVJcbwuQZT3gG37YdrhY1g+e0w9XGfq7MHVdY5pZXsXm+qO6boiB01SNKiYxWFCEvy6qckLUjggmZK0KJRNkM80NuBckARBHEuhW5wS72YEFHCUVwmPAIG1DhUttBEgw2cXlUiXMICX+f4wRh0pYoi1OGSuwhjfu02glYk9aNmq6v1ukUg7pDShkx9shq7IU9sDv2xD5+rVX1azS8VGjWmlpuK4OnY5tv/6qKNHs4+FL96dlDAYu+V0HebZ9p3EJv6svHZy+bS+lYdYpdsWfyf8nq7J5uYJZf9esNnj5HmD4g+fO5W0F2diZJeGM+mloJvqIb45hEnN57ASmsYR0ZOvcYF6jhNvQuTUhxabqZKoUCzQi+hTT3CRSKkDM=</latexit><latexit sha1_base64="D3Ru8iBacgECSwooiGbuMLygC6U=">AAACeXichVHLSsNAFD2N7/qqj4XgJloqxYJMVVAEoejGpVbbClpCEqc6mCYhSYu1+AP+gAs3KohUP8ONP+CinyAuFVzowts0IFrUO8zMmTP33Dkzo9mGcD3G6iGprb2js6u7J9zb1z8wGBkazrpWydF5RrcMy9nWVJcbwuQZT3gG37YdrhY1g+e0w9XGfq7MHVdY5pZXsXm+qO6boiB01SNKiYxWFCEvy6qckLUjggmZK0KJRNkM80NuBckARBHEuhW5wS72YEFHCUVwmPAIG1DhUttBEgw2cXlUiXMICX+f4wRh0pYoi1OGSuwhjfu02glYk9aNmq6v1ukUg7pDShkx9shq7IU9sDv2xD5+rVX1azS8VGjWmlpuK4OnY5tv/6qKNHs4+FL96dlDAYu+V0HebZ9p3EJv6svHZy+bS+lYdYpdsWfyf8nq7J5uYJZf9esNnj5HmD4g+fO5W0F2diZJeGM+mloJvqIb45hEnN57ASmsYR0ZOvcYF6jhNvQuTUhxabqZKoUCzQi+hTT3CRSKkDM=</latexit> nX i=1 e2 i = nX i=1 {yi (a + bxi)}2 <latexit sha1_base64="mqoVWZNV3XgkliJsHW1/TpWKMMo=">AAACo3ichVFNSxtBGH5c22pTbVZ7EbwMDRGlNMwGQREsYi+CF41GBZMsu+skDu4Xu5tgXPYP+Ac89NTSUqQ/o5fSa+vBnyA9KnjpoW82C6UJbd9hZp555n3eeWbG9G0ZRpxfjyijDx4+Ght/nHsyMfk0r05N74VeO7BE1fJsLzgwjVDY0hXVSEa2OPADYTimLfbNk9e9/f2OCELpubtR1xd1x2i5siktIyJKV1/Vwrajx3JVSxqxmzChy0aZrbIBOq7FXV2yl2zeYC+YearLhVrSKCe6WuAlngYbBloGCshiy1M/ooYjeLDQhgMBFxFhGwZCaofQwOETV0dMXEBIpvsCCXKkbVOWoAyD2BMaW7Q6zFiX1r2aYaq26BSbekBKhiK/4pf8ln/hn/gN//nXWnFao+elS7PZ1wpfz5/P7Nz/V+XQHOH4t+qfniM0sZx6leTdT5neLay+vnN2cbuzUinGc/wd/0H+3/Jr/plu4HburA/bovIGOfoAbfC5h8FeuaQR3l4srK1nXzGOWTzHPL33EtawgS1U6dz3+Ipv+K4UlU2louz2U5WRTPMMf4RS/wXUzKB5</latexit><latexit sha1_base64="mqoVWZNV3XgkliJsHW1/TpWKMMo=">AAACo3ichVFNSxtBGH5c22pTbVZ7EbwMDRGlNMwGQREsYi+CF41GBZMsu+skDu4Xu5tgXPYP+Ac89NTSUqQ/o5fSa+vBnyA9KnjpoW82C6UJbd9hZp555n3eeWbG9G0ZRpxfjyijDx4+Ght/nHsyMfk0r05N74VeO7BE1fJsLzgwjVDY0hXVSEa2OPADYTimLfbNk9e9/f2OCELpubtR1xd1x2i5siktIyJKV1/Vwrajx3JVSxqxmzChy0aZrbIBOq7FXV2yl2zeYC+YearLhVrSKCe6WuAlngYbBloGCshiy1M/ooYjeLDQhgMBFxFhGwZCaofQwOETV0dMXEBIpvsCCXKkbVOWoAyD2BMaW7Q6zFiX1r2aYaq26BSbekBKhiK/4pf8ln/hn/gN//nXWnFao+elS7PZ1wpfz5/P7Nz/V+XQHOH4t+qfniM0sZx6leTdT5neLay+vnN2cbuzUinGc/wd/0H+3/Jr/plu4HburA/bovIGOfoAbfC5h8FeuaQR3l4srK1nXzGOWTzHPL33EtawgS1U6dz3+Ipv+K4UlU2louz2U5WRTPMMf4RS/wXUzKB5</latexit><latexit sha1_base64="mqoVWZNV3XgkliJsHW1/TpWKMMo=">AAACo3ichVFNSxtBGH5c22pTbVZ7EbwMDRGlNMwGQREsYi+CF41GBZMsu+skDu4Xu5tgXPYP+Ac89NTSUqQ/o5fSa+vBnyA9KnjpoW82C6UJbd9hZp555n3eeWbG9G0ZRpxfjyijDx4+Ght/nHsyMfk0r05N74VeO7BE1fJsLzgwjVDY0hXVSEa2OPADYTimLfbNk9e9/f2OCELpubtR1xd1x2i5siktIyJKV1/Vwrajx3JVSxqxmzChy0aZrbIBOq7FXV2yl2zeYC+YearLhVrSKCe6WuAlngYbBloGCshiy1M/ooYjeLDQhgMBFxFhGwZCaofQwOETV0dMXEBIpvsCCXKkbVOWoAyD2BMaW7Q6zFiX1r2aYaq26BSbekBKhiK/4pf8ln/hn/gN//nXWnFao+elS7PZ1wpfz5/P7Nz/V+XQHOH4t+qfniM0sZx6leTdT5neLay+vnN2cbuzUinGc/wd/0H+3/Jr/plu4HburA/bovIGOfoAbfC5h8FeuaQR3l4srK1nXzGOWTzHPL33EtawgS1U6dz3+Ipv+K4UlU2louz2U5WRTPMMf4RS/wXUzKB5</latexit><latexit sha1_base64="mqoVWZNV3XgkliJsHW1/TpWKMMo=">AAACo3ichVFNSxtBGH5c22pTbVZ7EbwMDRGlNMwGQREsYi+CF41GBZMsu+skDu4Xu5tgXPYP+Ac89NTSUqQ/o5fSa+vBnyA9KnjpoW82C6UJbd9hZp555n3eeWbG9G0ZRpxfjyijDx4+Ght/nHsyMfk0r05N74VeO7BE1fJsLzgwjVDY0hXVSEa2OPADYTimLfbNk9e9/f2OCELpubtR1xd1x2i5siktIyJKV1/Vwrajx3JVSxqxmzChy0aZrbIBOq7FXV2yl2zeYC+YearLhVrSKCe6WuAlngYbBloGCshiy1M/ooYjeLDQhgMBFxFhGwZCaofQwOETV0dMXEBIpvsCCXKkbVOWoAyD2BMaW7Q6zFiX1r2aYaq26BSbekBKhiK/4pf8ln/hn/gN//nXWnFao+elS7PZ1wpfz5/P7Nz/V+XQHOH4t+qfniM0sZx6leTdT5neLay+vnN2cbuzUinGc/wd/0H+3/Jr/plu4HburA/bovIGOfoAbfC5h8FeuaQR3l4srK1nXzGOWTzHPL33EtawgS1U6dz3+Ipv+K4UlU2louz2U5WRTPMMf4RS/wXUzKB5</latexit>
  • 26. takemikamiʼs note ‒ http://takemikami.com/ ロジスティック回帰による分類 • ロジスティック関数で回帰直線を所属確率に変換、分類問題に適⽤ Copyright (C) Takeshi Mikami. All rights reserved. 26 ロジスティック回帰による分類を紹介します f(x) = a + bx<latexit sha1_base64="VhiKDeOA+vC91HwvYF89lEYlB9o=">AAACcXichVHLSsNAFD2Nr1ofrbpR3ISWiiKUqQiKIBTduLStfUCtksRpDaZJSNJiLf6AP6DgqoKI+Blu/AEX/QRxWcGNC2/SgGhR7zAzZ87cc+fMjGxqqu0w1gkIA4NDwyPB0dDY+MRkODI1nbeNuqXwnGJohlWUJZtrqs5zjupovGhaXKrJGi/IJ9vufqHBLVs19D2nafJyTarqakVVJIeog8ri6ZK4KUrisiifhg4jMZZgXoj9IOmDGPzYNSJ32McRDCioowYOHQ5hDRJsaiUkwWASV0aLOIuQ6u1znCNE2jplccqQiD2hsUqrks/qtHZr2p5aoVM06hYpRcTZM7tnXfbEHtgL+/i1Vsur4Xpp0iz3tNw8DF/MZt//VdVodnD8pfrTs4MK1j2vKnk3Pca9hdLTN84uu9mNTLy1wG7YK/lvsw57pBvojTflNs0z13A/IPnzuftBfiWRJJxejaW2/K8IYh5RLNJ7ryGFHewiR+dauEIbN4GuMCeIQrSXKgR8zQy+hbD8CbwojV4=</latexit><latexit sha1_base64="VhiKDeOA+vC91HwvYF89lEYlB9o=">AAACcXichVHLSsNAFD2Nr1ofrbpR3ISWiiKUqQiKIBTduLStfUCtksRpDaZJSNJiLf6AP6DgqoKI+Blu/AEX/QRxWcGNC2/SgGhR7zAzZ87cc+fMjGxqqu0w1gkIA4NDwyPB0dDY+MRkODI1nbeNuqXwnGJohlWUJZtrqs5zjupovGhaXKrJGi/IJ9vufqHBLVs19D2nafJyTarqakVVJIeog8ri6ZK4KUrisiifhg4jMZZgXoj9IOmDGPzYNSJ32McRDCioowYOHQ5hDRJsaiUkwWASV0aLOIuQ6u1znCNE2jplccqQiD2hsUqrks/qtHZr2p5aoVM06hYpRcTZM7tnXfbEHtgL+/i1Vsur4Xpp0iz3tNw8DF/MZt//VdVodnD8pfrTs4MK1j2vKnk3Pca9hdLTN84uu9mNTLy1wG7YK/lvsw57pBvojTflNs0z13A/IPnzuftBfiWRJJxejaW2/K8IYh5RLNJ7ryGFHewiR+dauEIbN4GuMCeIQrSXKgR8zQy+hbD8CbwojV4=</latexit><latexit sha1_base64="VhiKDeOA+vC91HwvYF89lEYlB9o=">AAACcXichVHLSsNAFD2Nr1ofrbpR3ISWiiKUqQiKIBTduLStfUCtksRpDaZJSNJiLf6AP6DgqoKI+Blu/AEX/QRxWcGNC2/SgGhR7zAzZ87cc+fMjGxqqu0w1gkIA4NDwyPB0dDY+MRkODI1nbeNuqXwnGJohlWUJZtrqs5zjupovGhaXKrJGi/IJ9vufqHBLVs19D2nafJyTarqakVVJIeog8ri6ZK4KUrisiifhg4jMZZgXoj9IOmDGPzYNSJ32McRDCioowYOHQ5hDRJsaiUkwWASV0aLOIuQ6u1znCNE2jplccqQiD2hsUqrks/qtHZr2p5aoVM06hYpRcTZM7tnXfbEHtgL+/i1Vsur4Xpp0iz3tNw8DF/MZt//VdVodnD8pfrTs4MK1j2vKnk3Pca9hdLTN84uu9mNTLy1wG7YK/lvsw57pBvojTflNs0z13A/IPnzuftBfiWRJJxejaW2/K8IYh5RLNJ7ryGFHewiR+dauEIbN4GuMCeIQrSXKgR8zQy+hbD8CbwojV4=</latexit><latexit sha1_base64="VhiKDeOA+vC91HwvYF89lEYlB9o=">AAACcXichVHLSsNAFD2Nr1ofrbpR3ISWiiKUqQiKIBTduLStfUCtksRpDaZJSNJiLf6AP6DgqoKI+Blu/AEX/QRxWcGNC2/SgGhR7zAzZ87cc+fMjGxqqu0w1gkIA4NDwyPB0dDY+MRkODI1nbeNuqXwnGJohlWUJZtrqs5zjupovGhaXKrJGi/IJ9vufqHBLVs19D2nafJyTarqakVVJIeog8ri6ZK4KUrisiifhg4jMZZgXoj9IOmDGPzYNSJ32McRDCioowYOHQ5hDRJsaiUkwWASV0aLOIuQ6u1znCNE2jplccqQiD2hsUqrks/qtHZr2p5aoVM06hYpRcTZM7tnXfbEHtgL+/i1Vsur4Xpp0iz3tNw8DF/MZt//VdVodnD8pfrTs4MK1j2vKnk3Pca9hdLTN84uu9mNTLy1wG7YK/lvsw57pBvojTflNs0z13A/IPnzuftBfiWRJJxejaW2/K8IYh5RLNJ7ryGFHewiR+dauEIbN4GuMCeIQrSXKgR8zQy+hbD8CbwojV4=</latexit> ※シグモイド関数 (a) = 1 1 + e a <latexit sha1_base64="o1wcc+FSB+1vahwU7g3kUpQTLVQ=">AAAChnichVFNSxtBGH5ctU1TW1d7EbyshhRLMcwWRRGEoBePJpoPSGyYXSdxcL/Y3QR02XPBP+ChJwUpRby2P6CX/gEP/gTxmEIvPfhmsyCttH2HmXnmmfd555kZw7NkEDJ2M6KMjo0/eZp5ln0+8eLlpDo1XQ3crm+Kiularl83eCAs6YhKKENL1D1fcNuwRM043Bzs13rCD6Tr7IZHntizeceRbWnykKiWOtcMZMfmC/yNtq412z43tUiPtUjT34r30SKP45aaYwWWhPYY6CnIIY1tV/2EJvbhwkQXNgQchIQtcATUGtDB4BG3h4g4n5BM9gViZEnbpSxBGZzYQxo7tGqkrEPrQc0gUZt0ikXdJ6WGPLtmn1mffWeX7Jb9+mutKKkx8HJEszHUCq81eTKz8/O/KpvmEAcPqn96DtHGauJVkncvYQa3MIf63vFpf2etnI9es3N2R/7P2A37Rjdwej/Mi5Iof0SWPkD/87kfg+q7gk64tJQrbqRfkcEs5rFA772CIrawjQqd+wFX+IKvSkYpKMvKyjBVGUk1r/BbKMV7N8GUrA==</latexit><latexit sha1_base64="o1wcc+FSB+1vahwU7g3kUpQTLVQ=">AAAChnichVFNSxtBGH5ctU1TW1d7EbyshhRLMcwWRRGEoBePJpoPSGyYXSdxcL/Y3QR02XPBP+ChJwUpRby2P6CX/gEP/gTxmEIvPfhmsyCttH2HmXnmmfd555kZw7NkEDJ2M6KMjo0/eZp5ln0+8eLlpDo1XQ3crm+Kiularl83eCAs6YhKKENL1D1fcNuwRM043Bzs13rCD6Tr7IZHntizeceRbWnykKiWOtcMZMfmC/yNtq412z43tUiPtUjT34r30SKP45aaYwWWhPYY6CnIIY1tV/2EJvbhwkQXNgQchIQtcATUGtDB4BG3h4g4n5BM9gViZEnbpSxBGZzYQxo7tGqkrEPrQc0gUZt0ikXdJ6WGPLtmn1mffWeX7Jb9+mutKKkx8HJEszHUCq81eTKz8/O/KpvmEAcPqn96DtHGauJVkncvYQa3MIf63vFpf2etnI9es3N2R/7P2A37Rjdwej/Mi5Iof0SWPkD/87kfg+q7gk64tJQrbqRfkcEs5rFA772CIrawjQqd+wFX+IKvSkYpKMvKyjBVGUk1r/BbKMV7N8GUrA==</latexit><latexit sha1_base64="o1wcc+FSB+1vahwU7g3kUpQTLVQ=">AAAChnichVFNSxtBGH5ctU1TW1d7EbyshhRLMcwWRRGEoBePJpoPSGyYXSdxcL/Y3QR02XPBP+ChJwUpRby2P6CX/gEP/gTxmEIvPfhmsyCttH2HmXnmmfd555kZw7NkEDJ2M6KMjo0/eZp5ln0+8eLlpDo1XQ3crm+Kiularl83eCAs6YhKKENL1D1fcNuwRM043Bzs13rCD6Tr7IZHntizeceRbWnykKiWOtcMZMfmC/yNtq412z43tUiPtUjT34r30SKP45aaYwWWhPYY6CnIIY1tV/2EJvbhwkQXNgQchIQtcATUGtDB4BG3h4g4n5BM9gViZEnbpSxBGZzYQxo7tGqkrEPrQc0gUZt0ikXdJ6WGPLtmn1mffWeX7Jb9+mutKKkx8HJEszHUCq81eTKz8/O/KpvmEAcPqn96DtHGauJVkncvYQa3MIf63vFpf2etnI9es3N2R/7P2A37Rjdwej/Mi5Iof0SWPkD/87kfg+q7gk64tJQrbqRfkcEs5rFA772CIrawjQqd+wFX+IKvSkYpKMvKyjBVGUk1r/BbKMV7N8GUrA==</latexit><latexit sha1_base64="o1wcc+FSB+1vahwU7g3kUpQTLVQ=">AAAChnichVFNSxtBGH5ctU1TW1d7EbyshhRLMcwWRRGEoBePJpoPSGyYXSdxcL/Y3QR02XPBP+ChJwUpRby2P6CX/gEP/gTxmEIvPfhmsyCttH2HmXnmmfd555kZw7NkEDJ2M6KMjo0/eZp5ln0+8eLlpDo1XQ3crm+Kiularl83eCAs6YhKKENL1D1fcNuwRM043Bzs13rCD6Tr7IZHntizeceRbWnykKiWOtcMZMfmC/yNtq412z43tUiPtUjT34r30SKP45aaYwWWhPYY6CnIIY1tV/2EJvbhwkQXNgQchIQtcATUGtDB4BG3h4g4n5BM9gViZEnbpSxBGZzYQxo7tGqkrEPrQc0gUZt0ikXdJ6WGPLtmn1mffWeX7Jb9+mutKKkx8HJEszHUCq81eTKz8/O/KpvmEAcPqn96DtHGauJVkncvYQa3MIf63vFpf2etnI9es3N2R/7P2A37Rjdwej/Mi5Iof0SWPkD/87kfg+q7gk64tJQrbqRfkcEs5rFA772CIrawjQqd+wFX+IKvSkYpKMvKyjBVGUk1r/BbKMV7N8GUrA==</latexit> x<latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit><latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit><latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit><latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit> x<latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit><latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit><latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit><latexit sha1_base64="JtZVMwUxIaWGzzkAWchy8W7SiJ4=">AAACZHichVHLSsNAFD2Nr1qrrRZBEKRYKq5kIoLiqujGZR/2AbWUJE5raJqEJC3W4g/oVnHhSkFE/Aw3/oCL/oAgLiu4ceFtGhAt6h1m5syZe+6cmZFNTbUdxjo+YWh4ZHTMPx6YCE5OhcLTMznbaFgKzyqGZlgFWbK5puo866iOxgumxaW6rPG8XNvu7eeb3LJVQ991WiYv1aWqrlZURXKISh2WwzG2wtyIDgLRAzF4kTTCt9jDPgwoaKAODh0OYQ0SbGpFiGAwiSuhTZxFSHX3OY4RIG2DsjhlSMTWaKzSquixOq17NW1XrdApGnWLlFHE2RO7Y132yO7ZC/v4tVbbrdHz0qJZ7mu5WQ6dzGXe/1XVaXZw8KX607ODCjZcryp5N12mdwulr28eXXQzm+l4e4lds1fyf8U67IFuoDfflJsUT18iQB8g/nzuQZBbXREJp9ZiiS3vK/yYxyKW6b3XkcAOksjSuRynOMO571kIChFhtp8q+DxNBN9CWPgE9k6J+A==</latexit> 1.0 0.0 ロジスティック回帰回帰 (f(x)) = 1 1 + e (a+bx) <latexit sha1_base64="N+oLuaC5bW/Rj4lOqP8XEYQLbcQ=">AAACjnicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoxhRnpucmaqRpVGhqKtgqxKQVJSYrVBvWArF2aly1rkaidlKFZm0tV7yAsoGeARgoYDIMoQxlBigIyBdYzhDDkMKQz5DMUMqQy5DKkMdQAmTnMCQyFANhNIMhgwFDAVAslqEaKFYEZGWC5VMZahm4gHpLgapSgSoSgaLZQDIdyIuGiuYB+SAzi8G6k4G25ABxEVCnAoOqwVWDlQafDU4YrDZ4afAHp1nVYDNAbqkE0kkQvakF8fxdEsHfCerKBdIlDBkIXXjdXMKQxmABdmsm0O0FYBGQL5Ih+suqpn8OtgpSrVYzWGTwGuj+hQY3DQ4DfZBX9iV5aWBq0GwGUAQYogc3JiPMSM8QyA40UXZwgkYFB4M0gxKDBjC8zRkcGDwYAhhCgfb2M2xl2Mewn0mAyYzJlskeopSJEapHmAEFMHkAANxhlwo=</latexit><latexit sha1_base64="N+oLuaC5bW/Rj4lOqP8XEYQLbcQ=">AAACjnicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoxhRnpucmaqRpVGhqKtgqxKQVJSYrVBvWArF2aly1rkaidlKFZm0tV7yAsoGeARgoYDIMoQxlBigIyBdYzhDDkMKQz5DMUMqQy5DKkMdQAmTnMCQyFANhNIMhgwFDAVAslqEaKFYEZGWC5VMZahm4gHpLgapSgSoSgaLZQDIdyIuGiuYB+SAzi8G6k4G25ABxEVCnAoOqwVWDlQafDU4YrDZ4afAHp1nVYDNAbqkE0kkQvakF8fxdEsHfCerKBdIlDBkIXXjdXMKQxmABdmsm0O0FYBGQL5Ih+suqpn8OtgpSrVYzWGTwGuj+hQY3DQ4DfZBX9iV5aWBq0GwGUAQYogc3JiPMSM8QyA40UXZwgkYFB4M0gxKDBjC8zRkcGDwYAhhCgfb2M2xl2Mewn0mAyYzJlskeopSJEapHmAEFMHkAANxhlwo=</latexit><latexit sha1_base64="N+oLuaC5bW/Rj4lOqP8XEYQLbcQ=">AAACjnicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoxhRnpucmaqRpVGhqKtgqxKQVJSYrVBvWArF2aly1rkaidlKFZm0tV7yAsoGeARgoYDIMoQxlBigIyBdYzhDDkMKQz5DMUMqQy5DKkMdQAmTnMCQyFANhNIMhgwFDAVAslqEaKFYEZGWC5VMZahm4gHpLgapSgSoSgaLZQDIdyIuGiuYB+SAzi8G6k4G25ABxEVCnAoOqwVWDlQafDU4YrDZ4afAHp1nVYDNAbqkE0kkQvakF8fxdEsHfCerKBdIlDBkIXXjdXMKQxmABdmsm0O0FYBGQL5Ih+suqpn8OtgpSrVYzWGTwGuj+hQY3DQ4DfZBX9iV5aWBq0GwGUAQYogc3JiPMSM8QyA40UXZwgkYFB4M0gxKDBjC8zRkcGDwYAhhCgfb2M2xl2Mewn0mAyYzJlskeopSJEapHmAEFMHkAANxhlwo=</latexit><latexit sha1_base64="N+oLuaC5bW/Rj4lOqP8XEYQLbcQ=">AAACjnicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoxhRnpucmaqRpVGhqKtgqxKQVJSYrVBvWArF2aly1rkaidlKFZm0tV7yAsoGeARgoYDIMoQxlBigIyBdYzhDDkMKQz5DMUMqQy5DKkMdQAmTnMCQyFANhNIMhgwFDAVAslqEaKFYEZGWC5VMZahm4gHpLgapSgSoSgaLZQDIdyIuGiuYB+SAzi8G6k4G25ABxEVCnAoOqwVWDlQafDU4YrDZ4afAHp1nVYDNAbqkE0kkQvakF8fxdEsHfCerKBdIlDBkIXXjdXMKQxmABdmsm0O0FYBGQL5Ih+suqpn8OtgpSrVYzWGTwGuj+hQY3DQ4DfZBX9iV5aWBq0GwGUAQYogc3JiPMSM8QyA40UXZwgkYFB4M0gxKDBjC8zRkcGDwYAhhCgfb2M2xl2Mewn0mAyYzJlskeopSJEapHmAEFMHkAANxhlwo=</latexit>
  • 27. takemikamiʼs note ‒ http://takemikami.com/ 単純パーセプトロン • パーセプトロンとは、視覚と脳の機能をモデル化したもの • ⼊⼒信号(x)と重み(w)の乗算の総和に対して、出⼒信号(y)が決まる Copyright (C) Takeshi Mikami. All rights reserved. 27 単純パーセプトロンを紹介します 𝑥% 𝑥& 𝑣 𝑤% 𝑤& ⼊⼒層 出⼒層 𝑦𝜎 活性化関数 1 𝑤+ = 𝑎 … 重み y = ( pX i=1 wixi + w0) <latexit sha1_base64="Pp0TLYdFS03hQvHtL3HbO7OzeZ8=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoVyrYKsQUZ6bnJipoABmlufHVmbaGtXHVBbUK5fGZChVArA1kGShoxgsoG+gZgIECJsMQylBmgIKAfIHlDDEMKQz5DMkMpQy5DKkMeQwlQHYOQyJDMRBGMxgyGDAUAMViGaqBYkVAViZYPpWhloELqLcUqCoVqCIRKJoNJNOBvGioaB6QDzKzGKw7GWhLDhAXAXUqMKgaXDVYafDZ4ITBaoOXBn9wmlUNNgPklkognQTRm1oQz98lEfydoK5cIF3CkIHQhdfNJQxpDBZgt2YC3V4AFgH5Ihmiv6xq+udgqyDVajWDRQavge5faHDT4DDQB3llX5KXBqYGzWbgAkaAIXpwYzLCjPQMgexAE2UHJ2hUcDBIMygxaADD25zBgcGDIYAhFGjvRIbtDAcYDjIJMVkw2TM5QpQyMUL1CDOgACYvAJOImD8=</latexit><latexit sha1_base64="Pp0TLYdFS03hQvHtL3HbO7OzeZ8=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoVyrYKsQUZ6bnJipoABmlufHVmbaGtXHVBbUK5fGZChVArA1kGShoxgsoG+gZgIECJsMQylBmgIKAfIHlDDEMKQz5DMkMpQy5DKkMeQwlQHYOQyJDMRBGMxgyGDAUAMViGaqBYkVAViZYPpWhloELqLcUqCoVqCIRKJoNJNOBvGioaB6QDzKzGKw7GWhLDhAXAXUqMKgaXDVYafDZ4ITBaoOXBn9wmlUNNgPklkognQTRm1oQz98lEfydoK5cIF3CkIHQhdfNJQxpDBZgt2YC3V4AFgH5Ihmiv6xq+udgqyDVajWDRQavge5faHDT4DDQB3llX5KXBqYGzWbgAkaAIXpwYzLCjPQMgexAE2UHJ2hUcDBIMygxaADD25zBgcGDIYAhFGjvRIbtDAcYDjIJMVkw2TM5QpQyMUL1CDOgACYvAJOImD8=</latexit><latexit sha1_base64="Pp0TLYdFS03hQvHtL3HbO7OzeZ8=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoVyrYKsQUZ6bnJipoABmlufHVmbaGtXHVBbUK5fGZChVArA1kGShoxgsoG+gZgIECJsMQylBmgIKAfIHlDDEMKQz5DMkMpQy5DKkMeQwlQHYOQyJDMRBGMxgyGDAUAMViGaqBYkVAViZYPpWhloELqLcUqCoVqCIRKJoNJNOBvGioaB6QDzKzGKw7GWhLDhAXAXUqMKgaXDVYafDZ4ITBaoOXBn9wmlUNNgPklkognQTRm1oQz98lEfydoK5cIF3CkIHQhdfNJQxpDBZgt2YC3V4AFgH5Ihmiv6xq+udgqyDVajWDRQavge5faHDT4DDQB3llX5KXBqYGzWbgAkaAIXpwYzLCjPQMgexAE2UHJ2hUcDBIMygxaADD25zBgcGDIYAhFGjvRIbtDAcYDjIJMVkw2TM5QpQyMUL1CDOgACYvAJOImD8=</latexit><latexit sha1_base64="Pp0TLYdFS03hQvHtL3HbO7OzeZ8=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtoVyrYKsQUZ6bnJipoABmlufHVmbaGtXHVBbUK5fGZChVArA1kGShoxgsoG+gZgIECJsMQylBmgIKAfIHlDDEMKQz5DMkMpQy5DKkMeQwlQHYOQyJDMRBGMxgyGDAUAMViGaqBYkVAViZYPpWhloELqLcUqCoVqCIRKJoNJNOBvGioaB6QDzKzGKw7GWhLDhAXAXUqMKgaXDVYafDZ4ITBaoOXBn9wmlUNNgPklkognQTRm1oQz98lEfydoK5cIF3CkIHQhdfNJQxpDBZgt2YC3V4AFgH5Ihmiv6xq+udgqyDVajWDRQavge5faHDT4DDQB3llX5KXBqYGzWbgAkaAIXpwYzLCjPQMgexAE2UHJ2hUcDBIMygxaADD25zBgcGDIYAhFGjvRIbtDAcYDjIJMVkw2TM5QpQyMUL1CDOgACYvAJOImD8=</latexit> = 𝑏 ロジスティック回帰と 単純パーセプトロンは等価
  • 28. takemikamiʼs note ‒ http://takemikami.com/ 単純パーセプトロン • 説明変数ベクトルと回帰係数ベクトルの内積を求め、 活性化関数に渡した写像が⽬的変数(クラスへの所属確率)となる Copyright (C) Takeshi Mikami. All rights reserved. 28 単純パーセプトロンの計算イメージを⽰します 次元0 次元1 次元2 … 次元p 1 𝑥% 𝑥. 𝑥& 回帰係数 重み0 𝑤+ 重み1 𝑤% 重み2 𝑤. … 重みp 𝑤& × = 𝑣 所属確率 𝑦 𝜎 説明変数 ⽬的変数
  • 29. takemikamiʼs note ‒ http://takemikami.com/ 整然データ(TidyData)とは • 機械学習に⽤いるのに適したデータ形式、次の条件に合致 • 1つの変数が1つの列になっている • 1つの観測が1つの⾏になっている • これらが⼀つの表にまとまっている Copyright (C) Takeshi Mikami. All rights reserved. 29 整然データについて説明します x1 x2 x3 … xp y #1 1 3 1 … 2 2 #2 2 5 4 … 4 1 … … … … … … … #n-1 4 8 4 … 8 3 #n 5 11 2 … 10 5 説明変数 ⽬的変数 観測事象
  • 30. takemikamiʼs note ‒ http://takemikami.com/ 整然データ(TidyData)への変換イメージ • 例:模擬試験の点数から⽣徒毎の合格確率を予測したい 「模擬試験種別 × ⽣徒IDの複合キーのデータ」ならば、 ⽣徒を1観測とするデータに変換する必要がある Copyright (C) Takeshi Mikami. All rights reserved. 30 整然データへの変換イメージを説明します ⽣徒ID 模試① 模試② … 模試p 合格確率 #1 1 3 … 2 ? #2 2 5 … 4 ? … … … … … … #n-1 4 8 … 8 ? #n 5 11 … 10 ? 模試種別 ⽣徒ID 得点 ① #1 1 ① #2 2 … … … p #n-1 8 p #n 11 ⽬的変数複合キー 説明変数得点データ
  • 31. takemikamiʼs note ‒ http://takemikami.com/Copyright (C) Takeshi Mikami. All rights reserved. 31 ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています アイドルマスター シンデレラガールズ U149 (UNDER 149)
  • 32. takemikamiʼs note ‒ http://takemikami.com/ アイドルの整然データ • im@sparqlからアイドルを観測事象とする整然データを作成 • 年齢、⾝⻑、体重、スリーサイズ、誕⽣⽇、出⾝地 Copyright (C) Takeshi Mikami. All rights reserved. 32 アイドルの整然データを⽤意するイメージを⽰します label title div age height weight bust waist hip birthdate birthplace 0 ⼤⽯泉 CinderellaGirls 15.0 157.0 41.0 83.0 55.0 82.0 --11-11 静岡 1 双葉杏 CinderellaGirls 17.0 139.0 30.0 NaN NaN NaN --09-02 北海道 2 相葉⼣美 CinderellaGirls 18.0 158.0 42.0 81.0 57.0 80.0 --04-15 神奈川 3 詩花 961ProIdols 17.0 158.0 43.0 82.0 53.0 80.0 --09-16 オーストリア 4 柊志乃 CinderellaGirls 31.0 167.0 43.0 84.0 54.0 83.0 --12-25 ⼭梨 5 村上巴 CinderellaGirls 13.0 146.0 37.0 74.0 53.0 76.0 --01-03 広島 6 東豪寺麗華 1054Pro NaN NaN NaN NaN NaN NaN 7 浜⼝あやめ CinderellaGirls 15.0 154.0 42.0 78.0 55.0 80.0 --01-13 三重 8 ライラ CinderellaGirls 16.0 150.0 40.0 75.0 54.0 78.0 --05-21 ドバイ 9 ⼀ノ瀬志希 CinderellaGirls 18.0 161.0 43.0 83.0 57.0 82.0 --05-30 岩⼿
  • 33. takemikamiʼs note ‒ http://takemikami.com/ 前処理(名義尺度を定量データに変換) • 名義尺度を、定量データに変換 • 誕⽣⽇→誕⽣⽉の東京の平均気温、出⾝地→出⾝都道府県の⼈⼝ Copyright (C) Takeshi Mikami. All rights reserved. 33 データの前処理を⾏うイメージを⽰します label title div age height weight bust waist hip birthtemp population 0 ⼤⽯泉 CinderellaGirls 15.0 157.0 41.0 83.0 55.0 82.0 12.800 3626991.0 1 双葉杏 CinderellaGirls 17.0 139.0 30.0 NaN NaN NaN 23.175 5348768.0 2 相葉⼣美 CinderellaGirls 18.0 158.0 42.0 81.0 57.0 80.0 15.400 8887304.0 3 詩花 961ProIdols 17.0 158.0 43.0 82.0 53.0 80.0 23.175 NaN 4 柊志乃 CinderellaGirls 31.0 167.0 43.0 84.0 54.0 83.0 8.275 819205.0 5 村上巴 CinderellaGirls 13.0 146.0 37.0 74.0 53.0 76.0 5.600 2795626.0 6 東豪寺麗華 1054Pro NaN NaN NaN NaN NaN NaN NaN NaN 7 浜⼝あやめ CinderellaGirls 15.0 154.0 42.0 78.0 55.0 80.0 5.600 1776805.0 8 ライラ CinderellaGirls 16.0 150.0 40.0 75.0 54.0 78.0 20.275 NaN 9 ⼀ノ瀬志希 CinderellaGirls 18.0 161.0 43.0 83.0 57.0 82.0 20.275 1272745.0
  • 34. takemikamiʼs note ‒ http://takemikami.com/ 前処理(正規化、⽋損値補完) • 各特徴量の最⼤値=1, 最⼩値=0に揃える、⽋損値を算術平均で補完 • scikit-learnのMinMaxScaler, SimpleImputerを使⽤ Copyright (C) Takeshi Mikami. All rights reserved. 34 データの前処理を⾏うイメージを⽰します name age height weight bust waist hip birttemp popu 0 ⼤⽯泉 0.272727 0.545455 0.40625 0.511111 0.444444 0.607143 0.335274 0.247083 1 双葉杏 0.363636 0.218182 0.06250 0.466497 0.515267 0.583969 0.818393 0.386155 2 相葉⼣美 0.409091 0.563636 0.43750 0.466667 0.555556 0.535714 0.456345 0.671971 3 詩花 0.363636 0.563636 0.46875 0.488889 0.333333 0.535714 0.818393 0.378733 4 柊志乃 1.000000 0.727273 0.46875 0.533333 0.388889 0.642857 0.124563 0.020291 5 村上巴 0.181818 0.345455 0.28125 0.311111 0.333333 0.392857 0.000000 0.179931 6 東豪寺麗華 0.369125 0.535885 0.48608 0.466497 0.515267 0.583969 0.522762 0.378733 7 浜⼝あやめ 0.272727 0.490909 0.43750 0.400000 0.444444 0.535714 0.000000 0.097639 8 ライラ 0.318182 0.418182 0.37500 0.333333 0.388889 0.464286 0.683353 0.378733 9 ⼀ノ瀬志希 0.409091 0.618182 0.46875 0.511111 0.555556 0.607143 0.683353 0.056924
  • 35. takemikamiʼs note ‒ http://takemikami.com/ 教師データの作成 • 教師ラベル(U149=1.0, notU149=0.0)を付与します Copyright (C) Takeshi Mikami. All rights reserved. 35 教師データ作成のイメージを⽰します name age height weight bust waist hip birttemp popu label 0 ⼤⽯泉 0.272727 0.545455 0.40625 0.511111 0.444444 0.607143 0.335274 0.247083 0.0 1 双葉杏 0.363636 0.218182 0.06250 0.466497 0.515267 0.583969 0.818393 0.386155 0.0 2 相葉⼣美 0.409091 0.563636 0.43750 0.466667 0.555556 0.535714 0.456345 0.671971 0.0 3 詩花 0.363636 0.563636 0.46875 0.488889 0.333333 0.535714 0.818393 0.378733 0.0 4 柊志乃 1.000000 0.727273 0.46875 0.533333 0.388889 0.642857 0.124563 0.020291 0.0 5 村上巴 0.181818 0.345455 0.28125 0.311111 0.333333 0.392857 0.000000 0.179931 0.0 … … … … … … … … … … … 10 結城晴 0.136364 0.236364 0.28125 0.311111 0.444444 0.464286 0.987194 0.064417 1.0 56 市原仁奈 0.000000 0.018182 0.03125 0.022222 0.555556 0.071429 0.032596 0.247083 1.0 63 櫻井桃華 0.136364 0.327273 0.34375 0.266667 0.333333 0.357143 0.456345 0.378733 1.0 ⽬的変数
  • 36. takemikamiʼs note ‒ http://takemikami.com/ 学習、回帰係数 • 学習を⾏い、回帰係数を確認します Copyright (C) Takeshi Mikami. All rights reserved. 36 学習を⾏い、回帰係数を確認するイメージを⽰します features coef coef_abs 1 height -1.798227 1.798227 0 age -1.511122 1.511122 5 hip -1.361567 1.361567 2 weight -1.319067 1.319067 3 bust -1.196319 1.196319 4 waist -0.226767 0.226767 6 birthtemp 0.033735 0.033735 7 population 0.016875 0.016875 回帰係数の絶対値降順でソート ⾝⻑、年齢が⼩さいほど U149のメンバーへの所属確率が⾼い ※体重、ヒップ、バストの回帰係数も⼤きいが、 ⾝⻑や年齢との相関が強いので深く考えないことにする
  • 37. takemikamiʼs note ‒ http://takemikami.com/ 予測 MillionStarsメンバのU149所属確率 • MillionStarsのU149所属確率を予測します Copyright (C) Takeshi Mikami. All rights reserved. 37 MillionStarsメンバのU149所属確率の予測結果を⽰します name height age 所属確率 17 中⾕育 142.0 10.0 0.194902 15 周防桃⼦ 140.0 11.0 0.194658 18 箱崎星梨花 146.0 13.0 0.121036 38 ⼤神環 147.0 12.0 0.109569 1 ⽊下ひなた 146.0 14.0 0.096007 32 エミリー 156.0 13.0 0.076840 33 望⽉杏奈 152.0 14.0 0.066882 24 ⽮吹可奈 155.0 14.0 0.066262 13 春⽇未来 156.0 14.0 0.062132 35 ロコ 154.0 15.0 0.058718 0 永吉昴 154.0 15.0 0.056618 37 ⾺場このみ 143.0 24.0 0.056469 10 七尾百合⼦ 154.0 15.0 0.053832 ※⾝⻑<149 を⾚字で⽰す ⾺場このみU149所属確率 39⼈中12位 ※正例の少ない不均衡データで学習した モデルなので所属確率は低めに出ています 1. 中⾕育 2. 周防桃⼦ 3. 箱崎星梨花 4. ⼤神環 5. ⽊下ひなた
  • 38. takemikamiʼs note ‒ http://takemikami.com/ im@sparqlのデータのみで学習した場合の問題点 • ⽤意した説明変数(特徴量)との回帰係数しかわからない (⽤意できる説明変数の次元には限りがある) →予想外の発⾒=セレンディピティーが欲しい! Copyright (C) Takeshi Mikami. All rights reserved. 38 im@sparqlのデータのみで学習した場合の問題点を⽰します ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています アイドルマスター シンデレラガールズ 6th LIVE TOUR セレンディピティー パレード
  • 39. takemikamiʼs note ‒ http://takemikami.com/ アイドル「⼩⽇向美穂」の紹介、再び Copyright (C) Takeshi Mikami. All rights reserved. 39
  • 40. takemikamiʼs note ‒ http://takemikami.com/ ⼩⽇向美穂と⾔えば Copyright (C) Takeshi Mikami. All rights reserved. 40 ⼩⽇向美穂といえば⾃然⾔語処理アイドルです ⾃然⾔語処理アイドル ⼩⽇向美穂と⾔えば ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています
  • 41. takemikamiʼs note ‒ http://takemikami.com/Copyright (C) Takeshi Mikami. All rights reserved. 41 ですよね ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています
  • 42. takemikamiʼs note ‒ http://takemikami.com/ ⼩⽇向美穂のプロフィール Copyright (C) Takeshi Mikami. All rights reserved. 42 ⼩⽇向美穂と⾔えば「熊本県」出⾝ 名前 ⼩⽇向美穂 タイプ キュート ⾝⻑ 155cm 体重 42kg ⾎液型 O 年齢 17歳 誕⽣⽇ 12⽉16⽇ 利き⼿ 左 スリーサイズ 82/59/86 星座 射⼿座 出⾝地 熊本 趣味 ひなたぼっこ CV 津⽥美波 熊本県
  • 43. takemikamiʼs note ‒ http://takemikami.com/ 熊本県で有名なもの Copyright (C) Takeshi Mikami. All rights reserved. 43 熊本県で有名なものと⾔えば、阿蘇⼭、⾟⼦蓮根、神崎蘭⼦ etc 阿蘇⼭ ⾟⼦蓮根 神崎蘭⼦ ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています 闇に飲まれよ! ※お疲れ様です
  • 44. takemikamiʼs note ‒ http://takemikami.com/ ⾃然⾔語(熊本弁&標準語)に詳しい美穂 Copyright (C) Takeshi Mikami. All rights reserved. 44 2種類の⾃然⾔語を使いこなす⼩⽇向美穂 熊本弁 標準語 熊本弁&標準語 ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています 神崎蘭⼦ ⼩⽇向美穂 渋⾕凛
  • 45. takemikamiʼs note ‒ http://takemikami.com/ ⼩⽇向美穂の⾃然⾔語処理 Copyright (C) Takeshi Mikami. All rights reserved. 45 ⼩⽇向美穂の⾃然⾔語処理を紹介します •⾃然⾔語処理で「何つながりなのかな?」を探る •アイドルを説明する⽂書からアイドルの特徴語を抽出 •選んだアイドルとそれ以外のグループで、 特徴語にどのような違いがあるのかを探す ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています
  • 46. takemikamiʼs note ‒ http://takemikami.com/ ⾃然⾔語処理を⽤いた特徴の表現⽅法 Copyright (C) Takeshi Mikami. All rights reserved. 46
  • 47. takemikamiʼs note ‒ http://takemikami.com/ TF-IDF重み付け とは • テキスト中の単語の重要度を⽰す指標 • 以下の2指標の組み合わせ • TF: テキストにおける単語の出現頻度 • IDF:単語がどのくらいのテキストに出現しているかの度合 Copyright (C) Takeshi Mikami. All rights reserved. 47 TF-IDF重み付けについて説明します 単語1 単語2 単語3 … 単語P ⽂書1 0.134322 0.00000 0.022387 … 0.000000 ⽂書2 0.120288 0.00000 0.020048 … 0.210365 … … … … … … ⽂書N-1 0.086727 0.00000 0.138762 … 0.000000 ⽂書N 0.117204 0.29516 0.023441 … 0.000000 TF-IDF⾏列の イメージ ※TF=Term Frequency、IDF=Inverted Document Frequency 特徴語を探すための指標
  • 48. takemikamiʼs note ‒ http://takemikami.com/ TF(Term Frequency)とは • テキストにおける単語の出現頻度 Copyright (C) Takeshi Mikami. All rights reserved. 48 TF(Term Frequency)について説明します テキスト ⽂書1 ⽂書2 … … ⽂書i … … ⽂書N 単語1 単語2 … 単語j … 単語P ⽂書1 … … ⽂書2 … … … … … … … … … ⽂書i … … … … … … … … … ⽂書N … … 単語の 出現回数を 数える ⽂書 TF TFij<latexit sha1_base64="+wYmJFlLk+H+OgcrQbpAgz8Dtvk=">AAACcXichVHLSgMxFD0d3/XRqhvFTWlRBEFSERRXoiAuffQFrZaZMdbodGaYSYt16A/4AwquKoiIn+HGH3DRTxCXFdy48HY6ICrqDUlOTu65OUk02xCuZKwZUrq6e3r7+gfCg0PDI5Ho6FjGtSqOztO6ZVhOTlNdbgiTp6WQBs/ZDlfLmsGz2sl6ez9b5Y4rLDMlazbfK6slUxwKXZVE7RckP5VeaqNe9MRxvRhNsHnmR+wnSAYggSC2rOgtCjiABR0VlMFhQhI2oMKllkcSDDZxe/CIcwgJf5+jjjBpK5TFKUMl9oTGEq3yAWvSul3T9dU6nWJQd0gZwzR7YnesxR7ZPXtm77/W8vwabS81mrWOltvFyPnE7tu/qjLNEkefqj89Sxxi2fcqyLvtM+1b6B199eyitbuyM+3NsGv2Qv4brMke6AZm9VW/2eY7VwjTByS/P/dPkFmYTxLeXkysrgVf0Y8pxDFL772EVWxiC2k618ElGrgOtZRJJabEO6lKKNCM40socx/NJo/f</latexit><latexit sha1_base64="+wYmJFlLk+H+OgcrQbpAgz8Dtvk=">AAACcXichVHLSgMxFD0d3/XRqhvFTWlRBEFSERRXoiAuffQFrZaZMdbodGaYSYt16A/4AwquKoiIn+HGH3DRTxCXFdy48HY6ICrqDUlOTu65OUk02xCuZKwZUrq6e3r7+gfCg0PDI5Ho6FjGtSqOztO6ZVhOTlNdbgiTp6WQBs/ZDlfLmsGz2sl6ez9b5Y4rLDMlazbfK6slUxwKXZVE7RckP5VeaqNe9MRxvRhNsHnmR+wnSAYggSC2rOgtCjiABR0VlMFhQhI2oMKllkcSDDZxe/CIcwgJf5+jjjBpK5TFKUMl9oTGEq3yAWvSul3T9dU6nWJQd0gZwzR7YnesxR7ZPXtm77/W8vwabS81mrWOltvFyPnE7tu/qjLNEkefqj89Sxxi2fcqyLvtM+1b6B199eyitbuyM+3NsGv2Qv4brMke6AZm9VW/2eY7VwjTByS/P/dPkFmYTxLeXkysrgVf0Y8pxDFL772EVWxiC2k618ElGrgOtZRJJabEO6lKKNCM40socx/NJo/f</latexit><latexit sha1_base64="+wYmJFlLk+H+OgcrQbpAgz8Dtvk=">AAACcXichVHLSgMxFD0d3/XRqhvFTWlRBEFSERRXoiAuffQFrZaZMdbodGaYSYt16A/4AwquKoiIn+HGH3DRTxCXFdy48HY6ICrqDUlOTu65OUk02xCuZKwZUrq6e3r7+gfCg0PDI5Ho6FjGtSqOztO6ZVhOTlNdbgiTp6WQBs/ZDlfLmsGz2sl6ez9b5Y4rLDMlazbfK6slUxwKXZVE7RckP5VeaqNe9MRxvRhNsHnmR+wnSAYggSC2rOgtCjiABR0VlMFhQhI2oMKllkcSDDZxe/CIcwgJf5+jjjBpK5TFKUMl9oTGEq3yAWvSul3T9dU6nWJQd0gZwzR7YnesxR7ZPXtm77/W8vwabS81mrWOltvFyPnE7tu/qjLNEkefqj89Sxxi2fcqyLvtM+1b6B199eyitbuyM+3NsGv2Qv4brMke6AZm9VW/2eY7VwjTByS/P/dPkFmYTxLeXkysrgVf0Y8pxDFL772EVWxiC2k618ElGrgOtZRJJabEO6lKKNCM40socx/NJo/f</latexit><latexit sha1_base64="+wYmJFlLk+H+OgcrQbpAgz8Dtvk=">AAACcXichVHLSgMxFD0d3/XRqhvFTWlRBEFSERRXoiAuffQFrZaZMdbodGaYSYt16A/4AwquKoiIn+HGH3DRTxCXFdy48HY6ICrqDUlOTu65OUk02xCuZKwZUrq6e3r7+gfCg0PDI5Ho6FjGtSqOztO6ZVhOTlNdbgiTp6WQBs/ZDlfLmsGz2sl6ez9b5Y4rLDMlazbfK6slUxwKXZVE7RckP5VeaqNe9MRxvRhNsHnmR+wnSAYggSC2rOgtCjiABR0VlMFhQhI2oMKllkcSDDZxe/CIcwgJf5+jjjBpK5TFKUMl9oTGEq3yAWvSul3T9dU6nWJQd0gZwzR7YnesxR7ZPXtm77/W8vwabS81mrWOltvFyPnE7tu/qjLNEkefqj89Sxxi2fcqyLvtM+1b6B199eyitbuyM+3NsGv2Qv4brMke6AZm9VW/2eY7VwjTByS/P/dPkFmYTxLeXkysrgVf0Y8pxDFL772EVWxiC2k618ElGrgOtZRJJabEO6lKKNCM40socx/NJo/f</latexit> : ⽂書iにおける単語jの出現回数
  • 49. takemikamiʼs note ‒ http://takemikami.com/ IDF(Inverted Document Frequency)とは • 語句がどのくらいのテキストに出現しているかの度合 Copyright (C) Takeshi Mikami. All rights reserved. 49 IDF(Inverted Document Frequency)について説明します 単語の 出現回数を 数える ⽂書 TF 単語が出現した⽂書数を数える テキスト ⽂書1 ⽂書2 … … ⽂書i … … ⽂書N 単語1 単語2 … 単語j … 単語P ⽂書1 … … ⽂書2 … … … … … … … … … ⽂書i … … … … … … … … … ⽂書N … … 単語1 単語2 … 単語j … 単語P IDF … … IDFj = log N dfj<latexit sha1_base64="iWqdNVjl8ZhGPjeSFS/YKCKXi7Q=">AAACiHichVFNS+tAFD3G7/pV39sIboJFcSW38qBP4YH4HqIb8asqWClJnNbYNAnJtOgL/QH6B1y4UhARF2517cY/4MKfIC4V3LjwJg2IinqHmTlz5p47Z2Z01zJ9SXTboDQ2Nbe0trUnOjq7unuSvT+WfafiGSJrOJbjreqaLyzTFllpSkusup7QyrolVvTS33B/pSo833TsJbnjivWyVrTNgmlokql8MpWTYlsGM/+mavkt9Y+as5yimit4mhHM1oKNQn6rluAsGqEo1I8gHYMU4phzkifIYQMODFRQhoANydiCBp/bGtIguMytI2DOY2RG+wI1JFhb4SzBGRqzJR6LvFqLWZvXYU0/Uht8isXdY6WKQbqhU3qgazqjO3r+tFYQ1Qi97PCs17XCzffs9S0+fasq8yyx+ar60rNEAb8jryZ7dyMmvIVR11f/7z8sji8MBkN0RPfs/5Bu6YpvYFcfjeN5sXCA8APS75/7I1geHUkznv+VmpiMv6IN/RjAML93BhOYxhyyfO4uznGBSyWhkJJRxuqpSkOs+Yk3oUy+AMVNlsk=</latexit><latexit sha1_base64="iWqdNVjl8ZhGPjeSFS/YKCKXi7Q=">AAACiHichVFNS+tAFD3G7/pV39sIboJFcSW38qBP4YH4HqIb8asqWClJnNbYNAnJtOgL/QH6B1y4UhARF2517cY/4MKfIC4V3LjwJg2IinqHmTlz5p47Z2Z01zJ9SXTboDQ2Nbe0trUnOjq7unuSvT+WfafiGSJrOJbjreqaLyzTFllpSkusup7QyrolVvTS33B/pSo833TsJbnjivWyVrTNgmlokql8MpWTYlsGM/+mavkt9Y+as5yimit4mhHM1oKNQn6rluAsGqEo1I8gHYMU4phzkifIYQMODFRQhoANydiCBp/bGtIguMytI2DOY2RG+wI1JFhb4SzBGRqzJR6LvFqLWZvXYU0/Uht8isXdY6WKQbqhU3qgazqjO3r+tFYQ1Qi97PCs17XCzffs9S0+fasq8yyx+ar60rNEAb8jryZ7dyMmvIVR11f/7z8sji8MBkN0RPfs/5Bu6YpvYFcfjeN5sXCA8APS75/7I1geHUkznv+VmpiMv6IN/RjAML93BhOYxhyyfO4uznGBSyWhkJJRxuqpSkOs+Yk3oUy+AMVNlsk=</latexit><latexit sha1_base64="iWqdNVjl8ZhGPjeSFS/YKCKXi7Q=">AAACiHichVFNS+tAFD3G7/pV39sIboJFcSW38qBP4YH4HqIb8asqWClJnNbYNAnJtOgL/QH6B1y4UhARF2517cY/4MKfIC4V3LjwJg2IinqHmTlz5p47Z2Z01zJ9SXTboDQ2Nbe0trUnOjq7unuSvT+WfafiGSJrOJbjreqaLyzTFllpSkusup7QyrolVvTS33B/pSo833TsJbnjivWyVrTNgmlokql8MpWTYlsGM/+mavkt9Y+as5yimit4mhHM1oKNQn6rluAsGqEo1I8gHYMU4phzkifIYQMODFRQhoANydiCBp/bGtIguMytI2DOY2RG+wI1JFhb4SzBGRqzJR6LvFqLWZvXYU0/Uht8isXdY6WKQbqhU3qgazqjO3r+tFYQ1Qi97PCs17XCzffs9S0+fasq8yyx+ar60rNEAb8jryZ7dyMmvIVR11f/7z8sji8MBkN0RPfs/5Bu6YpvYFcfjeN5sXCA8APS75/7I1geHUkznv+VmpiMv6IN/RjAML93BhOYxhyyfO4uznGBSyWhkJJRxuqpSkOs+Yk3oUy+AMVNlsk=</latexit><latexit sha1_base64="iWqdNVjl8ZhGPjeSFS/YKCKXi7Q=">AAACiHichVFNS+tAFD3G7/pV39sIboJFcSW38qBP4YH4HqIb8asqWClJnNbYNAnJtOgL/QH6B1y4UhARF2517cY/4MKfIC4V3LjwJg2IinqHmTlz5p47Z2Z01zJ9SXTboDQ2Nbe0trUnOjq7unuSvT+WfafiGSJrOJbjreqaLyzTFllpSkusup7QyrolVvTS33B/pSo833TsJbnjivWyVrTNgmlokql8MpWTYlsGM/+mavkt9Y+as5yimit4mhHM1oKNQn6rluAsGqEo1I8gHYMU4phzkifIYQMODFRQhoANydiCBp/bGtIguMytI2DOY2RG+wI1JFhb4SzBGRqzJR6LvFqLWZvXYU0/Uht8isXdY6WKQbqhU3qgazqjO3r+tFYQ1Qi97PCs17XCzffs9S0+fasq8yyx+ar60rNEAb8jryZ7dyMmvIVR11f/7z8sji8MBkN0RPfs/5Bu6YpvYFcfjeN5sXCA8APS75/7I1geHUkznv+VmpiMv6IN/RjAML93BhOYxhyyfO4uznGBSyWhkJJRxuqpSkOs+Yk3oUy+AMVNlsk=</latexit> dfj<latexit sha1_base64="GfSSjaei2tjDcNfLlBpw7DBKZ5I=">AAACaHichVG7SgNBFD1ZXzE+ErVQsQkJESuZiKBYiTaWeRgTiCHsbiZxzGZ32d0ENPgDNpYqVgoi4mfY+AMWfoJaRrCx8O5mQTSod5iZM2fuuXNmRjE1YTuMPQWkvv6BwaHgcGhkdGw8HJmY3LGNpqXynGpohlVQZJtrQuc5RzgaL5gWlxuKxvNKfdPdz7e4ZQtD33YOTF5qyDVdVIUqO0TlKtXyfqgcibNF5kW0FyR9EIcfKSNyg11UYEBFEw1w6HAIa5BhUysiCQaTuBLaxFmEhLfPcYQQaZuUxSlDJrZOY41WRZ/Vae3WtD21Sqdo1C1SRpFgj+yWddgDu2PP7OPXWm2vhuvlgGalq+VmOXw8k33/V9Wg2cHel+pPzw6qWPW8CvJueox7C7Wrbx2edrJrmUR7nl2xV/J/yZ7YPd1Ab72p12meuYD7Acmfz90LdpYWk4TTy/H1Df8rgphDDAv03itYxxZSyNG5Aic4w3ngRYpI09JsN1UK+JopfAsp9gnZ8YtF</latexit><latexit sha1_base64="GfSSjaei2tjDcNfLlBpw7DBKZ5I=">AAACaHichVG7SgNBFD1ZXzE+ErVQsQkJESuZiKBYiTaWeRgTiCHsbiZxzGZ32d0ENPgDNpYqVgoi4mfY+AMWfoJaRrCx8O5mQTSod5iZM2fuuXNmRjE1YTuMPQWkvv6BwaHgcGhkdGw8HJmY3LGNpqXynGpohlVQZJtrQuc5RzgaL5gWlxuKxvNKfdPdz7e4ZQtD33YOTF5qyDVdVIUqO0TlKtXyfqgcibNF5kW0FyR9EIcfKSNyg11UYEBFEw1w6HAIa5BhUysiCQaTuBLaxFmEhLfPcYQQaZuUxSlDJrZOY41WRZ/Vae3WtD21Sqdo1C1SRpFgj+yWddgDu2PP7OPXWm2vhuvlgGalq+VmOXw8k33/V9Wg2cHel+pPzw6qWPW8CvJueox7C7Wrbx2edrJrmUR7nl2xV/J/yZ7YPd1Ab72p12meuYD7Acmfz90LdpYWk4TTy/H1Df8rgphDDAv03itYxxZSyNG5Aic4w3ngRYpI09JsN1UK+JopfAsp9gnZ8YtF</latexit><latexit sha1_base64="GfSSjaei2tjDcNfLlBpw7DBKZ5I=">AAACaHichVG7SgNBFD1ZXzE+ErVQsQkJESuZiKBYiTaWeRgTiCHsbiZxzGZ32d0ENPgDNpYqVgoi4mfY+AMWfoJaRrCx8O5mQTSod5iZM2fuuXNmRjE1YTuMPQWkvv6BwaHgcGhkdGw8HJmY3LGNpqXynGpohlVQZJtrQuc5RzgaL5gWlxuKxvNKfdPdz7e4ZQtD33YOTF5qyDVdVIUqO0TlKtXyfqgcibNF5kW0FyR9EIcfKSNyg11UYEBFEw1w6HAIa5BhUysiCQaTuBLaxFmEhLfPcYQQaZuUxSlDJrZOY41WRZ/Vae3WtD21Sqdo1C1SRpFgj+yWddgDu2PP7OPXWm2vhuvlgGalq+VmOXw8k33/V9Wg2cHel+pPzw6qWPW8CvJueox7C7Wrbx2edrJrmUR7nl2xV/J/yZ7YPd1Ab72p12meuYD7Acmfz90LdpYWk4TTy/H1Df8rgphDDAv03itYxxZSyNG5Aic4w3ngRYpI09JsN1UK+JopfAsp9gnZ8YtF</latexit><latexit sha1_base64="GfSSjaei2tjDcNfLlBpw7DBKZ5I=">AAACaHichVG7SgNBFD1ZXzE+ErVQsQkJESuZiKBYiTaWeRgTiCHsbiZxzGZ32d0ENPgDNpYqVgoi4mfY+AMWfoJaRrCx8O5mQTSod5iZM2fuuXNmRjE1YTuMPQWkvv6BwaHgcGhkdGw8HJmY3LGNpqXynGpohlVQZJtrQuc5RzgaL5gWlxuKxvNKfdPdz7e4ZQtD33YOTF5qyDVdVIUqO0TlKtXyfqgcibNF5kW0FyR9EIcfKSNyg11UYEBFEw1w6HAIa5BhUysiCQaTuBLaxFmEhLfPcYQQaZuUxSlDJrZOY41WRZ/Vae3WtD21Sqdo1C1SRpFgj+yWddgDu2PP7OPXWm2vhuvlgGalq+VmOXw8k33/V9Wg2cHel+pPzw6qWPW8CvJueox7C7Wrbx2edrJrmUR7nl2xV/J/yZ7YPd1Ab72p12meuYD7Acmfz90LdpYWk4TTy/H1Df8rgphDDAv03itYxxZSyNG5Aic4w3ngRYpI09JsN1UK+JopfAsp9gnZ8YtF</latexit> : 単語jを含む⽂書数
  • 50. takemikamiʼs note ‒ http://takemikami.com/ TF-IDFとは • TFとIDFを組み合わせた指標 Copyright (C) Takeshi Mikami. All rights reserved. 50 TF-IDFについて説明します TF-IDFij = TFij ⇥ IDFj<latexit sha1_base64="GVQZHdFmBnY7wt63HoVwIFry/w0=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtox5SkVpRUh7jperq41cZXZ2bVKtgqhLhBWDElmbmpxQpAqfjqrNp4AWUDPQMwUMBkGEIZygxQEJAvsJwhhiGFIZ8hmaGUIZchlSGPoQTIzmFIZCgGwmgGQwYDhgKgWCxDNVCsCMjKBMunMtQycAH1lgJVpQJVJAJFs4FkOpAXDRXNA/JBZhaDdScDbckB4iKgTgUGVYOrBisNPhucMFht8NLgD06zqsFmgNxSCaSTIHpTC+L5uySCvxPUlQukSxgyELrwurmEIY3BAuzWTKDbC8AiIF8kQ/SXVU3/HGwVpFqtZrDI4DXQ/QsNbhocBvogr+xL8tLA1KDZDFzACDBED25MRpiRniGQHWii7OAEjQoOBmkGJQYNYHibMzgweDAEMIQC7Z3IsJ3hAMNBJiEmCyZ7JkeIUiZGqB5hBhTA5AUAuSWZxg==</latexit><latexit sha1_base64="GVQZHdFmBnY7wt63HoVwIFry/w0=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtox5SkVpRUh7jperq41cZXZ2bVKtgqhLhBWDElmbmpxQpAqfjqrNp4AWUDPQMwUMBkGEIZygxQEJAvsJwhhiGFIZ8hmaGUIZchlSGPoQTIzmFIZCgGwmgGQwYDhgKgWCxDNVCsCMjKBMunMtQycAH1lgJVpQJVJAJFs4FkOpAXDRXNA/JBZhaDdScDbckB4iKgTgUGVYOrBisNPhucMFht8NLgD06zqsFmgNxSCaSTIHpTC+L5uySCvxPUlQukSxgyELrwurmEIY3BAuzWTKDbC8AiIF8kQ/SXVU3/HGwVpFqtZrDI4DXQ/QsNbhocBvogr+xL8tLA1KDZDFzACDBED25MRpiRniGQHWii7OAEjQoOBmkGJQYNYHibMzgweDAEMIQC7Z3IsJ3hAMNBJiEmCyZ7JkeIUiZGqB5hBhTA5AUAuSWZxg==</latexit><latexit sha1_base64="GVQZHdFmBnY7wt63HoVwIFry/w0=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtox5SkVpRUh7jperq41cZXZ2bVKtgqhLhBWDElmbmpxQpAqfjqrNp4AWUDPQMwUMBkGEIZygxQEJAvsJwhhiGFIZ8hmaGUIZchlSGPoQTIzmFIZCgGwmgGQwYDhgKgWCxDNVCsCMjKBMunMtQycAH1lgJVpQJVJAJFs4FkOpAXDRXNA/JBZhaDdScDbckB4iKgTgUGVYOrBisNPhucMFht8NLgD06zqsFmgNxSCaSTIHpTC+L5uySCvxPUlQukSxgyELrwurmEIY3BAuzWTKDbC8AiIF8kQ/SXVU3/HGwVpFqtZrDI4DXQ/QsNbhocBvogr+xL8tLA1KDZDFzACDBED25MRpiRniGQHWii7OAEjQoOBmkGJQYNYHibMzgweDAEMIQC7Z3IsJ3hAMNBJiEmCyZ7JkeIUiZGqB5hBhTA5AUAuSWZxg==</latexit><latexit sha1_base64="GVQZHdFmBnY7wt63HoVwIFry/w0=">AAACkHicSyrIySwuMTC4ycjEzMLKxs7BycXNw8vHLyAoFFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKxQtox5SkVpRUh7jperq41cZXZ2bVKtgqhLhBWDElmbmpxQpAqfjqrNp4AWUDPQMwUMBkGEIZygxQEJAvsJwhhiGFIZ8hmaGUIZchlSGPoQTIzmFIZCgGwmgGQwYDhgKgWCxDNVCsCMjKBMunMtQycAH1lgJVpQJVJAJFs4FkOpAXDRXNA/JBZhaDdScDbckB4iKgTgUGVYOrBisNPhucMFht8NLgD06zqsFmgNxSCaSTIHpTC+L5uySCvxPUlQukSxgyELrwurmEIY3BAuzWTKDbC8AiIF8kQ/SXVU3/HGwVpFqtZrDI4DXQ/QsNbhocBvogr+xL8tLA1KDZDFzACDBED25MRpiRniGQHWii7OAEjQoOBmkGJQYNYHibMzgweDAEMIQC7Z3IsJ3hAMNBJiEmCyZ7JkeIUiZGqB5hBhTA5AUAuSWZxg==</latexit> 単語1 単語2 単語3 … 単語P ⽂書1 0.134322 0.00000 0.022387 … 0.000000 ⽂書2 0.120288 0.00000 0.020048 … 0.210365 … … … … … … ⽂書N-1 0.086727 0.00000 0.138762 … 0.000000 ⽂書N 0.117204 0.29516 0.023441 … 0.000000 TF-IDF⾏列の イメージ →テキスト中の単語の重要度を⽰す
  • 51. takemikamiʼs note ‒ http://takemikami.com/Copyright (C) Takeshi Mikami. All rights reserved. 51 ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています 放課後クライマックスガールズ
  • 52. takemikamiʼs note ‒ http://takemikami.com/ TF-IDFの例: 放課後クライマックスガールズ 1/6 • アイドルを説明するテキストを⽤意 Copyright (C) Takeshi Mikami. All rights reserved. 52 「放課後クライマックスガールズ」を題材にTF-IDFを計算します label desc 0 有栖川夏葉 裕福な家庭に⽣まれた社⻑令嬢。家名に誇りを持ち、⾃らもその肩書に恥じぬ よう⽇々鍛錬を積んでいる。スタイルがよく、引き締まっている。⼤学2年⽣。 1 ⻄城樹⾥ ボーイッシュでクールな⼥の⼦。⾔葉遣いが乱暴なので⼈に怖がられることが 多いが、根は純情で、素直になれないタイプ。⾼校2年⽣。 2 園⽥智代⼦ クラスに⼀⼈はいるごく普通の⼥の⼦。明るく親しみやすい性格で、⽢いもの が⼤好き。名前にちなんで、チョコ好きアイドルを売りにしている。⾼校2年⽣。 3 ⼩宮果穂 ⼤⼈びた容姿と⾼い⾝⻑が特徴の⼥の⼦。何にでも興味津々で純粋な様⼦は、 まるで⼦⽝のよう。特撮モノが⼤好きでヒーローに憧れている。⼩学6年⽣。 4 杜野凛世 落ち着いた佇まいの⼤和撫⼦。常に礼儀正しく、⼀歩引いて相⼿を⽴てる性格。 少⼥漫画好きという意外な趣味を持つ。⾼校1年⽣。
  • 53. takemikamiʼs note ‒ http://takemikami.com/ TF-IDFの例: 放課後クライマックスガールズ 2/6 • テキストを語句に分かち書き Copyright (C) Takeshi Mikami. All rights reserved. 53 「放課後クライマックスガールズ」を題材にTF-IDFを計算します label desc 0 有栖川夏葉 裕福 家庭 ⽣まれる 社⻑ 令嬢 家名 誇り 持つ ⾃ら その 肩書 恥じる ⽇々 鍛錬 積む スタイル よい 引き締まる ⼤学 1 ⻄城樹⾥ ボーイッシュ クール ⼥の⼦ ⾔葉 乱暴 ⼈ 怖がる 多い 根 純情 素直 なれる タイ プ ⾼校 2 園⽥智代⼦ クラス ごく 普通 ⼥の⼦ 明るい 親しむ 性格 ⽢い ⼤好き 名前 ちなむ チョコ 売 る ⾼校 3 ⼩宮果穂 ⼤⼈びる 容姿 ⾼い ⾝⻑ 特徴 ⼥の⼦ 何 興味津々 純粋 様⼦ まるで ⼦⽝ 特撮 モノ ⼤好き ヒーロー 憧れる ⼩学 4 杜野凛世 落ち着く 佇まい ⼤和撫⼦ 常に 礼儀 正しい 引く 相⼿ ⽴てる 性格 少⼥ 漫画 意 外 趣味 持つ ⾼校
  • 54. takemikamiʼs note ‒ http://takemikami.com/ TF-IDFの例: 放課後クライマックスガールズ 3/6 • TFを計算 Copyright (C) Takeshi Mikami. All rights reserved. 54 「放課後クライマックスガールズ」を題材にTF-IDFを計算します label クライマッ クスガール ズ ⼤和撫⼦ ⾝⻑ チョコ 鍛錬 ボーイッ シュ 0 有栖川夏葉 6 0 1 0 2 0 1 ⻄城樹⾥ 6 0 1 0 0 5 2 園⽥智代⼦ 5 0 4 8 0 0 3 ⼩宮果穂 5 0 8 0 0 0 4 杜野凛世 5 6 1 0 0 0 ※公式の紹介⽂にピクシブ百科事典の内容を追加し、集計しています
  • 55. takemikamiʼs note ‒ http://takemikami.com/ TF-IDFの例: 放課後クライマックスガールズ 4/6 • TF-IDFを計算 Copyright (C) Takeshi Mikami. All rights reserved. 55 「放課後クライマックスガールズ」を題材にTF-IDFを計算します label クライマッ クスガール ズ ⼤和撫⼦ ⾝⻑ チョコ 鍛錬 ボーイッ シュ 0 有栖川夏葉 0.134322 0.00000 0.022387 0.000000 0.093963 0.000000 1 ⻄城樹⾥ 0.120288 0.00000 0.020048 0.000000 0.000000 0.210365 2 園⽥智代⼦ 0.090495 0.00000 0.072396 0.303863 0.000000 0.000000 3 ⼩宮果穂 0.086727 0.00000 0.138762 0.000000 0.000000 0.000000 4 杜野凛世 0.117204 0.29516 0.023441 0.000000 0.000000 0.000000 TFでは、クライマックスガールズ > ボーイッシュ TF-IDFでは、クライマックスガールズ < ボーイッシュ →出現する⽂書が少ない語句が重視される
  • 56. takemikamiʼs note ‒ http://takemikami.com/ TF-IDFの例: 放課後クライマックスガールズ 5/6 Copyright (C) Takeshi Mikami. All rights reserved. 56 「放課後クライマックスガールズ」を題材にTF-IDFを計算します TFの ワードクラウド
  • 57. takemikamiʼs note ‒ http://takemikami.com/ TF-IDFの例: 放課後クライマックスガールズ 6/6 Copyright (C) Takeshi Mikami. All rights reserved. 57 「放課後クライマックスガールズ」を題材にTF-IDFを計算します TF-IDFの ワードクラウド
  • 58. takemikamiʼs note ‒ http://takemikami.com/ TF-IDF重み付けを特徴量とした場合の問題点 •出現単語の次元を持つので⾼次元になる •同じ単語が出現しなければ共通の特徴を抽出できない (似た単語を考慮できない) Copyright (C) Takeshi Mikami. All rights reserved. 58 TF-IDF重み付けを特徴量とした場合の問題点を⽰します x1 x2 x3 … xp y #1 1 3 1 … 2 2 #2 2 5 4 … 4 1 … … … … … … … #n-1 4 8 4 … 8 3 #n 5 11 2 … 10 5 説明変数 ⽬的変数 観測事象 TF-IDF ?
  • 59. takemikamiʼs note ‒ http://takemikami.com/ 単語の分散表現 • 「単語の意味」をベクトルで表現したもの • 単語同⼠の数値的な⽐較、加減算が可能になる Copyright (C) Takeshi Mikami. All rights reserved. 59 単語の分散表現について説明します 次元x 次元y 単語a 単語b 単語c 単語d 単語b 単語c 単語d 単語a 単語の分散表現 次元X 次元Y
  • 60. takemikamiʼs note ‒ http://takemikami.com/ 単語の分散表現 • 単語同⼠の数値的な⽐較、加減算の例 Copyright (C) Takeshi Mikami. All rights reserved. 60 単語の分散表現について説明します 単語b 単語c 単語d 単語a 次元X 次元Y Queen King 次元X 次元Y 単語間の類似度計算 単語間の加減算 Woman Man Man Woman King-Man Queen-Woman 類似度 単語c-a > 単語c-d
  • 61. takemikamiʼs note ‒ http://takemikami.com/ 1-of-N と bag-of-words表現 Copyright (C) Takeshi Mikami. All rights reserved. 61 1-of-N と bag-of-words表現について説明します bag-of-wordは TF(Term Frequency)と等価 label 1 2 3 4 5 6 クライマック スガールズ 1 0 0 0 0 0 ⼤和撫⼦ 0 1 0 0 0 0 ⾝⻑ 0 0 1 0 0 0 チョコ 0 0 0 1 0 0 鍛錬 0 0 0 0 1 0 ボーイッシュ 0 0 0 0 0 1 label 1 2 3 4 5 6 杜野凛世 5 6 1 0 0 0 bag-of-words表現 1-of-N表現 単語をベクトルで表現する シンプルな⽅法 ⽂書をベクトルで表現
  • 62. takemikamiʼs note ‒ http://takemikami.com/ スライド窓による単語列の分割 Copyright (C) Takeshi Mikami. All rights reserved. 62 スライド窓による単語列の分割について説明します 落ち着く 佇まい ⼤和撫⼦ 常に 礼儀 正しい 引く 相⼿ ⽴てる 性格 少⼥ 漫画 意外 趣味 持つ ⾼校 … 落ち着く 佇まい ⼤和撫⼦ 常に 礼儀 佇まい ⼤和撫⼦ 常に 礼儀 正しい ⼤和撫⼦ 常に 礼儀 正しい 引く … ⽴てる 性格 少⼥ 漫画 意外 性格 少⼥ 漫画 意外 趣味 少⼥ 漫画 意外 趣味 持つ 漫画 意外 趣味 持つ ⾼校 ⼀定単語数毎に 区切った まとまりを作る
  • 63. takemikamiʼs note ‒ http://takemikami.com/ skip-gram表現 • ある単語から前後の単語の組み合わせを予測することを考える Copyright (C) Takeshi Mikami. All rights reserved. 63 skip-gram表現の考え⽅を説明します n-2 n-1 n n+1 n+2 落ち着く 佇まい ⼤和撫⼦ 常に 礼儀 佇まい ⼤和撫⼦ 常に 礼儀 正しい ⼤和撫⼦ 常に 礼儀 正しい 引く … ⽴てる 性格 少⼥ 漫画 意外 性格 少⼥ 漫画 意外 趣味 少⼥ 漫画 意外 趣味 持つ 漫画 意外 趣味 持つ ⾼校
  • 64. takemikamiʼs note ‒ http://takemikami.com/ skip-gram表現 • 前後の単語の組み合わせを予測するニューラルネットを構成する Copyright (C) Takeshi Mikami. All rights reserved. 64 skip-gram表現の考え⽅を説明します ………… … … … … 単語n 1-of-N 単語n-2 1-of-N 単語n-1 1-of-N 単語n+1 1-of-N 単語n+2 1-of-N 分散表現
  • 65. takemikamiʼs note ‒ http://takemikami.com/ skip-gram表現 • skip-gramのニューラルネットを ベクトル・⾏列で表現すると Copyright (C) Takeshi Mikami. All rights reserved. 65 skip-gram表現の考え⽅を説明します 0 1 0 0 0 0 0 0 0 1 0 0 × → × → 1 0 0 0 0 0× → 0 0 0 0 1 0× → 0 0 1 0 0 0× → 単語n 1-of-N 単語n-2 単語n-1 単語n+1 単語n+2 重み 重み 重み 重み 重み分散表現
  • 66. takemikamiʼs note ‒ http://takemikami.com/ 分散表現によるTF-IDFの次元削減 • 単語の分散表現との積をとることで、TF-IDFの次元削減が出来る Copyright (C) Takeshi Mikami. All rights reserved. 66 単語の分散表現によるTF-IDFの次元削減イメージを⽰します 次元1 次元2 単語1 0.022 0.138 単語2 0.020 0.023 … … … 単語p 0.295 0.023 単語1 単語2 … 単語p ⽂書1 0.134 0.000 … 0.000 ⽂書2 0.120 0.000 … 0.210 … … … … … ⽂書N-1 0.086 0.000 … 0.000 ⽂書N 0.117 0.295 … 0.000 次元1 次元2 ⽂書1 0.086 0.210 ⽂書2 0.117 0.295 … … … ⽂書N-1 0.022 0.134 ⽂書N 0.020 0.120 =× 単語の分散表現TF-IDF 特徴⾏列 ※表中の数値はイメージを⽰すために⼊れているもの、意味はありません
  • 67. takemikamiʼs note ‒ http://takemikami.com/ 分散表現による回帰係数の説明 • 回帰係数を分散表現の空間に配置、類似単語から説明 Copyright (C) Takeshi Mikami. All rights reserved. 67 分散表現による回帰係数の説明イメージを⽰します 次元0 次元1 次元2 … 次元p 1 𝑥% 𝑥. 𝑥& 回帰係数 重み0 𝑤+ 重み1 𝑤% 重み2 𝑤. … 重みp 𝑤& × = 𝑣 所属確率 𝑦 𝜎 特徴ベクトル 単語b 単語c 単語d 単語a 次元1 次元2 回帰係数ベクトル 回帰係数ベクトルを分散表現の空間に配置 類似単語から、回帰係数ベクトルを説明
  • 68. takemikamiʼs note ‒ http://takemikami.com/ 七尾百合⼦と誰かの「何つながりなのかな?」を探る • プロセス • 七尾百合⼦とミリオンライブに登場するアイドル誰か⼀⼈の組み合わせを作る • 組み合わせと、それ以外のアイドルを分類するモデルの回帰係数を求める • 回帰係数ベクトルに類似する単語を上位20位までをWordCloudで⽰す • 対象データ • 「ニコニコ⼤百科」 • ミリシタのアイドルの台詞テキスト • 分散表現のモデル • 学習対象テキスト:Wikipediaの⽂章 • 単語数: 約5万語 • 次元数: 300次元 Copyright (C) Takeshi Mikami. All rights reserved. 68 七尾百合⼦と誰かの「何つながりなのかな?」を探る⽅法を⽰します Pre-trained word vectors https://github.com/Kyubyong/wordvectors
  • 69. takemikamiʼs note ‒ http://takemikami.com/Copyright (C) Takeshi Mikami. All rights reserved. 69 七尾百合⼦ ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています
  • 70. takemikamiʼs note ‒ http://takemikami.com/Copyright (C) Takeshi Mikami. All rights reserved. 70 七尾百合⼦ ※Webサイト・ゲームソフトの キャプチャ画像は公開を省略しています
  • 71. takemikamiʼs note ‒ http://takemikami.com/ 何つながりなのかな? 1/9 Copyright (C) Takeshi Mikami. All rights reserved. 71 天海春⾹, 如⽉千早, 星井美希, 萩原雪歩, ⾼槻やよい, 菊地真 x七尾百合⼦
  • 72. takemikamiʼs note ‒ http://takemikami.com/ 何つながりなのかな? 2/9 Copyright (C) Takeshi Mikami. All rights reserved. 72 ⽔瀬伊織, 四条貴⾳, 秋⽉律⼦, 三浦あずさ, 双海亜美, 双海真美 x七尾百合⼦
  • 73. takemikamiʼs note ‒ http://takemikami.com/ 何つながりなのかな? 3/9 Copyright (C) Takeshi Mikami. All rights reserved. 73 我那覇響, 春⽇未来, 最上静⾹, 伊吹翼, ⽥中琴葉, 島原エレナ x七尾百合⼦
  • 74. takemikamiʼs note ‒ http://takemikami.com/ 何つながりなのかな? 4/9 Copyright (C) Takeshi Mikami. All rights reserved. 74 佐⽵美奈⼦, 所恵美, 徳川まつり, 箱崎星梨花, 野々原茜, 望⽉杏奈 x七尾百合⼦
  • 75. takemikamiʼs note ‒ http://takemikami.com/ 何つながりなのかな? 5/9 Copyright (C) Takeshi Mikami. All rights reserved. 75 ロコ, 七尾百合⼦, ⾼⼭紗代⼦, 松⽥亜利沙, ⾼坂海美, 中⾕育x七尾百合⼦
  • 76. takemikamiʼs note ‒ http://takemikami.com/ 何つながりなのかな? 6/9 Copyright (C) Takeshi Mikami. All rights reserved. 76 天空橋朋花, エミリー, 北沢志保, 舞浜歩, ⽊下ひなた, ⽮吹可奈 x七尾百合⼦
  • 77. takemikamiʼs note ‒ http://takemikami.com/ 何つながりなのかな? 7/9 Copyright (C) Takeshi Mikami. All rights reserved. 77 横⼭奈緒, ⼆階堂千鶴, ⾺場このみ, ⼤神環, 豊川⾵花, 宮尾美也 x七尾百合⼦
  • 78. takemikamiʼs note ‒ http://takemikami.com/ 何つながりなのかな? 8/9 Copyright (C) Takeshi Mikami. All rights reserved. 78 福⽥のり⼦, 真壁瑞希, 篠宮可憐, 百瀬莉緒, 永吉昴, 北上麗花 x七尾百合⼦
  • 79. takemikamiʼs note ‒ http://takemikami.com/ 何つながりなのかな? 9/9 Copyright (C) Takeshi Mikami. All rights reserved. 79 周防桃⼦, ジュリア, ⽩⽯紬, 桜守歌織 x七尾百合⼦
  • 80. takemikamiʼs note ‒ http://takemikami.com/ まとめ Copyright (C) Takeshi Mikami. All rights reserved. 80
  • 81. takemikamiʼs note ‒ http://takemikami.com/ まとめ •⼩⽇向美穂は データサイエンス&⾃然⾔語処理アイドル •セレンディピティーは楽しい! •⼥の⼦はいつだって放課後がクライマックス! •アイドル同⼠がどんなテーマで話をしてそうかを、 機械学習で(ある程度)探ることが出来る Copyright (C) Takeshi Mikami. All rights reserved. 81 本セッションのまとめです
  • 82. takemikamiʼs note ‒ http://takemikami.com/ 参考⽂献・Webサイトリスト • 参考⽂献 • ⾦明哲「テキストアナリティクス」共⽴出版 2018 • ⼩⾼知宏「⾃然⾔語処理と深層学習」オーム社 2017 • 参考Webサイト • Hadley Wickham「Tidy Data」2014 https://www.jstatsoft.org/article/view/v059i10 • 三上威「『何つながりなのかな?』を探る⾃然⾔語処理 〜765PRO LIVE THEATERに通りがかる⼩⽇向美穂〜」2019 https://takemikami.com/2019/02/21/765PRO-LIVE-THEATER.html Copyright (C) Takeshi Mikami. All rights reserved. 82 本資料作成にあたって参考にした⽂献・Webサイトのリストです
  • 83. takemikamiʼs note ‒ http://takemikami.com/Copyright (C) Takeshi Mikami. All rights reserved. 83 (よし、楽しく話せたな)