SlideShare ist ein Scribd-Unternehmen logo
1 von 10
+
Jubaanomalyで
キーストローク認証
小田哲(@oda_satoshi)
+
jubaanomaly
 Breunigらによって提案された、データサンプルの周辺データ
集合の密集度に応じた異常値を割り振る異常検出アルゴリズム
LOF(Local Outlier Factor)をサポート
 オンライン処理、分散処理ができるように改良
 0.4.0に新機能として追加
+
キーストローク認証
 個人ごとにキーボードの打鍵リズムは異なる、という仮説を利
用した認証
 特殊なハードウェアが不要なため、Web越しの認証として優秀
 精度は指紋、静脈などの生体認証に比べれば低いがリスクベース認
証におけるリスク算出の一要素としてならば十分利用できる
+
予備実験:
0
50000
100000
150000
200000
250000
300000
350000
1
2
3
4
5
㍃秒
‘oda.satoshi’を5回入力した時の、タイプ間隔分布
+
そのまま入れてもダメらしい
 [[inf], [inf], [inf], [inf], [inf], [inf], [inf], [inf], [inf], [inf]]
 (´・ω・`)
 パラメタチューニング
 LOFのパラメタを調整する。
 fv_converterを調整する。
+
LOFのparameterを調整
 "parameter" : {
"nearest_neighbor_num" : 10,
"reverse_nearest_neighbor_num" : 30,
"method" : "euclid_lsh",
"parameter" : {
"lsh_num" : 512,
"table_num" : 4,
"seed" : 1091,
"probe_num" : 1,
"bin_width" : 256,
"retain_projection" : false }
}
+
距離をすべての点に対して追加
のたびに更新すると、オンライ
ン処理しきれない(時間に間に
合わない)ので
の点から近い順に10点が
(10近傍)のみ更新する。
対象の周辺点の密度の均一度
"nearest_neighbor_num" : 3,
"reverse_nearest_neighbor_num" : 10,
の点から近い順に3点が(3
近傍)がLOFの密度を計算する
ために使われる点。
+
Euclid-LSHのパラメタ
fv [a, b, c, …] seedを元に整数値に
ランダム射影
[0,…bin_width]
lsh_num個
probe_num
table_num
retain_projectionが
falseだと毎回導出
基本的には演算時間、メモリを食う分、精度があがる可能性がある。
bin_widthだけは、適切な量子化幅を設定しないとまともな値が出ない。
+
converterの調整
 FAQ(http://jubat.us/ja/faq.html)
 1: それぞれの特徴値を正規化する
 近傍探索は各特徴のスケールの違いに影響されます。全ての特徴値
を正規化 (0.0 から 1.0 に制限) するか、標準化 (標準偏差が約 1.0 と
なるように) するのが望ましいでしょう。
 converterの設定
"num_types": {
"KEYINPUT": {
"method": "dynamic",
"path": "libnormalize_num_feature.so",
"function": "create",
"max": "50000.0",
"min": "0.0"
}
"num_rules": [
{"key" : "*", "type" : "KEYINPUT"}
]
+
それなりに動くように
 精度はこれから
 100回ぐらい学習しておけばあとは、それなりのスコアが出るよう
になった。一方、他人が入力すると、とても大きな値 or Infが出
る。
 Jubatus-exampleに近日公開予定

Weitere ähnliche Inhalte

Andere mochten auch

コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用JubatusOfficial
 
データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定
データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定
データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定JubatusOfficial
 
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化JubatusOfficial
 
Jubakit の紹介
Jubakit の紹介Jubakit の紹介
Jubakit の紹介kmaehashi
 
発言小町からのプロファイリング
発言小町からのプロファイリング発言小町からのプロファイリング
発言小町からのプロファイリングJubatusOfficial
 
地域の魅力を伝えるツアーガイドAI
地域の魅力を伝えるツアーガイドAI地域の魅力を伝えるツアーガイドAI
地域の魅力を伝えるツアーガイドAIJubatusOfficial
 
Jubatusでオンラインランク学習
Jubatusでオンラインランク学習Jubatusでオンラインランク学習
Jubatusでオンラインランク学習Yukihiro Tagami
 
世界征服を目指すJubatusだからこそ期待する5つのポイント
世界征服を目指すJubatusだからこそ期待する5つのポイント世界征服を目指すJubatusだからこそ期待する5つのポイント
世界征服を目指すJubatusだからこそ期待する5つのポイントNTT DATA OSS Professional Services
 
数式を使わないJubatus入門
数式を使わないJubatus入門数式を使わないJubatus入門
数式を使わないJubatus入門Kenji Aiko
 
機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual TalksYuya Unno
 
評BanにおけるJubatus活用事例
評BanにおけるJubatus活用事例評BanにおけるJubatus活用事例
評BanにおけるJubatus活用事例JubatusOfficial
 
Demystifying Systems for Interactive and Real-time Analytics
Demystifying Systems for Interactive and Real-time AnalyticsDemystifying Systems for Interactive and Real-time Analytics
Demystifying Systems for Interactive and Real-time AnalyticsDataWorks Summit
 

Andere mochten auch (19)

jubabanditの紹介
jubabanditの紹介jubabanditの紹介
jubabanditの紹介
 
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
 
データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定
データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定
データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定
 
Jubaanomalyについて
JubaanomalyについてJubaanomalyについて
Jubaanomalyについて
 
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化
 
Jubakit の紹介
Jubakit の紹介Jubakit の紹介
Jubakit の紹介
 
発言小町からのプロファイリング
発言小町からのプロファイリング発言小町からのプロファイリング
発言小町からのプロファイリング
 
銀座のママ
銀座のママ銀座のママ
銀座のママ
 
JUBARHYME
JUBARHYMEJUBARHYME
JUBARHYME
 
小町の溜息
小町の溜息小町の溜息
小町の溜息
 
Jubatus 1.0 の紹介
Jubatus 1.0 の紹介Jubatus 1.0 の紹介
Jubatus 1.0 の紹介
 
地域の魅力を伝えるツアーガイドAI
地域の魅力を伝えるツアーガイドAI地域の魅力を伝えるツアーガイドAI
地域の魅力を伝えるツアーガイドAI
 
Jubatusでオンラインランク学習
Jubatusでオンラインランク学習Jubatusでオンラインランク学習
Jubatusでオンラインランク学習
 
世界征服を目指すJubatusだからこそ期待する5つのポイント
世界征服を目指すJubatusだからこそ期待する5つのポイント世界征服を目指すJubatusだからこそ期待する5つのポイント
世界征服を目指すJubatusだからこそ期待する5つのポイント
 
数式を使わないJubatus入門
数式を使わないJubatus入門数式を使わないJubatus入門
数式を使わないJubatus入門
 
機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks
 
Jubatus on Mavericks
Jubatus on MavericksJubatus on Mavericks
Jubatus on Mavericks
 
評BanにおけるJubatus活用事例
評BanにおけるJubatus活用事例評BanにおけるJubatus活用事例
評BanにおけるJubatus活用事例
 
Demystifying Systems for Interactive and Real-time Analytics
Demystifying Systems for Interactive and Real-time AnalyticsDemystifying Systems for Interactive and Real-time Analytics
Demystifying Systems for Interactive and Real-time Analytics
 

jubaanomalyでキーストローク認証