SlideShare ist ein Scribd-Unternehmen logo
1 von 33
Amazon ML(あるいは他社の
サービス)の簡単なデモレベル
はやったことあるけど、それっ
きりってエンジニアに聞いてほ
しいですね
自己紹介
Mr. T
大学で、文学、心理学、哲学をやってるうちに
コンピュータの思考に興味。
夢はインターネット上の言葉を覚えさせてお
しゃべりすること。
好きなAWS: SimpleDB
はじめまして
QAmazon ML 触ったことは?
何かしらソリューションにした
チュートリアルやった
マネジメントコンソールを開いた
CLIでaws mach[TAB]と打った
何もしていない
GOAL
触ったことはある。もしくは全く
触ったことがない。そんな人が、
これなら自分にも出来る。けど、
今日はビールが待ってるから、出
来ないけど明日から本気出すと
思ってくれる事。
実際にはここにいる40%くらいがやっ
てくれれば十分です。
10%before
40%after
このセッションの目的
Amazon
Machine
Learning
Amazon Machine Learning は、
どのスキルレベルの開発者でも、
機械学習テクノロジーを
簡単に使用できるようになるサービス
Amazon Machine Learning をちゃんと知
るAbout Amazon Machine Learning
Amazon ML 4つの概念
About Amazon Machine Learning
ML Models
Datasourcesのデータを使って、
機械学習のモデルを作成する。
Datasources
機械学習に利用するデータを用意する。
S3、RedShift、(RDS)に入っている必
要がある。このデータは学習にも検証に
も使われる。
Evaluations
Datasourcesのデータを利用して、
モデルの精度を検証する。
Prediction
作成されたML Modelを利用して
予測を行う。
バッチとAPIでのリアルタイムの2種
類が行える。
Datasource作成:ただのデータのままではなくて、機械学習で扱える形で保存する。
ML Modelの作成:Datasourceのデータの特徴を見つけ出し、利用できる形にする。
Evalution: ML Modelの精度をテストデータを用いて検証する。
Prediction: ML Modelを使って予測を行う。
Amazon ML 利用の流れ
Datasource
S3
from
Redshift
from
RDS
from
Datasource
S3,Redshift,RDSに格納されているデータに、MLとし
ての型(Type)を付ける事と予測の対象(Target)を指定
することで、MLで使える形とする。
From RDS
RDSからクエリで取り出す
(Management Consoleには無
い)
From Redshift
Redshiftからクエリで取り出す。
From S3
S3にあるデータを利用する。
Datasourceの作成
About Amazon Machine Learning
Datasource 4つのColumn
TypeAbout Amazon Machine Learning
Categorical
数値や文字列のように、不特
定多数の値ではなく、
特定多数(少数)の値が入って
くる。型は文字列でも数値で
も可。
Text
文字列のデータ
予測の対象(Target)には使えな
い。
Binary
2種類のみ許される。
(Yes or No)
Numeric
数値型のデータ
ML model
typeAmazon Machine Learningでは
3種類の予測モデルを作成出来る。
1. Regression(Numeric)
2. Multiclass
Classification(Categorical)
3. Binaryclass Classificatoion (Binary)
DatasourceのTargetのTypeによって自動
で変わる。
ML Modelの作成
About Amazon Machine Learning
ML Model
About Amazon Machine LearningRegression
数値型の予測
TargetがNumericの時に作られるモデル。
ビールの売上予測
売上
湿度
Aug 9 -
2015
Aug 30 -
2015
TO DONE
ML Model
About Amazon Machine Learning
モデルの検証
正解のデータを利用して、予測値と正解の
値を比較。
About Amazon Machine Learning
RMSE
Regression の検証
About Amazon Machine Learning - Evaluation
Macro average F1
score
Mulcticlass Clasification の検
証About Amazon Machine Learning - Evaluation
Binaryclass Classification の検証
About Amazon Machine Learning - Evaluation
Amazon ML 4つの概念
About Amazon Machine Learning
ML Models
Datasourcesのデータを使って、
機械学習のモデルを作成する。
Datasources
機械学習に利用するデータを用意する。
S3、RedShift、(RDS)に入っている必
要がある。このデータは学習にも検証に
も使われる。
Evaluations
Datasourcesのデータを利用して、
モデルの精度を検証する。
Prediction
作成されたML Modelを利用して
予測を行う。
バッチとAPIでのリアルタイムの2種
類が行える。
Datasource作成:ただのデータのままではなくて、機械学習で扱える形で保存する。
ML Modelの作成:Datasourceのデータの特徴を見つけ出し、利用できる形にする。
Evalution: ML Modelの精度をテストデータを用いて検証する。
Prediction: ML Modelを使って予測を行う。
Amazon ML 利用の流れ
ML Modelの
チューニング
Maximum number of data
passes
Regularization [type |
ammount ]
Recipe
チューニング方法
チューニングの方法
About Amazon Machine Learning - tuning
Amazon ML でのチューニング
特徴を検出する回数
モデルを作成するにあたり、何回もこの関
連性が強いかな?どうかな?
みたいな事をする。基本多い方が正確に
1
収束したらそこで終了
あるところで、あ、これだみたいなしっくり来る
ところがある。
それを検知した場合自動で終了
2
Maximum number of data passes
Amazon Machine Learning
L1
None 正則化
複雑すぎるモデルを使うと、訓練用のデー
タの癖に影響を受けやすい。
それをさらっといい感じにする。
L2
Regularization Type |
AmmountAbout Amazon Machine Learning
Recipeを制する者
は
Amazon Machine
Learningを制す
Recipe
Amazon Machine Learning
日本初
JSON形式で指定
Recipeのフォーマット
Amazon Machine Learning
{
groups:{},
assignments:{},
outputs:{}
}
groups:
Recipeのフォーマット
Amazon Machine Learning
groups:{
“group1”:
”group(var1,var2)”
}
ALL_TEXT,
ALL_NUMERIC,
ALL_CATEGORICAL,
ALL_BINARY
groups:
Recipeのフォーマット
Amazon Machine Learning groups:{
“group2”:
”group(ALL_CATEGORICAL,
ALL_BINARY)”,
“group3”:
“group_remove(
ALL_CATEGORICAL,
title,subject)"
}
assignments:
Recipeのフォーマット
Amazon Machine Learning "assignments": {
"binned_age":
"quantile_bin(age,30)",
"c_g_interaction":
"cartesian(country,
gender)"
Data
Transformations
Recipeのフォーマット
Amazon Machine Learning ngram(var1, 3)
osb(var1, 5)
lowercase(var1)
no_punct(var1)
normalize(ALL_NUMERIC)
outputs:
Recipeのフォーマット
Amazon Machine Learning "outputs": [
"ALL_NUMERIC" ,
“group1”,
“lowercase(var2),
var3
]
recipe
Recipeのフォーマット
Amazon Machine Learning
{ "groups": {
"NUMERIC_VARS_QB_100": "group('RecordID')",
"NUMERIC_VARS_QB_20": "group('CostBeforeTax',
'UsageQuantity','TotalCost','BlendedRate','TaxAmount')",
"NUMERIC_VARS_QB_10": "group('RateId')" },
"assignments": {},
"outputs": [ "ALL_CATEGORICAL",
"quantile_bin(NUMERIC_VARS_QB_100,100)",
"quantile_bin(NUMERIC_VARS_QB_20,20)",
"quantile_bin(NUMERIC_VARS_QB_10,10)",
"ALL_TEXT”
]
}
Amazon ML 4つの概念
About Amazon Machine Learning
ML Models
Datasourcesのデータを使って、
機械学習のモデルを作成する。
Datasources
機械学習に利用するデータを用意する。
S3、RedShift、(RDS)に入っている必
要がある。このデータは学習にも検証に
も使われる。
Evaluations
Datasourcesのデータを利用して、
モデルの精度を検証する。
Prediction
作成されたML Modelを利用して
予測を行う。
バッチとAPIでのリアルタイムの2種
類が行える。
Datasource作成:ただのデータのままではなくて、機械学習で扱える形で保存する。
ML Modelの作成:Datasourceのデータの特徴を見つけ出し、利用できる形にする。
Evalution: ML Modelの精度をテストデータを用いて検証する。
Prediction: ML Modelを使って予測を行う。
Amazon ML 利用の流れ
REAL TIME PREDICTION
API経由でのその場でのPrediction実行
BATCH PREDICTION
S3においてあるファイルからのバッチ実行
日次などで一気に予測したい場合に有用
THANK YOU FOR
YOUR ATTENTION

Weitere ähnliche Inhalte

Mehr von Takuya Tachibana

Best practices to use aws in countryside.
Best practices to use aws in countryside.Best practices to use aws in countryside.
Best practices to use aws in countryside.Takuya Tachibana
 
[JAWS-UG KANSAI]JAWS DAYS 2017の裏側
[JAWS-UG KANSAI]JAWS DAYS 2017の裏側[JAWS-UG KANSAI]JAWS DAYS 2017の裏側
[JAWS-UG KANSAI]JAWS DAYS 2017の裏側Takuya Tachibana
 
[Recap仙台]jaws days 2017の裏側
[Recap仙台]jaws days 2017の裏側[Recap仙台]jaws days 2017の裏側
[Recap仙台]jaws days 2017の裏側Takuya Tachibana
 
[re:cap会津]JAWS DAYS 2017の裏側
[re:cap会津]JAWS DAYS 2017の裏側[re:cap会津]JAWS DAYS 2017の裏側
[re:cap会津]JAWS DAYS 2017の裏側Takuya Tachibana
 
Icdp的re:invent2016 recap
Icdp的re:invent2016 recapIcdp的re:invent2016 recap
Icdp的re:invent2016 recapTakuya Tachibana
 
[クラウドお遍路]田舎案件でのAWS活用術
[クラウドお遍路]田舎案件でのAWS活用術[クラウドお遍路]田舎案件でのAWS活用術
[クラウドお遍路]田舎案件でのAWS活用術Takuya Tachibana
 
かえってきたICDP_ICDP的AWS2016年サービスアップデート
かえってきたICDP_ICDP的AWS2016年サービスアップデートかえってきたICDP_ICDP的AWS2016年サービスアップデート
かえってきたICDP_ICDP的AWS2016年サービスアップデートTakuya Tachibana
 
The use of aws in the countryside
The use of aws in the countrysideThe use of aws in the countryside
The use of aws in the countrysideTakuya Tachibana
 
JAWSDAYS2016 re:cap 仙台
JAWSDAYS2016 re:cap 仙台JAWSDAYS2016 re:cap 仙台
JAWSDAYS2016 re:cap 仙台Takuya Tachibana
 
ヘプタゴンの10大ニュースで見る東北のクラウド事情
ヘプタゴンの10大ニュースで見る東北のクラウド事情ヘプタゴンの10大ニュースで見る東北のクラウド事情
ヘプタゴンの10大ニュースで見る東北のクラウド事情Takuya Tachibana
 
東北で3年間クラウドのフルマネージドサービスをやってきて感じたこと
東北で3年間クラウドのフルマネージドサービスをやってきて感じたこと東北で3年間クラウドのフルマネージドサービスをやってきて感じたこと
東北で3年間クラウドのフルマネージドサービスをやってきて感じたことTakuya Tachibana
 
[青森ハッカソン2015]edisonで徘徊抑止センサー
[青森ハッカソン2015]edisonで徘徊抑止センサー[青森ハッカソン2015]edisonで徘徊抑止センサー
[青森ハッカソン2015]edisonで徘徊抑止センサーTakuya Tachibana
 
[Jaws re:Mote2015]田舎ならt2インスタンスを使いこなせ!
[Jaws re:Mote2015]田舎ならt2インスタンスを使いこなせ![Jaws re:Mote2015]田舎ならt2インスタンスを使いこなせ!
[Jaws re:Mote2015]田舎ならt2インスタンスを使いこなせ!Takuya Tachibana
 
もう怖くない。実例で学ぶAwsでのサイジングと料金計算
もう怖くない。実例で学ぶAwsでのサイジングと料金計算もう怖くない。実例で学ぶAwsでのサイジングと料金計算
もう怖くない。実例で学ぶAwsでのサイジングと料金計算Takuya Tachibana
 
網元で起きた不思議な話
網元で起きた不思議な話網元で起きた不思議な話
網元で起きた不思議な話Takuya Tachibana
 
Azure Machine Learningを触ってみた!
Azure Machine Learningを触ってみた!Azure Machine Learningを触ってみた!
Azure Machine Learningを触ってみた!Takuya Tachibana
 
re:Invent2014の個人的まとめ
re:Invent2014の個人的まとめre:Invent2014の個人的まとめ
re:Invent2014の個人的まとめTakuya Tachibana
 
Amazon s3 meets_azurewebsite
Amazon s3 meets_azurewebsiteAmazon s3 meets_azurewebsite
Amazon s3 meets_azurewebsiteTakuya Tachibana
 
ごった煮 on the AWS
ごった煮 on the AWSごった煮 on the AWS
ごった煮 on the AWSTakuya Tachibana
 

Mehr von Takuya Tachibana (20)

Best practices to use aws in countryside.
Best practices to use aws in countryside.Best practices to use aws in countryside.
Best practices to use aws in countryside.
 
[JAWS-UG KANSAI]JAWS DAYS 2017の裏側
[JAWS-UG KANSAI]JAWS DAYS 2017の裏側[JAWS-UG KANSAI]JAWS DAYS 2017の裏側
[JAWS-UG KANSAI]JAWS DAYS 2017の裏側
 
[Recap仙台]jaws days 2017の裏側
[Recap仙台]jaws days 2017の裏側[Recap仙台]jaws days 2017の裏側
[Recap仙台]jaws days 2017の裏側
 
[re:cap会津]JAWS DAYS 2017の裏側
[re:cap会津]JAWS DAYS 2017の裏側[re:cap会津]JAWS DAYS 2017の裏側
[re:cap会津]JAWS DAYS 2017の裏側
 
Icdp的re:invent2016 recap
Icdp的re:invent2016 recapIcdp的re:invent2016 recap
Icdp的re:invent2016 recap
 
[クラウドお遍路]田舎案件でのAWS活用術
[クラウドお遍路]田舎案件でのAWS活用術[クラウドお遍路]田舎案件でのAWS活用術
[クラウドお遍路]田舎案件でのAWS活用術
 
かえってきたICDP_ICDP的AWS2016年サービスアップデート
かえってきたICDP_ICDP的AWS2016年サービスアップデートかえってきたICDP_ICDP的AWS2016年サービスアップデート
かえってきたICDP_ICDP的AWS2016年サービスアップデート
 
The use of aws in the countryside
The use of aws in the countrysideThe use of aws in the countryside
The use of aws in the countryside
 
How to make the JAWSUG
How to make the JAWSUGHow to make the JAWSUG
How to make the JAWSUG
 
JAWSDAYS2016 re:cap 仙台
JAWSDAYS2016 re:cap 仙台JAWSDAYS2016 re:cap 仙台
JAWSDAYS2016 re:cap 仙台
 
ヘプタゴンの10大ニュースで見る東北のクラウド事情
ヘプタゴンの10大ニュースで見る東北のクラウド事情ヘプタゴンの10大ニュースで見る東北のクラウド事情
ヘプタゴンの10大ニュースで見る東北のクラウド事情
 
東北で3年間クラウドのフルマネージドサービスをやってきて感じたこと
東北で3年間クラウドのフルマネージドサービスをやってきて感じたこと東北で3年間クラウドのフルマネージドサービスをやってきて感じたこと
東北で3年間クラウドのフルマネージドサービスをやってきて感じたこと
 
[青森ハッカソン2015]edisonで徘徊抑止センサー
[青森ハッカソン2015]edisonで徘徊抑止センサー[青森ハッカソン2015]edisonで徘徊抑止センサー
[青森ハッカソン2015]edisonで徘徊抑止センサー
 
[Jaws re:Mote2015]田舎ならt2インスタンスを使いこなせ!
[Jaws re:Mote2015]田舎ならt2インスタンスを使いこなせ![Jaws re:Mote2015]田舎ならt2インスタンスを使いこなせ!
[Jaws re:Mote2015]田舎ならt2インスタンスを使いこなせ!
 
もう怖くない。実例で学ぶAwsでのサイジングと料金計算
もう怖くない。実例で学ぶAwsでのサイジングと料金計算もう怖くない。実例で学ぶAwsでのサイジングと料金計算
もう怖くない。実例で学ぶAwsでのサイジングと料金計算
 
網元で起きた不思議な話
網元で起きた不思議な話網元で起きた不思議な話
網元で起きた不思議な話
 
Azure Machine Learningを触ってみた!
Azure Machine Learningを触ってみた!Azure Machine Learningを触ってみた!
Azure Machine Learningを触ってみた!
 
re:Invent2014の個人的まとめ
re:Invent2014の個人的まとめre:Invent2014の個人的まとめ
re:Invent2014の個人的まとめ
 
Amazon s3 meets_azurewebsite
Amazon s3 meets_azurewebsiteAmazon s3 meets_azurewebsite
Amazon s3 meets_azurewebsite
 
ごった煮 on the AWS
ごった煮 on the AWSごった煮 on the AWS
ごった煮 on the AWS
 

Amazon ML(あるいは他社のサービス)の簡単なデモレベルはやったことあるけど、それっきりってエンジニアに聞いてほしいですね

Hinweis der Redaktion

  1. 機械学習はなんとなーくわかってて、Amazon ML(あるいは他社のサービス)の簡単なデモレベルはやったことあるけど、それっきりってエンジニアに聞いて欲しいですね
  2. 機械学習はなんとなーくわかってて、Amazon ML(あるいは他社のサービス)の簡単なデモレベルはやったことあるけど、それっきりってエンジニアに聞いて欲しいですね ほら、やったことない人ばっかりだ。 ターゲット明確にしたけど、やっぱりやったことない人だらけ それでいいんですよ。それが普通です
  3. メールの振り分けとかね
  4. 使いはじめる前に 本当に満足行く精度が一発で出ることなんてほとんど無い。 使い物にするためには、チューニングが必要。
  5. チューニングは3種類 選ぶだけで精度が出るかもしれないチューニング、 最後にお金で解決するチューニング。 努力で解決するチューニング
  6. もし、検証の段階ではいい感じなのに、実運用に乗せてみたらうまくいかないなと思ったら、 レギュラリゼーションを試してみる。 おそらくデモデータで試しているうちは使う必要無い。
  7. // Orthogonal Sparse Bigram
  8. 使いはじめる前に 本当に満足行く精度が一発で出ることなんてほとんど無い。 使い物にするためには、チューニングが必要。