SlideShare ist ein Scribd-Unternehmen logo
1 von 16
Downloaden Sie, um offline zu lesen
1Copyright © Acroquest Technology Co., Ltd. All rights reserved.
Elastic Stack7.6における
教師あり機械学習の紹介
Acroquest Technology株式会社
Senior Consultant / Elastic Certified Engineer
吉岡 洋 @Hirosh_Yoshioka
はじめに
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. 今日話すこと
①Anomaly Detectionの概要
②Data Frame Analyticsの概要 ← 教師あり機械学習はここ
2. 今日話さないこと
①機械学習のアルゴリズムや評価手法の詳細
目次
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. Elastic MLにおける2種類の機械学習機能
1-1. Anomaly Detection
1-2. Data Frame Analytics
2. デモ
2-1. 分類による不良品予測
自己紹介
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
⚫ 名前:吉岡 洋(よしおかひろし)
⚫ 所属:Acroquest Technology株式会社
(シニアコンサルタント)
⚫ 領域:全文検索/ビッグデータ分析/可視化
⚫ その他:
─Microsoft MVP for Powershell(2006~2010)
─「Windows PowerShell宣言!」(2007)
─IBM Certified Specialist
IBM SPSS Modeler Professional(2014~)
─Elastic Certified Engineer(2018~)
Acroquest Technology株式会社
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. 新横浜にあるITベンチャー
①Great Place To Work(R) Institute Japan実施
働きがいのある会社ランキング第1位(3回受賞)
2. 事業(データ活用ビジネス)
①Elastic Stack活用コンサルティングサービス
– 検証/設計/構築/運用支援など
– Elastic Certified Engineer:5名
②IoTデータ分析プラットフォーム
③機械学習/AI
1. Elastic MLにおける
2種類の機械学習機能
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1-1. Anomaly Detection(Ver.5.5でGAリリース)
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. 特徴
①時系列データの異常検知
②教師なし機械学習
– 閾値判定で検知できない異常を
判定/検知可能
2. サポートする異常検知
①トレンド異常検知
– 特定の周期を持った時系列データが過去と異なる振る舞いをしている
②Population Analysis
– グループ内の特定の個体が他とは異なる挙動をしている
例)特定のIPアドレスからのアクセスだけ404レスポンスの数が多い
閾値判定だと
異常検知できない
1-1. Anomaly Detection(機能強化)
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. 分析プロセスの効率化
① Data Visualizer(v6.1)
② CSVファイルのインポート機能(v6.5)
③ Annotation(v6.6)
2. モデル精度の向上
① Calendar Management(学習対象除外日の設定、v6.2)
② Custom Rule(モデル更新条件/異常検知判定のルール制御、v6.4)
③ スコア計算アルゴリズムの改善(v6.5)
– パーティション毎のスコア正規化/マルチバケット分析
3. 将来予測
① Forecast(v6.1)
1-2. Data Frame Analytics(Ver.7.3~)
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. 特徴
① 非時系列データの様々な分析
② Elastic Stack単体で学習/推論が可能
– 学習:Data frame analytics APIまたはKibana UIで実施
– 推論:Ingest Node(Inference Processor)を利用する。(v7.6)
2. サポートする分析手法
No 分析タイプ 学習 推論 Version 備考
1 Outlier Detection(外れ値検知) なし ー v7.3
2 Regression(回帰) あり 可能 v7.4
3 Classification(分類) あり 可能 v7.5 二項分類にのみ対応
4 Language identification
(言語識別)
あり
(プリセット)
可能 V7.6 109言語に対応
1-2. Data Frame Analytics(ユースケース)
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. 教師あり機械学習はBusiness Analytics領域で有用
Regression
(回帰)
Classification
(分類)
Language identification
(言語識別)
[信用リスク分析→未払いリスク低減]
債務者データから格付けスコアモデルを作成。
[アプリユーザ解約予測→解約防止キャンペーン]
顧客動向データから解約予測モデルを作成。
[問い合わせ言語判定→アサイン効率化]
問い合わせ内容を言語判定。適切な担当者をアサイン。
1-2. Data Frame Analytics(処理の流れ)
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
④推論
新規
インデックス
②Reindex 学習データ
インデックス
②分析
モデル
学習データ
インデックス
学習データ
(検証データ)
①データ登録
Ingest Node
(Inference Processor)
テストデータ
③データ登録
※②は以下のAPI
・Create data frame analytics jobs API
・Start data frame analytics jobs API
学習データ
インデックス
(+分析結果)
2. デモ
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
2-1. 分類による不良品予測
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. デモデータ(製造/試験データ:1000件)
① p1~p12:12ステップある各製造過程での評価値
② result:製造後の負荷試験結果(NGは不良品)
2. 分類を利用して不良品を予測する
① 説明変数:p1~p12
② 目的変数:result
p1 p2 p3 p4 p5 p6 p7 p8 p9 p10 p11 p12 result
1 28 1 0 1 65 158 1 12 5 B A NG
1 41 1 0 0 197 479 4 6 11 B B OK
1 44 1 0 0 0 651 6 3 7 B C OK
1 50 1 0 1 189 454 5 6 10 B C OK
1 25 1 0 1 153 368 7 4 5 B B OK
2-1. 分類による不良品予測
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. 作成したモデルに対する推論のテスト(正解はNG)
POST _ingest/pipeline/_simulate
{
"pipeline": {
"processors": [
{
"inference": {
"model_id": "★model_id★",
"inference_config": {
"classification": {}
},
"field_mappings": {}
}
}
]
},
"docs": [
{
"_source": {
"p1" : 1,
"p2" : 28,
"p3" : 1,
"p4" : 0,
"p5" : 1,
"p6" : 65,
"p7" : 158,
"p8" : 1,
"p9" : 12,
"p10" : 5,
"p11" : "B",
"p12" : "A"
}
}
]
}
まとめ
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. Elastic MLには2種類の機械学習機能がある
①Anomaly Detection(教師なし機械学習)
②Data Frame Analytics(教師あり機械学習)
※一部例外あり(Outlier Detectionは教師なし)
2. v7.6から教師あり機械学習の推論をサポート
①Elastic Stack単体での学習/推論が可能
②Data Frame Analyticsが導入されたことで、
Business Analytics領域での活用が期待できる
ご清聴ありがとうございました。
Evolve the Earth with Emotion of Technology
Copyright © Acroquest Technology Co., Ltd. All rights reserved.

Weitere ähnliche Inhalte

Was ist angesagt?

道具としての機械学習:直感的概要とその実際
道具としての機械学習:直感的概要とその実際道具としての機械学習:直感的概要とその実際
道具としての機械学習:直感的概要とその実際Ichigaku Takigawa
 
アジャイル開発とメトリクス
アジャイル開発とメトリクスアジャイル開発とメトリクス
アジャイル開発とメトリクスRakuten Group, Inc.
 
データサイエンティストとエンジニア 両者が幸せになれる機械学習基盤を求めて
データサイエンティストとエンジニア 両者が幸せになれる機械学習基盤を求めてデータサイエンティストとエンジニア 両者が幸せになれる機械学習基盤を求めて
データサイエンティストとエンジニア 両者が幸せになれる機械学習基盤を求めてRecruit Lifestyle Co., Ltd.
 
SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査
SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査
SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査Hironori Washizaki
 
Re: ゼロから始める監視設計
Re: ゼロから始める監視設計Re: ゼロから始める監視設計
Re: ゼロから始める監視設計Masahito Zembutsu
 
ゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せますゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せますinfinite_loop
 
Databricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptxDatabricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptxotato
 
込山 俊博, ISO/IEC 25000 SQuaREの概要と最新動向
込山 俊博, ISO/IEC 25000 SQuaREの概要と最新動向込山 俊博, ISO/IEC 25000 SQuaREの概要と最新動向
込山 俊博, ISO/IEC 25000 SQuaREの概要と最新動向Hironori Washizaki
 
ソフトウェアテストの歴史と近年の動向
ソフトウェアテストの歴史と近年の動向ソフトウェアテストの歴史と近年の動向
ソフトウェアテストの歴史と近年の動向Keizo Tatsumi
 
Glue DataBrewでデータをクリーニング、加工してみよう
Glue DataBrewでデータをクリーニング、加工してみようGlue DataBrewでデータをクリーニング、加工してみよう
Glue DataBrewでデータをクリーニング、加工してみようtakeshi suto
 
Agile Quality アジャイル品質パターン (QA2AQ)
Agile Quality アジャイル品質パターン (QA2AQ)Agile Quality アジャイル品質パターン (QA2AQ)
Agile Quality アジャイル品質パターン (QA2AQ)Hironori Washizaki
 
データ分析をビジネスに活かす!データ創出・活用から、分析、課題解決までのDX時代のデータ活用事例のご紹介 ~不揃いのデータとの格闘~
データ分析をビジネスに活かす!データ創出・活用から、分析、課題解決までのDX時代のデータ活用事例のご紹介 ~不揃いのデータとの格闘~データ分析をビジネスに活かす!データ創出・活用から、分析、課題解決までのDX時代のデータ活用事例のご紹介 ~不揃いのデータとの格闘~
データ分析をビジネスに活かす!データ創出・活用から、分析、課題解決までのDX時代のデータ活用事例のご紹介 ~不揃いのデータとの格闘~NTT Software Innovation Center
 
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介Recruit Technologies
 
Software Frontloading and QA
Software Frontloading and QASoftware Frontloading and QA
Software Frontloading and QAYasuharu Nishi
 
回帰分析を使った障害発生リスク予測
回帰分析を使った障害発生リスク予測回帰分析を使った障害発生リスク予測
回帰分析を使った障害発生リスク予測Tadashi Shimizu
 
アプリケーション性能管理(APM)ツールの新世代 「AppDynamics」のご紹介 – OpenStack最新情報セミナー 2015年7月
アプリケーション性能管理(APM)ツールの新世代 「AppDynamics」のご紹介 – OpenStack最新情報セミナー 2015年7月アプリケーション性能管理(APM)ツールの新世代 「AppDynamics」のご紹介 – OpenStack最新情報セミナー 2015年7月
アプリケーション性能管理(APM)ツールの新世代 「AppDynamics」のご紹介 – OpenStack最新情報セミナー 2015年7月VirtualTech Japan Inc.
 
グラフ構造のデータモデルをPower BIで可視化してみた
グラフ構造のデータモデルをPower BIで可視化してみたグラフ構造のデータモデルをPower BIで可視化してみた
グラフ構造のデータモデルをPower BIで可視化してみたCData Software Japan
 
【BERT】自然言語処理を用いたレビュー分析
【BERT】自然言語処理を用いたレビュー分析【BERT】自然言語処理を用いたレビュー分析
【BERT】自然言語処理を用いたレビュー分析KazuyaYagihashi
 
What should you shift left
What should you shift leftWhat should you shift left
What should you shift leftYasuharu Nishi
 

Was ist angesagt? (20)

道具としての機械学習:直感的概要とその実際
道具としての機械学習:直感的概要とその実際道具としての機械学習:直感的概要とその実際
道具としての機械学習:直感的概要とその実際
 
アジャイル開発とメトリクス
アジャイル開発とメトリクスアジャイル開発とメトリクス
アジャイル開発とメトリクス
 
データサイエンティストとエンジニア 両者が幸せになれる機械学習基盤を求めて
データサイエンティストとエンジニア 両者が幸せになれる機械学習基盤を求めてデータサイエンティストとエンジニア 両者が幸せになれる機械学習基盤を求めて
データサイエンティストとエンジニア 両者が幸せになれる機械学習基盤を求めて
 
SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査
SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査
SQuaREに基づくソフトウェア品質評価枠組みと品質実態調査
 
Re: ゼロから始める監視設計
Re: ゼロから始める監視設計Re: ゼロから始める監視設計
Re: ゼロから始める監視設計
 
ゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せますゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せます
 
Databricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptxDatabricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptx
 
込山 俊博, ISO/IEC 25000 SQuaREの概要と最新動向
込山 俊博, ISO/IEC 25000 SQuaREの概要と最新動向込山 俊博, ISO/IEC 25000 SQuaREの概要と最新動向
込山 俊博, ISO/IEC 25000 SQuaREの概要と最新動向
 
ソフトウェアテストの歴史と近年の動向
ソフトウェアテストの歴史と近年の動向ソフトウェアテストの歴史と近年の動向
ソフトウェアテストの歴史と近年の動向
 
Glue DataBrewでデータをクリーニング、加工してみよう
Glue DataBrewでデータをクリーニング、加工してみようGlue DataBrewでデータをクリーニング、加工してみよう
Glue DataBrewでデータをクリーニング、加工してみよう
 
Agile Quality アジャイル品質パターン (QA2AQ)
Agile Quality アジャイル品質パターン (QA2AQ)Agile Quality アジャイル品質パターン (QA2AQ)
Agile Quality アジャイル品質パターン (QA2AQ)
 
データ分析をビジネスに活かす!データ創出・活用から、分析、課題解決までのDX時代のデータ活用事例のご紹介 ~不揃いのデータとの格闘~
データ分析をビジネスに活かす!データ創出・活用から、分析、課題解決までのDX時代のデータ活用事例のご紹介 ~不揃いのデータとの格闘~データ分析をビジネスに活かす!データ創出・活用から、分析、課題解決までのDX時代のデータ活用事例のご紹介 ~不揃いのデータとの格闘~
データ分析をビジネスに活かす!データ創出・活用から、分析、課題解決までのDX時代のデータ活用事例のご紹介 ~不揃いのデータとの格闘~
 
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
 
Azure Search 大全
Azure Search 大全Azure Search 大全
Azure Search 大全
 
Software Frontloading and QA
Software Frontloading and QASoftware Frontloading and QA
Software Frontloading and QA
 
回帰分析を使った障害発生リスク予測
回帰分析を使った障害発生リスク予測回帰分析を使った障害発生リスク予測
回帰分析を使った障害発生リスク予測
 
アプリケーション性能管理(APM)ツールの新世代 「AppDynamics」のご紹介 – OpenStack最新情報セミナー 2015年7月
アプリケーション性能管理(APM)ツールの新世代 「AppDynamics」のご紹介 – OpenStack最新情報セミナー 2015年7月アプリケーション性能管理(APM)ツールの新世代 「AppDynamics」のご紹介 – OpenStack最新情報セミナー 2015年7月
アプリケーション性能管理(APM)ツールの新世代 「AppDynamics」のご紹介 – OpenStack最新情報セミナー 2015年7月
 
グラフ構造のデータモデルをPower BIで可視化してみた
グラフ構造のデータモデルをPower BIで可視化してみたグラフ構造のデータモデルをPower BIで可視化してみた
グラフ構造のデータモデルをPower BIで可視化してみた
 
【BERT】自然言語処理を用いたレビュー分析
【BERT】自然言語処理を用いたレビュー分析【BERT】自然言語処理を用いたレビュー分析
【BERT】自然言語処理を用いたレビュー分析
 
What should you shift left
What should you shift leftWhat should you shift left
What should you shift left
 

Ähnlich wie Supervised Machine Learning of Elastic Stack

[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一Insight Technology, Inc.
 
How to organize data science project (データサイエンスプロジェクトの始め方101)
How to organize data science project (データサイエンスプロジェクトの始め方101)How to organize data science project (データサイエンスプロジェクトの始め方101)
How to organize data science project (データサイエンスプロジェクトの始め方101)Yasuyuki Kataoka
 
Oracle Data Miner で始める簡単・高速な機械学習
Oracle Data Miner で始める簡単・高速な機械学習Oracle Data Miner で始める簡単・高速な機械学習
Oracle Data Miner で始める簡単・高速な機械学習Tamakoshi Hironori
 
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...DataWorks Summit/Hadoop Summit
 
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...Recruit Technologies
 
TERAS Conference
TERAS ConferenceTERAS Conference
TERAS ConferenceKeiju Anada
 
SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現
SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現
SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現softlayerjp
 
Redmineの情報を自分好みに見える化した話
Redmineの情報を自分好みに見える化した話Redmineの情報を自分好みに見える化した話
Redmineの情報を自分好みに見える化した話ToshiharuSakai
 
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要オラクルエンジニア通信
 
『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』
『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』
『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』The Japan DataScientist Society
 
Elasticsearch workshop 23_sql
Elasticsearch workshop 23_sqlElasticsearch workshop 23_sql
Elasticsearch workshop 23_sqlshinhiguchi
 
あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方
あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方
あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方オラクルエンジニア通信
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネスMie Mori
 
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏Developers Summit
 
Elasticsearchによるリモートワーク時代のセキュリティ対策
Elasticsearchによるリモートワーク時代のセキュリティ対策Elasticsearchによるリモートワーク時代のセキュリティ対策
Elasticsearchによるリモートワーク時代のセキュリティ対策Elasticsearch
 
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例Recruit Technologies
 
ソフトウェア工学における問題提起と機械学習の新たなあり方
ソフトウェア工学における問題提起と機械学習の新たなあり方ソフトウェア工学における問題提起と機械学習の新たなあり方
ソフトウェア工学における問題提起と機械学習の新たなあり方MLSE
 
今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010Hiroshi Tokumaru
 

Ähnlich wie Supervised Machine Learning of Elastic Stack (20)

[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
 
How to organize data science project (データサイエンスプロジェクトの始め方101)
How to organize data science project (データサイエンスプロジェクトの始め方101)How to organize data science project (データサイエンスプロジェクトの始め方101)
How to organize data science project (データサイエンスプロジェクトの始め方101)
 
Oracle Data Miner で始める簡単・高速な機械学習
Oracle Data Miner で始める簡単・高速な機械学習Oracle Data Miner で始める簡単・高速な機械学習
Oracle Data Miner で始める簡単・高速な機械学習
 
超高速な機械学習を Oracle Database で実現!
超高速な機械学習を Oracle Database で実現!超高速な機械学習を Oracle Database で実現!
超高速な機械学習を Oracle Database で実現!
 
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
 
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
 
TERAS Conference
TERAS ConferenceTERAS Conference
TERAS Conference
 
SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現
SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現
SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現
 
Redmineの情報を自分好みに見える化した話
Redmineの情報を自分好みに見える化した話Redmineの情報を自分好みに見える化した話
Redmineの情報を自分好みに見える化した話
 
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
 
『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』
『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』
『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』
 
Elasticsearch workshop 23_sql
Elasticsearch workshop 23_sqlElasticsearch workshop 23_sql
Elasticsearch workshop 23_sql
 
あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方
あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方
あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネス
 
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏
 
Elasticsearchによるリモートワーク時代のセキュリティ対策
Elasticsearchによるリモートワーク時代のセキュリティ対策Elasticsearchによるリモートワーク時代のセキュリティ対策
Elasticsearchによるリモートワーク時代のセキュリティ対策
 
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
 
ソフトウェア工学における問題提起と機械学習の新たなあり方
ソフトウェア工学における問題提起と機械学習の新たなあり方ソフトウェア工学における問題提起と機械学習の新たなあり方
ソフトウェア工学における問題提起と機械学習の新たなあり方
 
今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010
 
データベースで始める機械学習
データベースで始める機械学習データベースで始める機械学習
データベースで始める機械学習
 

Supervised Machine Learning of Elastic Stack

  • 1. 1Copyright © Acroquest Technology Co., Ltd. All rights reserved. Elastic Stack7.6における 教師あり機械学習の紹介 Acroquest Technology株式会社 Senior Consultant / Elastic Certified Engineer 吉岡 洋 @Hirosh_Yoshioka
  • 2. はじめに Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. 今日話すこと ①Anomaly Detectionの概要 ②Data Frame Analyticsの概要 ← 教師あり機械学習はここ 2. 今日話さないこと ①機械学習のアルゴリズムや評価手法の詳細
  • 3. 目次 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. Elastic MLにおける2種類の機械学習機能 1-1. Anomaly Detection 1-2. Data Frame Analytics 2. デモ 2-1. 分類による不良品予測
  • 4. 自己紹介 Copyright © Acroquest Technology Co., Ltd. All rights reserved. ⚫ 名前:吉岡 洋(よしおかひろし) ⚫ 所属:Acroquest Technology株式会社 (シニアコンサルタント) ⚫ 領域:全文検索/ビッグデータ分析/可視化 ⚫ その他: ─Microsoft MVP for Powershell(2006~2010) ─「Windows PowerShell宣言!」(2007) ─IBM Certified Specialist IBM SPSS Modeler Professional(2014~) ─Elastic Certified Engineer(2018~)
  • 5. Acroquest Technology株式会社 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. 新横浜にあるITベンチャー ①Great Place To Work(R) Institute Japan実施 働きがいのある会社ランキング第1位(3回受賞) 2. 事業(データ活用ビジネス) ①Elastic Stack活用コンサルティングサービス – 検証/設計/構築/運用支援など – Elastic Certified Engineer:5名 ②IoTデータ分析プラットフォーム ③機械学習/AI
  • 6. 1. Elastic MLにおける 2種類の機械学習機能 Copyright © Acroquest Technology Co., Ltd. All rights reserved.
  • 7. 1-1. Anomaly Detection(Ver.5.5でGAリリース) Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. 特徴 ①時系列データの異常検知 ②教師なし機械学習 – 閾値判定で検知できない異常を 判定/検知可能 2. サポートする異常検知 ①トレンド異常検知 – 特定の周期を持った時系列データが過去と異なる振る舞いをしている ②Population Analysis – グループ内の特定の個体が他とは異なる挙動をしている 例)特定のIPアドレスからのアクセスだけ404レスポンスの数が多い 閾値判定だと 異常検知できない
  • 8. 1-1. Anomaly Detection(機能強化) Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. 分析プロセスの効率化 ① Data Visualizer(v6.1) ② CSVファイルのインポート機能(v6.5) ③ Annotation(v6.6) 2. モデル精度の向上 ① Calendar Management(学習対象除外日の設定、v6.2) ② Custom Rule(モデル更新条件/異常検知判定のルール制御、v6.4) ③ スコア計算アルゴリズムの改善(v6.5) – パーティション毎のスコア正規化/マルチバケット分析 3. 将来予測 ① Forecast(v6.1)
  • 9. 1-2. Data Frame Analytics(Ver.7.3~) Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. 特徴 ① 非時系列データの様々な分析 ② Elastic Stack単体で学習/推論が可能 – 学習:Data frame analytics APIまたはKibana UIで実施 – 推論:Ingest Node(Inference Processor)を利用する。(v7.6) 2. サポートする分析手法 No 分析タイプ 学習 推論 Version 備考 1 Outlier Detection(外れ値検知) なし ー v7.3 2 Regression(回帰) あり 可能 v7.4 3 Classification(分類) あり 可能 v7.5 二項分類にのみ対応 4 Language identification (言語識別) あり (プリセット) 可能 V7.6 109言語に対応
  • 10. 1-2. Data Frame Analytics(ユースケース) Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. 教師あり機械学習はBusiness Analytics領域で有用 Regression (回帰) Classification (分類) Language identification (言語識別) [信用リスク分析→未払いリスク低減] 債務者データから格付けスコアモデルを作成。 [アプリユーザ解約予測→解約防止キャンペーン] 顧客動向データから解約予測モデルを作成。 [問い合わせ言語判定→アサイン効率化] 問い合わせ内容を言語判定。適切な担当者をアサイン。
  • 11. 1-2. Data Frame Analytics(処理の流れ) Copyright © Acroquest Technology Co., Ltd. All rights reserved. ④推論 新規 インデックス ②Reindex 学習データ インデックス ②分析 モデル 学習データ インデックス 学習データ (検証データ) ①データ登録 Ingest Node (Inference Processor) テストデータ ③データ登録 ※②は以下のAPI ・Create data frame analytics jobs API ・Start data frame analytics jobs API 学習データ インデックス (+分析結果)
  • 12. 2. デモ Copyright © Acroquest Technology Co., Ltd. All rights reserved.
  • 13. 2-1. 分類による不良品予測 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. デモデータ(製造/試験データ:1000件) ① p1~p12:12ステップある各製造過程での評価値 ② result:製造後の負荷試験結果(NGは不良品) 2. 分類を利用して不良品を予測する ① 説明変数:p1~p12 ② 目的変数:result p1 p2 p3 p4 p5 p6 p7 p8 p9 p10 p11 p12 result 1 28 1 0 1 65 158 1 12 5 B A NG 1 41 1 0 0 197 479 4 6 11 B B OK 1 44 1 0 0 0 651 6 3 7 B C OK 1 50 1 0 1 189 454 5 6 10 B C OK 1 25 1 0 1 153 368 7 4 5 B B OK
  • 14. 2-1. 分類による不良品予測 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. 作成したモデルに対する推論のテスト(正解はNG) POST _ingest/pipeline/_simulate { "pipeline": { "processors": [ { "inference": { "model_id": "★model_id★", "inference_config": { "classification": {} }, "field_mappings": {} } } ] }, "docs": [ { "_source": { "p1" : 1, "p2" : 28, "p3" : 1, "p4" : 0, "p5" : 1, "p6" : 65, "p7" : 158, "p8" : 1, "p9" : 12, "p10" : 5, "p11" : "B", "p12" : "A" } } ] }
  • 15. まとめ Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. Elastic MLには2種類の機械学習機能がある ①Anomaly Detection(教師なし機械学習) ②Data Frame Analytics(教師あり機械学習) ※一部例外あり(Outlier Detectionは教師なし) 2. v7.6から教師あり機械学習の推論をサポート ①Elastic Stack単体での学習/推論が可能 ②Data Frame Analyticsが導入されたことで、 Business Analytics領域での活用が期待できる
  • 16. ご清聴ありがとうございました。 Evolve the Earth with Emotion of Technology Copyright © Acroquest Technology Co., Ltd. All rights reserved.