Suche senden
Hochladen
JubaQLご紹介
•
0 gefällt mir
•
11,875 views
J
JubatusOfficial
Folgen
JubaQLの紹介
Weniger lesen
Mehr lesen
Ingenieurwesen
Melden
Teilen
Melden
Teilen
1 von 15
Jetzt herunterladen
Downloaden Sie, um offline zu lesen
Empfohlen
"アレ"からJubatusを使う
"アレ"からJubatusを使う
JubatusOfficial
Jubatus 新機能ハイライト
Jubatus 新機能ハイライト
JubatusOfficial
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化
JubatusOfficial
jubarecommenderの紹介
jubarecommenderの紹介
JubatusOfficial
jubabanditの紹介
jubabanditの紹介
JubatusOfficial
データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定
データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定
JubatusOfficial
Jubakit の紹介
Jubakit の紹介
kmaehashi
小町のレス数が予測できるか試してみた
小町のレス数が予測できるか試してみた
JubatusOfficial
Empfohlen
"アレ"からJubatusを使う
"アレ"からJubatusを使う
JubatusOfficial
Jubatus 新機能ハイライト
Jubatus 新機能ハイライト
JubatusOfficial
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化
JubatusOfficial
jubarecommenderの紹介
jubarecommenderの紹介
JubatusOfficial
jubabanditの紹介
jubabanditの紹介
JubatusOfficial
データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定
データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定
JubatusOfficial
Jubakit の紹介
Jubakit の紹介
kmaehashi
小町のレス数が予測できるか試してみた
小町のレス数が予測できるか試してみた
JubatusOfficial
Jubaanomalyについて
Jubaanomalyについて
JubatusOfficial
「Windows Azure でスーパーコンピューティング!」for Microsoft MVP camp 2014 大阪会場
「Windows Azure でスーパーコンピューティング!」for Microsoft MVP camp 2014 大阪会場
幸智 Yukinori 黒田 Kuroda
「Windows Azureで HPC 」 for JAZUG 2013年9月
「Windows Azureで HPC 」 for JAZUG 2013年9月
幸智 Yukinori 黒田 Kuroda
CloudAtCostを使ってみた
CloudAtCostを使ってみた
nemumu
EthernetやCPUなどの話
EthernetやCPUなどの話
Takanori Sejima
性能測定道 実践編
性能測定道 実践編
Yuto Hayamizu
MySQLやSSDとかの話・前編
MySQLやSSDとかの話・前編
gree_tech
やすい・はやい・うまいMTのホスティング環境を求めて - jaws-ug-3to-2013-sprint
やすい・はやい・うまいMTのホスティング環境を求めて - jaws-ug-3to-2013-sprint
taiju higashi
MySQLやSSDとかの話 後編
MySQLやSSDとかの話 後編
Takanori Sejima
Web時代の大富豪的プログラミングのススメ
Web時代の大富豪的プログラミングのススメ
Hideyuki Takeuchi
単語コレクター(文章自動校正器)
単語コレクター(文章自動校正器)
JubatusOfficial
CPUに関する話
CPUに関する話
Takanori Sejima
NAND Flash から InnoDB にかけての話(仮)
NAND Flash から InnoDB にかけての話(仮)
Takanori Sejima
MySQLやSSDとかの話 その後
MySQLやSSDとかの話 その後
Takanori Sejima
TranslimitのChatOps事情と愉快なbotたち
TranslimitのChatOps事情と愉快なbotたち
Masakazu Matsushita
リアルタイム処理エンジンGearpumpの紹介
リアルタイム処理エンジンGearpumpの紹介
Sotaro Kimura
2007 03 17_osc2007spring_02
2007 03 17_osc2007spring_02
Tom Hayakawa
MySQLやSSDとかの話 前編
MySQLやSSDとかの話 前編
Takanori Sejima
InnoDBのすゝめ(仮)
InnoDBのすゝめ(仮)
Takanori Sejima
Jubakitの解説
Jubakitの解説
JubatusOfficial
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
JubatusOfficial
かまってちゃん小町
かまってちゃん小町
JubatusOfficial
Weitere ähnliche Inhalte
Was ist angesagt?
Jubaanomalyについて
Jubaanomalyについて
JubatusOfficial
「Windows Azure でスーパーコンピューティング!」for Microsoft MVP camp 2014 大阪会場
「Windows Azure でスーパーコンピューティング!」for Microsoft MVP camp 2014 大阪会場
幸智 Yukinori 黒田 Kuroda
「Windows Azureで HPC 」 for JAZUG 2013年9月
「Windows Azureで HPC 」 for JAZUG 2013年9月
幸智 Yukinori 黒田 Kuroda
CloudAtCostを使ってみた
CloudAtCostを使ってみた
nemumu
EthernetやCPUなどの話
EthernetやCPUなどの話
Takanori Sejima
性能測定道 実践編
性能測定道 実践編
Yuto Hayamizu
MySQLやSSDとかの話・前編
MySQLやSSDとかの話・前編
gree_tech
やすい・はやい・うまいMTのホスティング環境を求めて - jaws-ug-3to-2013-sprint
やすい・はやい・うまいMTのホスティング環境を求めて - jaws-ug-3to-2013-sprint
taiju higashi
MySQLやSSDとかの話 後編
MySQLやSSDとかの話 後編
Takanori Sejima
Web時代の大富豪的プログラミングのススメ
Web時代の大富豪的プログラミングのススメ
Hideyuki Takeuchi
単語コレクター(文章自動校正器)
単語コレクター(文章自動校正器)
JubatusOfficial
CPUに関する話
CPUに関する話
Takanori Sejima
NAND Flash から InnoDB にかけての話(仮)
NAND Flash から InnoDB にかけての話(仮)
Takanori Sejima
MySQLやSSDとかの話 その後
MySQLやSSDとかの話 その後
Takanori Sejima
TranslimitのChatOps事情と愉快なbotたち
TranslimitのChatOps事情と愉快なbotたち
Masakazu Matsushita
リアルタイム処理エンジンGearpumpの紹介
リアルタイム処理エンジンGearpumpの紹介
Sotaro Kimura
2007 03 17_osc2007spring_02
2007 03 17_osc2007spring_02
Tom Hayakawa
MySQLやSSDとかの話 前編
MySQLやSSDとかの話 前編
Takanori Sejima
InnoDBのすゝめ(仮)
InnoDBのすゝめ(仮)
Takanori Sejima
Jubakitの解説
Jubakitの解説
JubatusOfficial
Was ist angesagt?
(20)
Jubaanomalyについて
Jubaanomalyについて
「Windows Azure でスーパーコンピューティング!」for Microsoft MVP camp 2014 大阪会場
「Windows Azure でスーパーコンピューティング!」for Microsoft MVP camp 2014 大阪会場
「Windows Azureで HPC 」 for JAZUG 2013年9月
「Windows Azureで HPC 」 for JAZUG 2013年9月
CloudAtCostを使ってみた
CloudAtCostを使ってみた
EthernetやCPUなどの話
EthernetやCPUなどの話
性能測定道 実践編
性能測定道 実践編
MySQLやSSDとかの話・前編
MySQLやSSDとかの話・前編
やすい・はやい・うまいMTのホスティング環境を求めて - jaws-ug-3to-2013-sprint
やすい・はやい・うまいMTのホスティング環境を求めて - jaws-ug-3to-2013-sprint
MySQLやSSDとかの話 後編
MySQLやSSDとかの話 後編
Web時代の大富豪的プログラミングのススメ
Web時代の大富豪的プログラミングのススメ
単語コレクター(文章自動校正器)
単語コレクター(文章自動校正器)
CPUに関する話
CPUに関する話
NAND Flash から InnoDB にかけての話(仮)
NAND Flash から InnoDB にかけての話(仮)
MySQLやSSDとかの話 その後
MySQLやSSDとかの話 その後
TranslimitのChatOps事情と愉快なbotたち
TranslimitのChatOps事情と愉快なbotたち
リアルタイム処理エンジンGearpumpの紹介
リアルタイム処理エンジンGearpumpの紹介
2007 03 17_osc2007spring_02
2007 03 17_osc2007spring_02
MySQLやSSDとかの話 前編
MySQLやSSDとかの話 前編
InnoDBのすゝめ(仮)
InnoDBのすゝめ(仮)
Jubakitの解説
Jubakitの解説
Andere mochten auch
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
JubatusOfficial
かまってちゃん小町
かまってちゃん小町
JubatusOfficial
新機能紹介 1.0.6
新機能紹介 1.0.6
JubatusOfficial
Jubatus 1.0 の紹介
Jubatus 1.0 の紹介
JubatusOfficial
発言小町からのプロファイリング
発言小町からのプロファイリング
JubatusOfficial
Python 特徴抽出プラグイン
Python 特徴抽出プラグイン
JubatusOfficial
新聞から今年の漢字を予測する
新聞から今年の漢字を予測する
JubatusOfficial
Jubatus解説本の紹介
Jubatus解説本の紹介
JubatusOfficial
小町の溜息
小町の溜息
JubatusOfficial
銀座のママ
銀座のママ
JubatusOfficial
JUBARHYME
JUBARHYME
JubatusOfficial
地域の魅力を伝えるツアーガイドAI
地域の魅力を伝えるツアーガイドAI
JubatusOfficial
Jubatus: Jubakitでもっと楽をしよう
Jubatus: Jubakitでもっと楽をしよう
Tetsuya Shioda
第1回 Jubatusハンズオン
第1回 Jubatusハンズオン
JubatusOfficial
Jubatus Python特徴抽出プラグイン
Jubatus Python特徴抽出プラグイン
Tetsuya Shioda
Isolation forest
Isolation forest
kataware
もくもくしたこと
もくもくしたこと
k_oi
Jubatusハンズオン 機械学習はじめてみた
Jubatusハンズオン 機械学習はじめてみた
JubatusOfficial
Andere mochten auch
(18)
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
かまってちゃん小町
かまってちゃん小町
新機能紹介 1.0.6
新機能紹介 1.0.6
Jubatus 1.0 の紹介
Jubatus 1.0 の紹介
発言小町からのプロファイリング
発言小町からのプロファイリング
Python 特徴抽出プラグイン
Python 特徴抽出プラグイン
新聞から今年の漢字を予測する
新聞から今年の漢字を予測する
Jubatus解説本の紹介
Jubatus解説本の紹介
小町の溜息
小町の溜息
銀座のママ
銀座のママ
JUBARHYME
JUBARHYME
地域の魅力を伝えるツアーガイドAI
地域の魅力を伝えるツアーガイドAI
Jubatus: Jubakitでもっと楽をしよう
Jubatus: Jubakitでもっと楽をしよう
第1回 Jubatusハンズオン
第1回 Jubatusハンズオン
Jubatus Python特徴抽出プラグイン
Jubatus Python特徴抽出プラグイン
Isolation forest
Isolation forest
もくもくしたこと
もくもくしたこと
Jubatusハンズオン 機械学習はじめてみた
Jubatusハンズオン 機械学習はじめてみた
Ähnlich wie JubaQLご紹介
B 2-1 はじめての Windows Azure
B 2-1 はじめての Windows Azure
GoAzure
Osoljp201204
Osoljp201204
Masataka Tsukamoto
2018 07-23
2018 07-23
Yuji Oshima
初心者がOpenIndianaで自宅サーバを作ったよって話
初心者がOpenIndianaで自宅サーバを作ったよって話
Masataka Tsukamoto
トランザクション処理可能な分散DB 「YugabyteDB」入門(Open Source Conference 2022 Online/Fukuoka 発...
トランザクション処理可能な分散DB 「YugabyteDB」入門(Open Source Conference 2022 Online/Fukuoka 発...
NTT DATA Technology & Innovation
OSSで作るOpenStack監視システム
OSSで作るOpenStack監視システム
satsuki fukazu
【JJUG LT 大会】Zulu Open JDK
【JJUG LT 大会】Zulu Open JDK
Shigeru Tatsuta
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
terurou
20101029 open cloudcampus-1
20101029 open cloudcampus-1
Masanori Itoh
Zabbixをもっと便利に!安全に!
Zabbixをもっと便利に!安全に!
Takashi Matsunaga
Windows azureって何
Windows azureって何
Kana SUZUKI
トランザクションの設計と進化
トランザクションの設計と進化
Kumazaki Hiroki
Zynga
Zynga
awsadvantageseminar
Aws privte20110406 arai
Aws privte20110406 arai
awsadovantageseminar
2015/04/27 IT概覧~IoTまでの流れ~
2015/04/27 IT概覧~IoTまでの流れ~
aitc_jp
NHNグループ合同勉強会 ライブドア片野
NHNグループ合同勉強会 ライブドア片野
livedoor
ヤフーを支えるフラッシュストレージ
ヤフーを支えるフラッシュストレージ
Yahoo!デベロッパーネットワーク
NTT DATA と PostgreSQL が挑んだ総力戦
NTT DATA と PostgreSQL が挑んだ総力戦
NTT DATA OSS Professional Services
JavaOne 2015 JDK Update (Jigsaw) #j1jp
JavaOne 2015 JDK Update (Jigsaw) #j1jp
Yuji Kubota
Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側
Cloudera Japan
Ähnlich wie JubaQLご紹介
(20)
B 2-1 はじめての Windows Azure
B 2-1 はじめての Windows Azure
Osoljp201204
Osoljp201204
2018 07-23
2018 07-23
初心者がOpenIndianaで自宅サーバを作ったよって話
初心者がOpenIndianaで自宅サーバを作ったよって話
トランザクション処理可能な分散DB 「YugabyteDB」入門(Open Source Conference 2022 Online/Fukuoka 発...
トランザクション処理可能な分散DB 「YugabyteDB」入門(Open Source Conference 2022 Online/Fukuoka 発...
OSSで作るOpenStack監視システム
OSSで作るOpenStack監視システム
【JJUG LT 大会】Zulu Open JDK
【JJUG LT 大会】Zulu Open JDK
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
20101029 open cloudcampus-1
20101029 open cloudcampus-1
Zabbixをもっと便利に!安全に!
Zabbixをもっと便利に!安全に!
Windows azureって何
Windows azureって何
トランザクションの設計と進化
トランザクションの設計と進化
Zynga
Zynga
Aws privte20110406 arai
Aws privte20110406 arai
2015/04/27 IT概覧~IoTまでの流れ~
2015/04/27 IT概覧~IoTまでの流れ~
NHNグループ合同勉強会 ライブドア片野
NHNグループ合同勉強会 ライブドア片野
ヤフーを支えるフラッシュストレージ
ヤフーを支えるフラッシュストレージ
NTT DATA と PostgreSQL が挑んだ総力戦
NTT DATA と PostgreSQL が挑んだ総力戦
JavaOne 2015 JDK Update (Jigsaw) #j1jp
JavaOne 2015 JDK Update (Jigsaw) #j1jp
Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側
Mehr von JubatusOfficial
Jubakitの紹介
Jubakitの紹介
JubatusOfficial
もくもく成果 IMAMASU
もくもく成果 IMAMASU
JubatusOfficial
Jubatusでuserとbrandのレコメンドを試してみた話
Jubatusでuserとbrandのレコメンドを試してみた話
JubatusOfficial
相撲
相撲
JubatusOfficial
興味ありそうなもの検索
興味ありそうなもの検索
JubatusOfficial
チーム:大杉さんの壮大な夢
チーム:大杉さんの壮大な夢
JubatusOfficial
Jubatus使ってみた 作ってみたJubatus
Jubatus使ってみた 作ってみたJubatus
JubatusOfficial
Mehr von JubatusOfficial
(7)
Jubakitの紹介
Jubakitの紹介
もくもく成果 IMAMASU
もくもく成果 IMAMASU
Jubatusでuserとbrandのレコメンドを試してみた話
Jubatusでuserとbrandのレコメンドを試してみた話
相撲
相撲
興味ありそうなもの検索
興味ありそうなもの検索
チーム:大杉さんの壮大な夢
チーム:大杉さんの壮大な夢
Jubatus使ってみた 作ってみたJubatus
Jubatus使ってみた 作ってみたJubatus
JubaQLご紹介
1.
JubaQLご紹介 NTTソフトウェアイノベーションセンタ 湯原基貴 Copyright©2016 NTT
corp. All Rights Reserved.
2.
アジェンダ • はじめに • JubaQLって何? •
JubaQLを使ってみる • おわりに Copyright©2016 NTT corp. All Rights Reserved.
3.
はじめに • Jubatus 0.8.0でリリースされた機能 •
Jubatus本体と比べて知名度がいまいち.... • この機会に簡単にご紹介させていただきます この後、JubaQLが話題が でたことはない・・・ Copyright©2016 NTT corp. All Rights Reserved.
4.
JubaQLって何? • 機械学習に特化したDSL • SLQ-Likeな操作感覚でJubatusによる機械学習を実行可能 •
その他にもこんな特徴が • ストリームデータソースに対応 • ストリームデータソース(ex. Apache Kafka)から継続的にデータを受け取り処理し続 けることができる • カスケード処理 • サーバ側だけでストリームデータを加工することができる • トリガーベースのアクション • ユーザ定義関数(UDF)とストリームデータに対して特定の条件が満たされた時にUDFを 実行するトリガーを設定することができる • 時系列データ分析 • ストリーム上でタイムウィンドウを定義し、タイムウィンドウ内で学習・分析が可能 Copyright©2016 NTT corp. All Rights Reserved.
5.
JubaQLって何? • 機械学習に特化したDSL • SLQ-Likeな操作感覚でJubatusによる機械学習を実行可能 •
その他にもこんな特徴が • ストリームデータソースに対応 • ストリームデータソース(ex. Apache Kafka)から継続的にデータを受け取り処理し続 けることができる • 静的データソース(ローカルファイル、HDFS)からデータを読み込み、生ストリーム データを分析するようなシームレスな連携が可能 • カスケード処理 • サーバ側だけでストリームデータを加工することができる • トリガーベースのアクション • ユーザ定義関数(UDF)とストリームデータに対して特定の条件が満たされた時にUDFを 実行するトリガーを設定することができる • 時系列データ分析 • ストリーム上でタイムウィンドウを定義し、タイムウィンドウ内で学習・分析が可能 Copyright©2016 NTT corp. All Rights Reserved.
6.
JubaQLって何? • アーキテクチャ • Spark(YARN)基盤上でJubatusを実行 •
複数セッションを同時生成 • セッションごとにJubatus分散構成をYARN上に構築 Hadoop (YARN) Spark JubatusOnYarn JubatusOnYarn Client Gateway Processor HTTP JubaQL クエリと処理結果を JSON 形式で送受信 (Gateway/Processor間も同様) HTTP ・クライアントごとにセッションを生成 ・セッション毎に Processor を生成 (spark-submit 経由で Spark 上に起動) ・クライアントのセッションごとに 適切な Processor に処理を転送 : : Kafka / HDFS / Local File セッション1 Proxy Serve r RPC RPC Client Processor HTTP HTTP セッション2 Proxy Serve r RPC ・受信した JubaQL クエリを処理 ・JubatusOnYarn を YARN に投入 ・現行版 Jubatus に対し RPC を発行 ZooKeeper Server Server RPC Copyright©2016 NTT corp. All Rights Reserved.
7.
JubaQLを使ってみる • 使ってみよう 1. データソースの作成 2.
学習モデルの作成 3. 学習モデルとデータソースの結びつけ 4. 処理開始 5. 分析の実行 Copyright©2016 NTT corp. All Rights Reserved.
8.
JubaQLを使ってみる • データソースの作成(CREATE DATASOURCE) create
datasource anomalysource from ( STORAGE: 'file:///home/vagrant/anomaly.json', STREAM: 'kafka://localhost:2181/anomaly/test-consumer-group‘ ) ローカルファイルとストリームデータソース (Aapache kafka)を指定 Copyright©2016 NTT corp. All Rights Reserved.
9.
JubaQLを使ってみる • 学習モデルの作成(CREATE MODEL) •
異常検知(Jubaanomaly)機能を例に create ANOMALY model anomalymodel as * CONFIG '{"parameter" : {"nearest_neighbor_num" : 5, "reverse_nearest_neighbor_num" : 5, "method" : "inverted_index_euclid", "parameter" : {} }, "method" : "lof" }' Jubaanomalyを指定 Jubaaomalyの設定 Copyright©2016 NTT corp. All Rights Reserved.
10.
JubaQLを使ってみる • 学習モデルとデータソースの結びつけ(UPDATE MODEL) •
学習で利用するJubatusのメソッドを指定 • データソースの全データについて指定されたメソッドで学習モデルが更新される • 次の操作で処理がスタートする update model anomalymodel using add from anomalysource データソースを指定 Jubaanomalyのaddメソッド を指定 学習モデル Copyright©2016 NTT corp. All Rights Reserved.
11.
JubaQLを使ってみる • 処理開始(START PROCESSING) •
データソースに対する処理を開始する • 学習モデルが更新される start processing anomalysource データソースを指定 Copyright©2016 NTT corp. All Rights Reserved.
12.
JubaQLを使ってみる • 分析の実行(ANALYZE) • 学習モデルに対して分析を実行する analyze
'{"id":3}' BY MODEL anomalymodel USING calc_score Jubaanomalyのメソッドcalc_score (指定したデータのLOFを参照する) を表示 指定したメソッドのパラメータ 学習モデル Copyright©2016 NTT corp. All Rights Reserved.
13.
【参考】Jubatusを使ってみる(発展編) • 分析結果からストリームを作成することができる • 以下のコマンドを追加することでJubaQLだけで分析結果を逐次HTTP送 信することが可能 1.
データソースの作成 2. 学習モデルの作成 3. 学習モデルとストリームモデルの結びつけ 4. 新ストリームの定義(CREATE STREAM FROM ANALYZE) • データソースの各データを分析し、分析結果を加えた新たなストリームを定義 5. トリガ関数の定義(CREATE TRIGGER FUNCTION) • ストリームに対する処理を定義する • HTTPリクエストやemailの送信が可能 6. トリガの作成 • ストリームに対してトリガ関数を実行する 7. 処理開始 • HTTPリクエストやemailを送信するためのjqlオブジェクトが実装されている Copyright©2016 NTT corp. All Rights Reserved.
14.
【発展】Jubatusを使ってみる(発展編) • JubaQLを使った異常検知 20160616 GET /index.html
200 ……… アクセスログ ブラウザからの アクセス ログの収集 ログを queueにpush ログを取得 LOFの計算 LOFの監視 Copyright©2016 NTT corp. All Rights Reserved.
15.
おわりに • JubaQLにより • ストリームデータソースに対する機械学習が容易 •
SQL-likeなクエリ言語により、非プログラマでも機械学習が利用可能 • JubaQLの問題点 • インストールが大変 • spark,yarn,hdfs,zookeeper.... • Spark 1.2.1のみ対応(最新版は1.6.1。2.0も見えてきた) • みなさまのコミットお待ちしています! Copyright©2016 NTT corp. All Rights Reserved.
Jetzt herunterladen