SlideShare ist ein Scribd-Unternehmen logo
1 von 21
Downloaden Sie, um offline zu lesen
ライトプランで利⽤可能な分析基盤
「IBM Analytics Engine (IAE)」とは
DSX x IAE x Object Storage でデータ基盤を構築しよう
ホートンワークスジャパン
マーケティングディレクター
北瀬 公彦
2
Hortonworks 会社概要
創⽴ 2011年 Yahoo!のApache Hadoop
オリジナルチームのメンバー24 ⼈のエンジニアが設⽴
役員 CEO: ロブ・バーデン、COO:スコット・デイビッドソン
オープンソースソフトウェアへ100%コミット
Apache Hadoop プロジェクトへの貢献世界⼀
2011年 創業、マイクロソフト社 (Azure HDInsight)と提携
2014年 9⽉ ⽇本法⼈ホートンワークスジャパン株式会社設⽴
12⽉ NASDAQ上場(NASDAQ: HDP)
2015年 創業以来最速で売上$100Mを達成
Apache NiFiのOnyara社買収し、HDFを市場投⼊
2016年 Billingが$270M越す、HDC for AWSを市場投⼊
2016年 DellEMC社と提携
2017年 6⽉ 主⼒製品 新版HDP 2.6、HDF 3.0を市場投⼊
6⽉ IBM社と提携
9⽉ 新製品・サービス HCPとDPSを市場投⼊
会社概要 実績
次世代データプラットフォームのデファクトスタンダードを提供する
オープンソースソフトウェア企業の世界的リーダー
受注実績 $ 270M (前年同期⽐
+62.7%)
売上実績 $ 184.5M(前年同期⽐
+51.4%)
3Q17/3Q16	Subscription	Revenue	Growth:	
64%	YoY	
2016年度
$ 13.1 $ 18.1 $ 20.9 $ 25.6 $ 27.6 $ 31.0 $ 32.5 $ 35.6
$ 42.1 $ 45.8
$ 53.2
$ 9.2
$ 11.9
$ 11.3
$ 11.9
$ 13.7
$ 12.6
$ 15.1
$ 16.4
$ 13.9
$ 16.0
$ 15.8
Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Q3
2015 2016 2017
3
14:55 [Room 2]
IBM Cloud DBaaS の概要と事例紹介
野間 愛⼀郎 : IBM, Cloud Software & Analytics
15:45 [Room 2]
DSXでデータ・サイエンス
河⽥ ⼤ : IBM, アナリティクス・テクニカル・セールス
14:30 [Room 1]
ライトプランで利⽤可能な分析基盤「Analytics Engine」とは
北瀬 公彦 : ホートンワークスジャパン, マーケティングディレクター
本⽇のデータ関連サービスのセッション紹介
4 © Hortonworks Inc. 2011 – 2016. All Rights Reserved
⽣成されるデータの急増
出典: IDC's Data Age 2025 study, sponsored by Seagate
https://www.seagate.com/files/www-content/our-story/trends/files/data-age-2025-infographic-2017.pdf
5 © Hortonworks Inc. 2011 – 2016. All Rights Reserved
データの⽣成場所が個⼈から企業へ
出典: IDC's Data Age 2025 study, sponsored by Seagate
https://www.seagate.com/files/www-content/our-story/trends/files/data-age-2025-infographic-2017.pdf
6 © Hortonworks Inc. 2011 – 2016. All Rights Reserved
リアルタイムデータの増加
出典: IDC's Data Age 2025 study, sponsored by Seagate
https://www.seagate.com/files/www-content/our-story/trends/files/data-age-2025-infographic-2017.pdf
7 © Hortonworks Inc. 2011 – 2016. All Rights Reserved
AIシステムにより利⽤されるデータの増加
出典: IDC's Data Age 2025 study, sponsored by Seagate
https://www.seagate.com/files/www-content/our-story/trends/files/data-age-2025-infographic-2017.pdf
データを取り巻く
環境の激変に
対応可能ですか?
ビッグデータ分析環境の例
データの収集
Hortonworks	DataFlow
データの蓄積、分析
Hortonworks	Data	Platform
Hadoop
Weekly	/	Monthly	etc)
EDW
Hadoop
EDW
データ
アプリケーション
データ
アナリスト
データ
サイエンティスト
データ
エンジニア
10 © Hortonworks Inc. 2011 – 2016. All Rights Reserved
Category OSS AWS Azure Google IBM
ETL NiFi,	Sqoop,	Flume,	etc Amazon	Data	Pipeline Azure Data	Factory
Azure Data	Catalog
Cloud	DataPrep Data	Connect
メッセージング
システム
Kafka Amazon	Kinesis Azure	Event	Hub Cloud	Pub/Sub IBM	Message	Hub
ビッグデータ
分散処理
Hadoop
Spark
Amazon	EMR Azure	HDInsight Cloud	DataProc
Cloud	Dataflow
IBM	Analytics	Engine	
(IAE)
リアルタイム
データ処理
Storm Amazon	Kinesis Azure Stream Analytics Cloud	Dataflow Streaming	Analytics
NoSQL	 MongoDB,	CouchDB,
HBase,	Cassandra,	etc
Amazon	DynamoDB Azure CosmosDB
Azure	Time	Series	
Insights
Cloud Datastore
Cloud	BigTable
IBM	Cloudant
データウェアハウス Hive /	Druid Amazon	Redshift Azure	SQL	
Datawarehouse
BigQuery IBM	Db2	Warehouse	
on	Cloud
クエリエンジン Hive,	Impala, Presto Amazon	Athena Azure Data	Lake	
Analytics
BigQuery BigInsights for	Apache	
Hadoop	(Big	SQL)
BI Superset,	etc Amazon	QuickSight PowerBI Google	Data	Studio Cognossなど、
UnmanagedなBI製品を
利用
データサイエンス Zeppelin
Jupyter Notebook
Amazon	Machine	
Learning
Azure Machine
Learning
Cloud	DataLab IBM	Data	Science	
Experience
マシーンラーニング Amazon	Machine	
Learning
Azure	Machine	
Learning
Cloud	Machine	
Learning	Services
IBM	Watson	Machine	
Learning
参考: https://ilyas-it83.github.io/CloudComparer/	
クラウドサービスの紹介
ビッグデータ・アナリティクス
注意:
カバーできていない他のOSS、クラウドサービスもありますが、
作成者の視点により主要サービスのみカバーしています。
11 © Hortonworks Inc. 2011 – 2016. All Rights Reserved
ストリーム
データ転送
分散
ファイル
システム
データ
ウェアハウス
Business	
Intelligence
分散処理 データ
サイエンス
バルク
データ転送
アドホック
クエリー
マシン
ラーニング
DB
DB
NoSQL
Sensor
Sensor
収集 蓄積 処理 分析⽤データ 可視化・分析・機械学習ソース
ビッグデータ分析のための
データパイプライン
リアルタイム
処理
12 © Hortonworks Inc. 2011 – 2016. All Rights Reserved
NiFi,	Kafka
HDFS Hive	/	Druid
Superset
Hadoop	/	
Spark ZeppelinSqoop
Hive	QL	/	LLAP
Storm,	Spark	
Streaming
Spark	MLlibな
どの機械学習
ライブラリを
使用して開発
DB
DB
Sensor
Sensor
収集 蓄積 処理 分析⽤データ 可視化・分析・機械学習ソース
ストリームデータ転送
バルクデータ転送
ビッグデータ関連OSSの紹介
OSS ビッグデータ・アナリティクス
注意:
カバーできていない他のOSSもありますが、
作成者の視点により主要サービスのみカバーしています。
Mongo	DB
HBase,	
Cassandra
13 © Hortonworks Inc. 2011 – 2016. All Rights Reserved
ここの話
収集 蓄積 処理 分析⽤データ 可視化・分析・機械学習ソース
IBM	
Message	Hub
IBM
Object	Storage
IBM	Db2	
Warehouse	
on	Cloud
Cognossなど、
Unmanagedな
BI製品を利用
IBM	Data	
Science	
Experience
IBM	
Data	Connect
それぞれの
サービスに
付属
IBM	Watson	
Machine	
Learning
DB
DB
IBM	
Cloudant
IBM	Analytics	
Engine	(IAE)
Sensor
Sensor
ストリームデータ転送
バルクデータ転送
クラウドサービスの紹介
IBM ビッグデータ・アナリティクス
注意:
カバーできていないサービスもありますが、
作成者の視点により主要サービスのみカバーしています。
IBM
Streaming	
Analytics
14
IBM Analytics Engine とは
à マネージド Hadoop / Spark サービス
– Hortonworks Data Platform (HDP) ベースに開発され、2017年11⽉にGA)
à IBM Open Platform for Hadoop (IOP) や
BigInsights for Apache Hadoop の後継
– IOPはすでにService Retired
– BigInsights for Apache Hadoop もまもなくService Retired
• Service Retirement Announce Date: November 7, 2017
• End of Marketing Date: December 7, 2017
• End of Support Date: November 7, 2018
Source:	https://www.ibm.com/blogs/bluemix/2017/11/deprecation-of-biginsights-for-apache-hadoop-basic-plan/
15
IBM	Analytics	Engine	1.0	Spark	(Free)
16
IBM	Analytics	Engine	1.0	Spark	and	Hadoop	(Free)
17
IBM	Data	Science	Experience	(DSX)	とは
à データサイエンスに携わる全てのユーザ様向けのプラットフォーム
à データ分析に必要な環境をAll In Oneで装備し、分析のサイクルを⼀気通貫
à データサイエンスを組織としてまわすために必要なコラボレーション機能
à Sparkを梱包しているためビッグデータ処理も対応
多様なデータ・ソースへ
のアクセス機能
Python, R, SPSS ⾃動化された機械学習 API化
18 © Hortonworks Inc. 2011 – 2016. All Rights Reserved
データサイエンス /	機械学習 テクノロジースタック
DSX	x	IAE	による
Find Share Collaborate
common	data,	pipelines	and	projects
IBM	Data	Science	Experience
DATA	SYSTEMSPlatforms
On-Premise Private Cloud Cloud
Security
Operations
Governance
&	Integration
°1 ° ° ° ° ° ° °
° ° ° ° ° ° ° ° °
° ° ° ° ° ° ° ° N
YARN	:	Data	Operating	System
Script
Pig
SQL
Hive
NoSQL
HBase
Stream
Strom
In-Mem
Spark
HDFS
(Hadoop	Distributed	File	System)
Others
BigSQL
Clickstream
Web	&	Social
Geolocation
Sensor	
& Machine
Server	
Logs
Unstructured
Data	Sources
Apache Spark 内蔵
IBM Analytics Engine
(Apache Hadoop /
Spark 占有環境)
Powered	by	Hortonworks 拡
張
可
能
19
デモスクリプト
à IBM Analytics Engineでクラスタを作成
à 作成されたクラスタの確認
à IBM Data Science Experienceで、プロジェクトの作成
à Object Storage (S3)でバケットの作成
à Sparkサービスの作成
à IAEとDSXの連携
à Jupyter NotebookでNotebookの作成
à サンプルNotebookを実⾏
20
参考情報
à Web
– https://www.ibm.com/cloud/analytics-engine
à YouTube
– https://www.youtube.com/watch?v=Qa2Zq0NkokM
– https://www.youtube.com/watch?v=uf1aNmbfGZk
à 関連記事
– https://japan.zdnet.com/article/35109884/
21
北瀬 公彦
KIMIHIKO	KITASE
http://blogs.itmedia.co.jp/kkitase	
@kkitase
ホートンワークスジャパン マーケティングディレクター
クラウド利⽤促進機構 総合アドバイザー
facebook.com/kkitase
kkitase@gmail.com
何かあればあとでご連絡ください

Weitere ähnliche Inhalte

Was ist angesagt?

Microsoft open tech night 2020 feb18
Microsoft open tech night 2020 feb18Microsoft open tech night 2020 feb18
Microsoft open tech night 2020 feb18Masatomo Ito
 
OpenStack Summit 2017 Boston 報告会 サミット全体概要
OpenStack Summit 2017 Boston 報告会 サミット全体概要OpenStack Summit 2017 Boston 報告会 サミット全体概要
OpenStack Summit 2017 Boston 報告会 サミット全体概要Yukinori Sagara
 
AWS IoTを使った双方向通信システムの実装と注意点
AWS IoTを使った双方向通信システムの実装と注意点AWS IoTを使った双方向通信システムの実装と注意点
AWS IoTを使った双方向通信システムの実装と注意点Kohei MATSUSHITA
 
[Cloud OnAir] GCP で誰でも始められる HPC 2019年5月9日 放送
[Cloud OnAir] GCP で誰でも始められる HPC 2019年5月9日 放送[Cloud OnAir] GCP で誰でも始められる HPC 2019年5月9日 放送
[Cloud OnAir] GCP で誰でも始められる HPC 2019年5月9日 放送Google Cloud Platform - Japan
 
Google Cloud Platform 概要
Google Cloud Platform 概要Google Cloud Platform 概要
Google Cloud Platform 概要Kiyoshi Fukuda
 
Datadog monitoring with HashiCorp
Datadog monitoring with HashiCorpDatadog monitoring with HashiCorp
Datadog monitoring with HashiCorpMasatomo Ito
 
Google Cloud Platform 概要
Google Cloud Platform 概要Google Cloud Platform 概要
Google Cloud Platform 概要Kiyoshi Fukuda
 
[Cloud OnAir] Config Connector の特徴と、 Anthos Config Management を 組み合わせた、 構成管理の...
[Cloud OnAir] Config Connector の特徴と、 Anthos Config Management を 組み合わせた、 構成管理の...[Cloud OnAir] Config Connector の特徴と、 Anthos Config Management を 組み合わせた、 構成管理の...
[Cloud OnAir] Config Connector の特徴と、 Anthos Config Management を 組み合わせた、 構成管理の...Google Cloud Platform - Japan
 
Hybrid serverless architecture using open whisk ibm cloud functions and istio...
Hybrid serverless architecture using open whisk ibm cloud functions and istio...Hybrid serverless architecture using open whisk ibm cloud functions and istio...
Hybrid serverless architecture using open whisk ibm cloud functions and istio...Tsuyoshi Hirayama
 
Elastic observabilitycansmartlymanagetheappsonkubernetes
Elastic observabilitycansmartlymanagetheappsonkubernetesElastic observabilitycansmartlymanagetheappsonkubernetes
Elastic observabilitycansmartlymanagetheappsonkubernetesShotaro Suzuki
 
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...
[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...
[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...Google Cloud Platform - Japan
 
[Cloud OnAir] Google Cloud の考える次世代ハイブリッドクラウドとは? 2019年8月22日 放送
[Cloud OnAir] Google Cloud の考える次世代ハイブリッドクラウドとは? 2019年8月22日 放送[Cloud OnAir] Google Cloud の考える次世代ハイブリッドクラウドとは? 2019年8月22日 放送
[Cloud OnAir] Google Cloud の考える次世代ハイブリッドクラウドとは? 2019年8月22日 放送Google Cloud Platform - Japan
 
Introducing IBM Cloud & Cognitive
Introducing IBM Cloud & CognitiveIntroducing IBM Cloud & Cognitive
Introducing IBM Cloud & CognitiveAtsumori Sasaki
 
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] Google Cloud 主催イベント Anthos Day 情報 2020 年 2 月 13 日放送
[Cloud OnAir] Google Cloud 主催イベント Anthos Day 情報 2020 年 2 月 13 日放送[Cloud OnAir] Google Cloud 主催イベント Anthos Day 情報 2020 年 2 月 13 日放送
[Cloud OnAir] Google Cloud 主催イベント Anthos Day 情報 2020 年 2 月 13 日放送Google Cloud Platform - Japan
 
AWSマネージドサービスをフル活用したヘルスケアIoTプラットフォーム
AWSマネージドサービスをフル活用したヘルスケアIoTプラットフォームAWSマネージドサービスをフル活用したヘルスケアIoTプラットフォーム
AWSマネージドサービスをフル活用したヘルスケアIoTプラットフォームHiroki Takeda
 
Azure Batch Renderingではじめるクラウドレンダリング
Azure Batch RenderingではじめるクラウドレンダリングAzure Batch Renderingではじめるクラウドレンダリング
Azure Batch RenderingではじめるクラウドレンダリングMicrosoft
 
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送Google Cloud Platform - Japan
 
Google Cloud Platform は何がすごいのか?
Google Cloud Platform は何がすごいのか?Google Cloud Platform は何がすごいのか?
Google Cloud Platform は何がすごいのか?Kiyoshi Fukuda
 

Was ist angesagt? (20)

Microsoft open tech night 2020 feb18
Microsoft open tech night 2020 feb18Microsoft open tech night 2020 feb18
Microsoft open tech night 2020 feb18
 
OpenStack Summit 2017 Boston 報告会 サミット全体概要
OpenStack Summit 2017 Boston 報告会 サミット全体概要OpenStack Summit 2017 Boston 報告会 サミット全体概要
OpenStack Summit 2017 Boston 報告会 サミット全体概要
 
AWS IoTを使った双方向通信システムの実装と注意点
AWS IoTを使った双方向通信システムの実装と注意点AWS IoTを使った双方向通信システムの実装と注意点
AWS IoTを使った双方向通信システムの実装と注意点
 
[Cloud OnAir] GCP で誰でも始められる HPC 2019年5月9日 放送
[Cloud OnAir] GCP で誰でも始められる HPC 2019年5月9日 放送[Cloud OnAir] GCP で誰でも始められる HPC 2019年5月9日 放送
[Cloud OnAir] GCP で誰でも始められる HPC 2019年5月9日 放送
 
Google Cloud Platform 概要
Google Cloud Platform 概要Google Cloud Platform 概要
Google Cloud Platform 概要
 
Datadog monitoring with HashiCorp
Datadog monitoring with HashiCorpDatadog monitoring with HashiCorp
Datadog monitoring with HashiCorp
 
Google Cloud Platform 概要
Google Cloud Platform 概要Google Cloud Platform 概要
Google Cloud Platform 概要
 
[Cloud OnAir] Config Connector の特徴と、 Anthos Config Management を 組み合わせた、 構成管理の...
[Cloud OnAir] Config Connector の特徴と、 Anthos Config Management を 組み合わせた、 構成管理の...[Cloud OnAir] Config Connector の特徴と、 Anthos Config Management を 組み合わせた、 構成管理の...
[Cloud OnAir] Config Connector の特徴と、 Anthos Config Management を 組み合わせた、 構成管理の...
 
Hybrid serverless architecture using open whisk ibm cloud functions and istio...
Hybrid serverless architecture using open whisk ibm cloud functions and istio...Hybrid serverless architecture using open whisk ibm cloud functions and istio...
Hybrid serverless architecture using open whisk ibm cloud functions and istio...
 
Elastic observabilitycansmartlymanagetheappsonkubernetes
Elastic observabilitycansmartlymanagetheappsonkubernetesElastic observabilitycansmartlymanagetheappsonkubernetes
Elastic observabilitycansmartlymanagetheappsonkubernetes
 
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
 
[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...
[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...
[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...
 
[Cloud OnAir] Google Cloud の考える次世代ハイブリッドクラウドとは? 2019年8月22日 放送
[Cloud OnAir] Google Cloud の考える次世代ハイブリッドクラウドとは? 2019年8月22日 放送[Cloud OnAir] Google Cloud の考える次世代ハイブリッドクラウドとは? 2019年8月22日 放送
[Cloud OnAir] Google Cloud の考える次世代ハイブリッドクラウドとは? 2019年8月22日 放送
 
Introducing IBM Cloud & Cognitive
Introducing IBM Cloud & CognitiveIntroducing IBM Cloud & Cognitive
Introducing IBM Cloud & Cognitive
 
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送
 
[Cloud OnAir] Google Cloud 主催イベント Anthos Day 情報 2020 年 2 月 13 日放送
[Cloud OnAir] Google Cloud 主催イベント Anthos Day 情報 2020 年 2 月 13 日放送[Cloud OnAir] Google Cloud 主催イベント Anthos Day 情報 2020 年 2 月 13 日放送
[Cloud OnAir] Google Cloud 主催イベント Anthos Day 情報 2020 年 2 月 13 日放送
 
AWSマネージドサービスをフル活用したヘルスケアIoTプラットフォーム
AWSマネージドサービスをフル活用したヘルスケアIoTプラットフォームAWSマネージドサービスをフル活用したヘルスケアIoTプラットフォーム
AWSマネージドサービスをフル活用したヘルスケアIoTプラットフォーム
 
Azure Batch Renderingではじめるクラウドレンダリング
Azure Batch RenderingではじめるクラウドレンダリングAzure Batch Renderingではじめるクラウドレンダリング
Azure Batch Renderingではじめるクラウドレンダリング
 
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
 
Google Cloud Platform は何がすごいのか?
Google Cloud Platform は何がすごいのか?Google Cloud Platform は何がすごいのか?
Google Cloud Platform は何がすごいのか?
 

Ähnlich wie ライトプランで利用可能な分析基盤「IBM Analytics Engine (IAE)」とは

リクルート式Hadoopの使い方
リクルート式Hadoopの使い方リクルート式Hadoopの使い方
リクルート式Hadoopの使い方Recruit Technologies
 
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)NTT DATA OSS Professional Services
 
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也Insight Technology, Inc.
 
クラウドにおけるビッグデータ分析環境
クラウドにおけるビッグデータ分析環境クラウドにおけるビッグデータ分析環境
クラウドにおけるビッグデータ分析環境Kimihiko Kitase
 
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Hortonworks Japan
 
(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境
(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境
(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境Mitsutoshi Kiuchi
 
TokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoopTokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoopTeruo Kawasaki
 
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - Tetsutaro Watanabe
 
Hadoop/Spark セルフサービス系の事例まとめ
Hadoop/Spark セルフサービス系の事例まとめHadoop/Spark セルフサービス系の事例まとめ
Hadoop/Spark セルフサービス系の事例まとめYuta Imai
 
データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門Satoru Ishikawa
 
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情Hideo Takagi
 
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...Insight Technology, Inc.
 
Beginner must-see! A future that can be opened by learning Hadoop
Beginner must-see! A future that can be opened by learning HadoopBeginner must-see! A future that can be opened by learning Hadoop
Beginner must-see! A future that can be opened by learning HadoopDataWorks Summit
 
JAZUG Nagoya Windows Azure Update 20140301
JAZUG Nagoya Windows Azure Update 20140301JAZUG Nagoya Windows Azure Update 20140301
JAZUG Nagoya Windows Azure Update 20140301Ayako Omori
 
[db tech showcase OSS 2017] A14: IoT時代のデータストア--躍進するNoSQL、拡張するRDB by OSSコンソーシア...
[db tech showcase OSS 2017] A14: IoT時代のデータストア--躍進するNoSQL、拡張するRDB by OSSコンソーシア...[db tech showcase OSS 2017] A14: IoT時代のデータストア--躍進するNoSQL、拡張するRDB by OSSコンソーシア...
[db tech showcase OSS 2017] A14: IoT時代のデータストア--躍進するNoSQL、拡張するRDB by OSSコンソーシア...Insight Technology, Inc.
 
パブリッククラウド動向とIBMの取り組み
パブリッククラウド動向とIBMの取り組みパブリッククラウド動向とIBMの取り組み
パブリッククラウド動向とIBMの取り組みKimihiko Kitase
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionTetsutaro Watanabe
 

Ähnlich wie ライトプランで利用可能な分析基盤「IBM Analytics Engine (IAE)」とは (20)

リクルート式Hadoopの使い方
リクルート式Hadoopの使い方リクルート式Hadoopの使い方
リクルート式Hadoopの使い方
 
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
 
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也
 
クラウドにおけるビッグデータ分析環境
クラウドにおけるビッグデータ分析環境クラウドにおけるビッグデータ分析環境
クラウドにおけるビッグデータ分析環境
 
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
 
(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境
(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境
(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境
 
TokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoopTokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoop
 
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
 
Hadoop/Spark セルフサービス系の事例まとめ
Hadoop/Spark セルフサービス系の事例まとめHadoop/Spark セルフサービス系の事例まとめ
Hadoop/Spark セルフサービス系の事例まとめ
 
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
 
データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門
 
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情
 
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
 
Beginner must-see! A future that can be opened by learning Hadoop
Beginner must-see! A future that can be opened by learning HadoopBeginner must-see! A future that can be opened by learning Hadoop
Beginner must-see! A future that can be opened by learning Hadoop
 
Azure <3 Openness
Azure <3 OpennessAzure <3 Openness
Azure <3 Openness
 
Spring Cloud Data Flow の紹介 #streamctjp
Spring Cloud Data Flow の紹介  #streamctjpSpring Cloud Data Flow の紹介  #streamctjp
Spring Cloud Data Flow の紹介 #streamctjp
 
JAZUG Nagoya Windows Azure Update 20140301
JAZUG Nagoya Windows Azure Update 20140301JAZUG Nagoya Windows Azure Update 20140301
JAZUG Nagoya Windows Azure Update 20140301
 
[db tech showcase OSS 2017] A14: IoT時代のデータストア--躍進するNoSQL、拡張するRDB by OSSコンソーシア...
[db tech showcase OSS 2017] A14: IoT時代のデータストア--躍進するNoSQL、拡張するRDB by OSSコンソーシア...[db tech showcase OSS 2017] A14: IoT時代のデータストア--躍進するNoSQL、拡張するRDB by OSSコンソーシア...
[db tech showcase OSS 2017] A14: IoT時代のデータストア--躍進するNoSQL、拡張するRDB by OSSコンソーシア...
 
パブリッククラウド動向とIBMの取り組み
パブリッククラウド動向とIBMの取り組みパブリッククラウド動向とIBMの取り組み
パブリッククラウド動向とIBMの取り組み
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年version
 

Mehr von Kimihiko Kitase

最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworksKimihiko Kitase
 
Hortonworksが提供する データ活用方法の紹介
Hortonworksが提供する データ活用方法の紹介Hortonworksが提供する データ活用方法の紹介
Hortonworksが提供する データ活用方法の紹介Kimihiko Kitase
 
Hadoop Summit 2016 San Jose レポート
Hadoop Summit 2016  San Jose レポートHadoop Summit 2016  San Jose レポート
Hadoop Summit 2016 San Jose レポートKimihiko Kitase
 
SoftLayer Bluemix Community Festa 2016 Program Guide
SoftLayer Bluemix Community Festa 2016 Program GuideSoftLayer Bluemix Community Festa 2016 Program Guide
SoftLayer Bluemix Community Festa 2016 Program GuideKimihiko Kitase
 
2016年冬 IBMクラウド最新動向と概要
2016年冬 IBMクラウド最新動向と概要2016年冬 IBMクラウド最新動向と概要
2016年冬 IBMクラウド最新動向と概要Kimihiko Kitase
 
2016年冬 IBMクラウド最新動向
2016年冬 IBMクラウド最新動向2016年冬 IBMクラウド最新動向
2016年冬 IBMクラウド最新動向Kimihiko Kitase
 
クラウドを活用した システム開発は適材適所
クラウドを活用したシステム開発は適材適所クラウドを活用したシステム開発は適材適所
クラウドを活用した システム開発は適材適所Kimihiko Kitase
 
ホスティッドプライベートクラウド勉強会 ~Azure Pack on SoftLayer ~
ホスティッドプライベートクラウド勉強会 ~Azure Pack on SoftLayer ~ホスティッドプライベートクラウド勉強会 ~Azure Pack on SoftLayer ~
ホスティッドプライベートクラウド勉強会 ~Azure Pack on SoftLayer ~Kimihiko Kitase
 
話題のNode-REDでIoTアプリを作ってみよう
話題のNode-REDでIoTアプリを作ってみよう話題のNode-REDでIoTアプリを作ってみよう
話題のNode-REDでIoTアプリを作ってみようKimihiko Kitase
 
SoftLayer最新動向と賢い利用方法
SoftLayer最新動向と賢い利用方法 SoftLayer最新動向と賢い利用方法
SoftLayer最新動向と賢い利用方法 Kimihiko Kitase
 
SoftLayer Bluemix Summit 2015 Flyer
SoftLayer Bluemix Summit 2015 FlyerSoftLayer Bluemix Summit 2015 Flyer
SoftLayer Bluemix Summit 2015 FlyerKimihiko Kitase
 
OSC15 Okinawa Intro SoftLayer and Bluemix
OSC15 Okinawa Intro SoftLayer and BluemixOSC15 Okinawa Intro SoftLayer and Bluemix
OSC15 Okinawa Intro SoftLayer and BluemixKimihiko Kitase
 
Introduction of public cloud softlayer and bluemix
Introduction of public cloud softlayer and bluemixIntroduction of public cloud softlayer and bluemix
Introduction of public cloud softlayer and bluemixKimihiko Kitase
 
SoftLayer Bluemix Summit 2015
SoftLayer Bluemix Summit 2015SoftLayer Bluemix Summit 2015
SoftLayer Bluemix Summit 2015Kimihiko Kitase
 
クラウドに構築したWebサイトのセキュリティ対策やグローバル展開について
クラウドに構築したWebサイトのセキュリティ対策やグローバル展開についてクラウドに構築したWebサイトのセキュリティ対策やグローバル展開について
クラウドに構築したWebサイトのセキュリティ対策やグローバル展開についてKimihiko Kitase
 
Introduction softlayer and bluemix
Introduction softlayer and bluemixIntroduction softlayer and bluemix
Introduction softlayer and bluemixKimihiko Kitase
 
5分で分かった気になるIoT
5分で分かった気になるIoT5分で分かった気になるIoT
5分で分かった気になるIoTKimihiko Kitase
 
Build easy web system on softlayer
Build easy web system on softlayerBuild easy web system on softlayer
Build easy web system on softlayerKimihiko Kitase
 

Mehr von Kimihiko Kitase (20)

最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
 
Hortonworksが提供する データ活用方法の紹介
Hortonworksが提供する データ活用方法の紹介Hortonworksが提供する データ活用方法の紹介
Hortonworksが提供する データ活用方法の紹介
 
Hadoop Summit 2016 San Jose レポート
Hadoop Summit 2016  San Jose レポートHadoop Summit 2016  San Jose レポート
Hadoop Summit 2016 San Jose レポート
 
SoftLayer Bluemix Community Festa 2016 Program Guide
SoftLayer Bluemix Community Festa 2016 Program GuideSoftLayer Bluemix Community Festa 2016 Program Guide
SoftLayer Bluemix Community Festa 2016 Program Guide
 
2016年冬 IBMクラウド最新動向と概要
2016年冬 IBMクラウド最新動向と概要2016年冬 IBMクラウド最新動向と概要
2016年冬 IBMクラウド最新動向と概要
 
2016年冬 IBMクラウド最新動向
2016年冬 IBMクラウド最新動向2016年冬 IBMクラウド最新動向
2016年冬 IBMクラウド最新動向
 
クラウドを活用した システム開発は適材適所
クラウドを活用したシステム開発は適材適所クラウドを活用したシステム開発は適材適所
クラウドを活用した システム開発は適材適所
 
Try IoT with Node-RED
Try IoT with Node-REDTry IoT with Node-RED
Try IoT with Node-RED
 
ホスティッドプライベートクラウド勉強会 ~Azure Pack on SoftLayer ~
ホスティッドプライベートクラウド勉強会 ~Azure Pack on SoftLayer ~ホスティッドプライベートクラウド勉強会 ~Azure Pack on SoftLayer ~
ホスティッドプライベートクラウド勉強会 ~Azure Pack on SoftLayer ~
 
話題のNode-REDでIoTアプリを作ってみよう
話題のNode-REDでIoTアプリを作ってみよう話題のNode-REDでIoTアプリを作ってみよう
話題のNode-REDでIoTアプリを作ってみよう
 
SoftLayer最新動向と賢い利用方法
SoftLayer最新動向と賢い利用方法 SoftLayer最新動向と賢い利用方法
SoftLayer最新動向と賢い利用方法
 
SoftLayer Bluemix Intro
SoftLayer Bluemix IntroSoftLayer Bluemix Intro
SoftLayer Bluemix Intro
 
SoftLayer Bluemix Summit 2015 Flyer
SoftLayer Bluemix Summit 2015 FlyerSoftLayer Bluemix Summit 2015 Flyer
SoftLayer Bluemix Summit 2015 Flyer
 
OSC15 Okinawa Intro SoftLayer and Bluemix
OSC15 Okinawa Intro SoftLayer and BluemixOSC15 Okinawa Intro SoftLayer and Bluemix
OSC15 Okinawa Intro SoftLayer and Bluemix
 
Introduction of public cloud softlayer and bluemix
Introduction of public cloud softlayer and bluemixIntroduction of public cloud softlayer and bluemix
Introduction of public cloud softlayer and bluemix
 
SoftLayer Bluemix Summit 2015
SoftLayer Bluemix Summit 2015SoftLayer Bluemix Summit 2015
SoftLayer Bluemix Summit 2015
 
クラウドに構築したWebサイトのセキュリティ対策やグローバル展開について
クラウドに構築したWebサイトのセキュリティ対策やグローバル展開についてクラウドに構築したWebサイトのセキュリティ対策やグローバル展開について
クラウドに構築したWebサイトのセキュリティ対策やグローバル展開について
 
Introduction softlayer and bluemix
Introduction softlayer and bluemixIntroduction softlayer and bluemix
Introduction softlayer and bluemix
 
5分で分かった気になるIoT
5分で分かった気になるIoT5分で分かった気になるIoT
5分で分かった気になるIoT
 
Build easy web system on softlayer
Build easy web system on softlayerBuild easy web system on softlayer
Build easy web system on softlayer
 

ライトプランで利用可能な分析基盤「IBM Analytics Engine (IAE)」とは

  • 1. ライトプランで利⽤可能な分析基盤 「IBM Analytics Engine (IAE)」とは DSX x IAE x Object Storage でデータ基盤を構築しよう ホートンワークスジャパン マーケティングディレクター 北瀬 公彦
  • 2. 2 Hortonworks 会社概要 創⽴ 2011年 Yahoo!のApache Hadoop オリジナルチームのメンバー24 ⼈のエンジニアが設⽴ 役員 CEO: ロブ・バーデン、COO:スコット・デイビッドソン オープンソースソフトウェアへ100%コミット Apache Hadoop プロジェクトへの貢献世界⼀ 2011年 創業、マイクロソフト社 (Azure HDInsight)と提携 2014年 9⽉ ⽇本法⼈ホートンワークスジャパン株式会社設⽴ 12⽉ NASDAQ上場(NASDAQ: HDP) 2015年 創業以来最速で売上$100Mを達成 Apache NiFiのOnyara社買収し、HDFを市場投⼊ 2016年 Billingが$270M越す、HDC for AWSを市場投⼊ 2016年 DellEMC社と提携 2017年 6⽉ 主⼒製品 新版HDP 2.6、HDF 3.0を市場投⼊ 6⽉ IBM社と提携 9⽉ 新製品・サービス HCPとDPSを市場投⼊ 会社概要 実績 次世代データプラットフォームのデファクトスタンダードを提供する オープンソースソフトウェア企業の世界的リーダー 受注実績 $ 270M (前年同期⽐ +62.7%) 売上実績 $ 184.5M(前年同期⽐ +51.4%) 3Q17/3Q16 Subscription Revenue Growth: 64% YoY 2016年度 $ 13.1 $ 18.1 $ 20.9 $ 25.6 $ 27.6 $ 31.0 $ 32.5 $ 35.6 $ 42.1 $ 45.8 $ 53.2 $ 9.2 $ 11.9 $ 11.3 $ 11.9 $ 13.7 $ 12.6 $ 15.1 $ 16.4 $ 13.9 $ 16.0 $ 15.8 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Q3 2015 2016 2017
  • 3. 3 14:55 [Room 2] IBM Cloud DBaaS の概要と事例紹介 野間 愛⼀郎 : IBM, Cloud Software & Analytics 15:45 [Room 2] DSXでデータ・サイエンス 河⽥ ⼤ : IBM, アナリティクス・テクニカル・セールス 14:30 [Room 1] ライトプランで利⽤可能な分析基盤「Analytics Engine」とは 北瀬 公彦 : ホートンワークスジャパン, マーケティングディレクター 本⽇のデータ関連サービスのセッション紹介
  • 4. 4 © Hortonworks Inc. 2011 – 2016. All Rights Reserved ⽣成されるデータの急増 出典: IDC's Data Age 2025 study, sponsored by Seagate https://www.seagate.com/files/www-content/our-story/trends/files/data-age-2025-infographic-2017.pdf
  • 5. 5 © Hortonworks Inc. 2011 – 2016. All Rights Reserved データの⽣成場所が個⼈から企業へ 出典: IDC's Data Age 2025 study, sponsored by Seagate https://www.seagate.com/files/www-content/our-story/trends/files/data-age-2025-infographic-2017.pdf
  • 6. 6 © Hortonworks Inc. 2011 – 2016. All Rights Reserved リアルタイムデータの増加 出典: IDC's Data Age 2025 study, sponsored by Seagate https://www.seagate.com/files/www-content/our-story/trends/files/data-age-2025-infographic-2017.pdf
  • 7. 7 © Hortonworks Inc. 2011 – 2016. All Rights Reserved AIシステムにより利⽤されるデータの増加 出典: IDC's Data Age 2025 study, sponsored by Seagate https://www.seagate.com/files/www-content/our-story/trends/files/data-age-2025-infographic-2017.pdf
  • 10. 10 © Hortonworks Inc. 2011 – 2016. All Rights Reserved Category OSS AWS Azure Google IBM ETL NiFi, Sqoop, Flume, etc Amazon Data Pipeline Azure Data Factory Azure Data Catalog Cloud DataPrep Data Connect メッセージング システム Kafka Amazon Kinesis Azure Event Hub Cloud Pub/Sub IBM Message Hub ビッグデータ 分散処理 Hadoop Spark Amazon EMR Azure HDInsight Cloud DataProc Cloud Dataflow IBM Analytics Engine (IAE) リアルタイム データ処理 Storm Amazon Kinesis Azure Stream Analytics Cloud Dataflow Streaming Analytics NoSQL MongoDB, CouchDB, HBase, Cassandra, etc Amazon DynamoDB Azure CosmosDB Azure Time Series Insights Cloud Datastore Cloud BigTable IBM Cloudant データウェアハウス Hive / Druid Amazon Redshift Azure SQL Datawarehouse BigQuery IBM Db2 Warehouse on Cloud クエリエンジン Hive, Impala, Presto Amazon Athena Azure Data Lake Analytics BigQuery BigInsights for Apache Hadoop (Big SQL) BI Superset, etc Amazon QuickSight PowerBI Google Data Studio Cognossなど、 UnmanagedなBI製品を 利用 データサイエンス Zeppelin Jupyter Notebook Amazon Machine Learning Azure Machine Learning Cloud DataLab IBM Data Science Experience マシーンラーニング Amazon Machine Learning Azure Machine Learning Cloud Machine Learning Services IBM Watson Machine Learning 参考: https://ilyas-it83.github.io/CloudComparer/ クラウドサービスの紹介 ビッグデータ・アナリティクス 注意: カバーできていない他のOSS、クラウドサービスもありますが、 作成者の視点により主要サービスのみカバーしています。
  • 11. 11 © Hortonworks Inc. 2011 – 2016. All Rights Reserved ストリーム データ転送 分散 ファイル システム データ ウェアハウス Business Intelligence 分散処理 データ サイエンス バルク データ転送 アドホック クエリー マシン ラーニング DB DB NoSQL Sensor Sensor 収集 蓄積 処理 分析⽤データ 可視化・分析・機械学習ソース ビッグデータ分析のための データパイプライン リアルタイム 処理
  • 12. 12 © Hortonworks Inc. 2011 – 2016. All Rights Reserved NiFi, Kafka HDFS Hive / Druid Superset Hadoop / Spark ZeppelinSqoop Hive QL / LLAP Storm, Spark Streaming Spark MLlibな どの機械学習 ライブラリを 使用して開発 DB DB Sensor Sensor 収集 蓄積 処理 分析⽤データ 可視化・分析・機械学習ソース ストリームデータ転送 バルクデータ転送 ビッグデータ関連OSSの紹介 OSS ビッグデータ・アナリティクス 注意: カバーできていない他のOSSもありますが、 作成者の視点により主要サービスのみカバーしています。 Mongo DB HBase, Cassandra
  • 13. 13 © Hortonworks Inc. 2011 – 2016. All Rights Reserved ここの話 収集 蓄積 処理 分析⽤データ 可視化・分析・機械学習ソース IBM Message Hub IBM Object Storage IBM Db2 Warehouse on Cloud Cognossなど、 Unmanagedな BI製品を利用 IBM Data Science Experience IBM Data Connect それぞれの サービスに 付属 IBM Watson Machine Learning DB DB IBM Cloudant IBM Analytics Engine (IAE) Sensor Sensor ストリームデータ転送 バルクデータ転送 クラウドサービスの紹介 IBM ビッグデータ・アナリティクス 注意: カバーできていないサービスもありますが、 作成者の視点により主要サービスのみカバーしています。 IBM Streaming Analytics
  • 14. 14 IBM Analytics Engine とは Ã マネージド Hadoop / Spark サービス – Hortonworks Data Platform (HDP) ベースに開発され、2017年11⽉にGA) Ã IBM Open Platform for Hadoop (IOP) や BigInsights for Apache Hadoop の後継 – IOPはすでにService Retired – BigInsights for Apache Hadoop もまもなくService Retired • Service Retirement Announce Date: November 7, 2017 • End of Marketing Date: December 7, 2017 • End of Support Date: November 7, 2018 Source: https://www.ibm.com/blogs/bluemix/2017/11/deprecation-of-biginsights-for-apache-hadoop-basic-plan/
  • 17. 17 IBM Data Science Experience (DSX) とは Ã データサイエンスに携わる全てのユーザ様向けのプラットフォーム Ã データ分析に必要な環境をAll In Oneで装備し、分析のサイクルを⼀気通貫 Ã データサイエンスを組織としてまわすために必要なコラボレーション機能 Ã Sparkを梱包しているためビッグデータ処理も対応 多様なデータ・ソースへ のアクセス機能 Python, R, SPSS ⾃動化された機械学習 API化
  • 18. 18 © Hortonworks Inc. 2011 – 2016. All Rights Reserved データサイエンス / 機械学習 テクノロジースタック DSX x IAE による Find Share Collaborate common data, pipelines and projects IBM Data Science Experience DATA SYSTEMSPlatforms On-Premise Private Cloud Cloud Security Operations Governance & Integration °1 ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° N YARN : Data Operating System Script Pig SQL Hive NoSQL HBase Stream Strom In-Mem Spark HDFS (Hadoop Distributed File System) Others BigSQL Clickstream Web & Social Geolocation Sensor & Machine Server Logs Unstructured Data Sources Apache Spark 内蔵 IBM Analytics Engine (Apache Hadoop / Spark 占有環境) Powered by Hortonworks 拡 張 可 能
  • 19. 19 デモスクリプト Ã IBM Analytics Engineでクラスタを作成 Ã 作成されたクラスタの確認 Ã IBM Data Science Experienceで、プロジェクトの作成 Ã Object Storage (S3)でバケットの作成 Ã Sparkサービスの作成 Ã IAEとDSXの連携 Ã Jupyter NotebookでNotebookの作成 Ã サンプルNotebookを実⾏
  • 20. 20 参考情報 à Web – https://www.ibm.com/cloud/analytics-engine à YouTube – https://www.youtube.com/watch?v=Qa2Zq0NkokM – https://www.youtube.com/watch?v=uf1aNmbfGZk à 関連記事 – https://japan.zdnet.com/article/35109884/