SlideShare a Scribd company logo
1 of 11
1
MongoDB と Pentaho をつないでみる
ハンズオン
オープンソース BI 勉強会 #5
2014/04/22
中山久司
2
オープンソース BI/BA の世界
データソース
ERP データ
SCM ・ CRM 等データ
レガシーシステム等
Web ログ
GPS,RFID 等
MongoD
B
セールス
人事
ファイナンス
DWH/ データマート :RDBMS
モデリング
シー
ム
レ
ス
な
連
携
Excel
OLAP
(多次元分
析)
定型業務レポー
ト
アドホックレ
ポート
データマイニン
グ
(予測、要因分
析)
Big Data : NoSQL
① 集める、蓄積する ② 使いやすくモデリングする③ 情報を使いこなす、活用する
Pentaho
333
Pentaho はいろいろあって楽しい
Pentaho Data Integration
ETLデザイン
クライアントツール
Pentaho ダッシュボード
Community Dashboard Framework ブラウザ
UI 
Pentaho データマイニング
Weka
クライアントツール
Pentaho OLAP Saiku
ブラウザ UI
Pentaho Report Designer
定型レポート作成
クライアントツール
Pentaho BA Server
Tomcat上のアプリサーバー
4
Pentaho はいろいろなビッグデータとつながって
嬉しい
Hadoop NoSQL Analytic Databases
5
MongoDB と Pentaho をつないでみる(構成図
)
MongoDB
レポート作成
クライアントツー
ル
データ統合
クライアントツー
ル
6
MongoDB   インストールとデータ準備、動作確認
MongoDB 勉強会の渡部さんよりガイドいただきます
https://github.com/syokenz/marunouchi-
mongodb/blob/master/20140422/README.md
MongoDB と Pentaho をつないでみる(準備)
7
Pentaho
  今回は DataIntegration と ReportDesigner をダウンロードして
   COPY する
    http://sourceforge.net/projects/pentaho/files/Data
%20Integration/
pdi-ce-5.0.1.A-stable.zip (423.8MB)
http://sourceforge.net/projects/jfreereport/files/04.%20Report
%20Designer/5.0.1-stable/
prd-ce-5.0.1-stable.zip(281.2MB windows)
prd-ce-mac-5.0.1-stable.zip(330.3MB mac)
事前に必要なソフトウェア: JavaSE   7
環境変数 PENTAHO_JAVA_HOME 又は
JAVA_HOME にロケーションを指定して下さい
MongoDB と Pentaho をつないでみる(準備)
8
MongoDB とつないでみる( Data
Integration )1. Pentaho Data Integration の起動
     spoon.bat / spoon.sh
2. ファイル - 新規作成 - データ変換( transformation)
3. デザイン(タブ)で、 BigData-MongoDB Input を選択、
 ドラック&ドロップで右のデザインパネルへ
4. デザインパネルに置いた
   MongoDB Input をダブル
  クリックして接続設定
( InputOption で GetDBs を押して
  pentaho を選択、
Getcollections を押して events
 を選択)
  プレビューしてみる
9
MongoDB とつないでみる( Report
Designer )1. Pentaho Report Desginer の起動
report-designer.bat / report-designer.sh
2. サンプルを開く  
ファイル - 開く -chapter06_clickstream_report.prpt
10
PentahoAnalytics for   MongoDB    
http://events.pentaho.com/Pentaho-Analytics-for-MongoDB.html
Pentaho 日本語フォーラム
参考書
11
Thanks!

More Related Content

What's hot

What's hot (20)

[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
 
Power BI とは - 2020
Power BI とは - 2020Power BI とは - 2020
Power BI とは - 2020
 
kintoneではじめるビジネスインテリジェンス
kintoneではじめるビジネスインテリジェンスkintoneではじめるビジネスインテリジェンス
kintoneではじめるビジネスインテリジェンス
 
データ分析で Excel を活用しよう
データ分析で Excel を活用しようデータ分析で Excel を活用しよう
データ分析で Excel を活用しよう
 
For Power BI Beginners
For Power BI BeginnersFor Power BI Beginners
For Power BI Beginners
 
【KSKアナリティクス】Pentaho紹介
【KSKアナリティクス】Pentaho紹介【KSKアナリティクス】Pentaho紹介
【KSKアナリティクス】Pentaho紹介
 
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組みData Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
 
データ分析基盤について
データ分析基盤についてデータ分析基盤について
データ分析基盤について
 
マルチクラウドで実演するカスタマーセントリックな分析基盤
マルチクラウドで実演するカスタマーセントリックな分析基盤マルチクラウドで実演するカスタマーセントリックな分析基盤
マルチクラウドで実演するカスタマーセントリックな分析基盤
 
Cm re growth-devio-mtup11-sapporo-004
Cm re growth-devio-mtup11-sapporo-004Cm re growth-devio-mtup11-sapporo-004
Cm re growth-devio-mtup11-sapporo-004
 
データ分析基盤運⽤チームの 運⽤業務を改善してみた話
データ分析基盤運⽤チームの 運⽤業務を改善してみた話データ分析基盤運⽤チームの 運⽤業務を改善してみた話
データ分析基盤運⽤チームの 運⽤業務を改善してみた話
 
20160301 5日でできるクラウドで始めるデータ利活用 新日鉄住金ソリューションズ株式会社
20160301 5日でできるクラウドで始めるデータ利活用 新日鉄住金ソリューションズ株式会社20160301 5日でできるクラウドで始めるデータ利活用 新日鉄住金ソリューションズ株式会社
20160301 5日でできるクラウドで始めるデータ利活用 新日鉄住金ソリューションズ株式会社
 
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみたAWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた
 
OData って何?
OData って何?OData って何?
OData って何?
 
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
 
DX認定制度システム開発裏話:技術編
DX認定制度システム開発裏話:技術編DX認定制度システム開発裏話:技術編
DX認定制度システム開発裏話:技術編
 
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
 
Hadoop Conference Japan 2016 LT資料 グラフデータベース事始め
Hadoop Conference Japan 2016 LT資料 グラフデータベース事始めHadoop Conference Japan 2016 LT資料 グラフデータベース事始め
Hadoop Conference Japan 2016 LT資料 グラフデータベース事始め
 
dotNET600 PowerBI
dotNET600 PowerBIdotNET600 PowerBI
dotNET600 PowerBI
 
10分で分かるPower BI
10分で分かるPower BI10分で分かるPower BI
10分で分かるPower BI
 

Viewers also liked

Grupo RICARDO,SHERMAN,JESSENIA
Grupo RICARDO,SHERMAN,JESSENIAGrupo RICARDO,SHERMAN,JESSENIA
Grupo RICARDO,SHERMAN,JESSENIA
Jesse Chavez
 

Viewers also liked (16)

Grupo RICARDO,SHERMAN,JESSENIA
Grupo RICARDO,SHERMAN,JESSENIAGrupo RICARDO,SHERMAN,JESSENIA
Grupo RICARDO,SHERMAN,JESSENIA
 
Pentaho 定型レポート ハンズオン
Pentaho 定型レポート ハンズオンPentaho 定型レポート ハンズオン
Pentaho 定型レポート ハンズオン
 
Weka分類学習アルゴリズムの利用法(その1)
Weka分類学習アルゴリズムの利用法(その1)Weka分類学習アルゴリズムの利用法(その1)
Weka分類学習アルゴリズムの利用法(その1)
 
フォーラムパネル討論 20140908 for_upload
フォーラムパネル討論 20140908 for_uploadフォーラムパネル討論 20140908 for_upload
フォーラムパネル討論 20140908 for_upload
 
Pentaho CTools 20140902
Pentaho CTools 20140902Pentaho CTools 20140902
Pentaho CTools 20140902
 
Pentaho
PentahoPentaho
Pentaho
 
Lambda in java_20160121
Lambda in java_20160121Lambda in java_20160121
Lambda in java_20160121
 
Pdi tutorial 20140121
Pdi tutorial 20140121Pdi tutorial 20140121
Pdi tutorial 20140121
 
Pentaho Reporting Tutorial 20140729
Pentaho Reporting Tutorial 20140729Pentaho Reporting Tutorial 20140729
Pentaho Reporting Tutorial 20140729
 
Diary of Support Engineer
Diary of Support EngineerDiary of Support Engineer
Diary of Support Engineer
 
Pentaho ETL ハンズオン
Pentaho ETL ハンズオンPentaho ETL ハンズオン
Pentaho ETL ハンズオン
 
pentaho PDI(CE版)の運用
pentaho PDI(CE版)の運用pentaho PDI(CE版)の運用
pentaho PDI(CE版)の運用
 
Internals of Presto Service
Internals of Presto ServiceInternals of Presto Service
Internals of Presto Service
 
状態空間モデルの実行方法と実行環境の比較
状態空間モデルの実行方法と実行環境の比較状態空間モデルの実行方法と実行環境の比較
状態空間モデルの実行方法と実行環境の比較
 
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
 
Rパッケージ“KFAS”を使った時系列データの解析方法
Rパッケージ“KFAS”を使った時系列データの解析方法Rパッケージ“KFAS”を使った時系列データの解析方法
Rパッケージ“KFAS”を使った時系列データの解析方法
 

Similar to オープンソースBI勉強会Mongo-Pentaho 20140422

Hadoop Conference Japan 2011 Fall: マーケティング向け大規模ログ解析事例紹介
Hadoop Conference Japan 2011 Fall: マーケティング向け大規模ログ解析事例紹介Hadoop Conference Japan 2011 Fall: マーケティング向け大規模ログ解析事例紹介
Hadoop Conference Japan 2011 Fall: マーケティング向け大規模ログ解析事例紹介
Kenji Hara
 
Intalio Private Cloud Platform( = Bpm2.0 + Office 2.0) 研究セミナー第一回
Intalio Private Cloud Platform( = Bpm2.0 + Office 2.0) 研究セミナー第一回Intalio Private Cloud Platform( = Bpm2.0 + Office 2.0) 研究セミナー第一回
Intalio Private Cloud Platform( = Bpm2.0 + Office 2.0) 研究セミナー第一回
Tomoaki Sawada
 
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
Amazon Web Services Japan
 

Similar to オープンソースBI勉強会Mongo-Pentaho 20140422 (20)

Developers Summit 2012 16-E-1
Developers Summit 2012 16-E-1Developers Summit 2012 16-E-1
Developers Summit 2012 16-E-1
 
マーケティング向け大規模ログ解析事例紹介
マーケティング向け大規模ログ解析事例紹介マーケティング向け大規模ログ解析事例紹介
マーケティング向け大規模ログ解析事例紹介
 
RPALT_20200309Aomori
RPALT_20200309AomoriRPALT_20200309Aomori
RPALT_20200309Aomori
 
Hadoop Conference Japan 2011 Fall: マーケティング向け大規模ログ解析事例紹介
Hadoop Conference Japan 2011 Fall: マーケティング向け大規模ログ解析事例紹介Hadoop Conference Japan 2011 Fall: マーケティング向け大規模ログ解析事例紹介
Hadoop Conference Japan 2011 Fall: マーケティング向け大規模ログ解析事例紹介
 
RPA勉強会 Power BI を学ぶ特別編!
RPA勉強会 Power BI を学ぶ特別編!RPA勉強会 Power BI を学ぶ特別編!
RPA勉強会 Power BI を学ぶ特別編!
 
Accelerate Migration to the Cloud using Data Virtualization
Accelerate Migration to the Cloud using Data VirtualizationAccelerate Migration to the Cloud using Data Virtualization
Accelerate Migration to the Cloud using Data Virtualization
 
Strata conference 2012
Strata conference 2012Strata conference 2012
Strata conference 2012
 
Implementation Approach of Artifical Intelligence
Implementation Approach of Artifical IntelligenceImplementation Approach of Artifical Intelligence
Implementation Approach of Artifical Intelligence
 
Intalio Private Cloud Platform( = Bpm2.0 + Office 2.0) 研究セミナー第一回
Intalio Private Cloud Platform( = Bpm2.0 + Office 2.0) 研究セミナー第一回Intalio Private Cloud Platform( = Bpm2.0 + Office 2.0) 研究セミナー第一回
Intalio Private Cloud Platform( = Bpm2.0 + Office 2.0) 研究セミナー第一回
 
ちょっと理解に自信がないな という皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
ちょっと理解に自信がないな という皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
 
避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題
 
Part 4: Power Platform 概説 (製造リファレンス・アーキテクチャ勉強会)
Part 4: Power Platform 概説 (製造リファレンス・アーキテクチャ勉強会)Part 4: Power Platform 概説 (製造リファレンス・アーキテクチャ勉強会)
Part 4: Power Platform 概説 (製造リファレンス・アーキテクチャ勉強会)
 
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
 
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
 
Polyglot Persistence and Graph Schema
Polyglot Persistence and Graph SchemaPolyglot Persistence and Graph Schema
Polyglot Persistence and Graph Schema
 
ユーザ目線の実践的BPM
ユーザ目線の実践的BPMユーザ目線の実践的BPM
ユーザ目線の実践的BPM
 
あなたの知っているSAPは古いかもしれません
あなたの知っているSAPは古いかもしれませんあなたの知っているSAPは古いかもしれません
あなたの知っているSAPは古いかもしれません
 
え!? Power BI の画面からデータ更新なんてできるの!?
え!? Power BI の画面からデータ更新なんてできるの!?え!? Power BI の画面からデータ更新なんてできるの!?
え!? Power BI の画面からデータ更新なんてできるの!?
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
 
プライベートクラウドの動向とIT業へのインパクト(インタリオセミナー072409)最終版
プライベートクラウドの動向とIT業へのインパクト(インタリオセミナー072409)最終版プライベートクラウドの動向とIT業へのインパクト(インタリオセミナー072409)最終版
プライベートクラウドの動向とIT業へのインパクト(インタリオセミナー072409)最終版
 

More from Hisashi Nakayama (7)

BI勉強会20150624 LT-Tika
BI勉強会20150624 LT-TikaBI勉強会20150624 LT-Tika
BI勉強会20150624 LT-Tika
 
Bi勉強会20150302 lt-sparkl
Bi勉強会20150302 lt-sparklBi勉強会20150302 lt-sparkl
Bi勉強会20150302 lt-sparkl
 
BI勉強会0729-2jedox-paloの紹介
BI勉強会0729-2jedox-paloの紹介BI勉強会0729-2jedox-paloの紹介
BI勉強会0729-2jedox-paloの紹介
 
BI勉強会0729-1 PentahoCE5.1 on Amazon AWS
BI勉強会0729-1 PentahoCE5.1 on Amazon AWSBI勉強会0729-1 PentahoCE5.1 on Amazon AWS
BI勉強会0729-1 PentahoCE5.1 on Amazon AWS
 
BI勉強会20140617LT
BI勉強会20140617LTBI勉強会20140617LT
BI勉強会20140617LT
 
R勉強会40回lt
R勉強会40回ltR勉強会40回lt
R勉強会40回lt
 
オープンソースBI勉強会Mongo-20140325
オープンソースBI勉強会Mongo-20140325オープンソースBI勉強会Mongo-20140325
オープンソースBI勉強会Mongo-20140325
 

オープンソースBI勉強会Mongo-Pentaho 20140422