SlideShare ist ein Scribd-Unternehmen logo
1 von 27
Downloaden Sie, um offline zu lesen
© Talend 2014 1
ビッグデータの収集、整備、統合、活用の
ティップス
日時 :2014年6月27日(金)
於 :秋葉原コンベンションホール
主催 :翔泳社
Talend株式会社
コンサルティングマネージャー
正金秀規
DATA SCIENTIST SUMMIT 2014
【A-4】 15:30~16:10
本スライド内で引用される全ての商標、商標名、画像、ロゴ等は各社に帰属します
© Talend 2014 2
データ分析の阻害要因
© Talend 2014 3
歴史のある典型的なDWHシステム
DWHシステム
データマートDWHステージングエリア
ファイル類
ERP
Cloud / SaaS
DBMS
DWH
分析・
レポーティング
業務システム
最適化が必要
顧客情報分析、リスク分析
売上傾向分析、管理会計
サプライヤ分析、その他
© Talend 2014 4
ビジネスが
新たなデータを
要求する時代に
© Talend 2014 5
想定していなかった情報が業務を取り巻いてきています
天気情報
マーケット・ニュース
オープンデータ
センサーネットワーク
スマートメーター
データ量
データの種類
ソース数
データ量
データの鮮度
© Talend 2014 6
ビッグデータでトレンドな分析対象
〜構造・半構造・多構造・非構造データ〜
• 顧客インタラクションデータ
- クリックストリーム、WEBアクセスログ
- コールセンターのボイスデータ、e-mail
• ソーシャルネットワークデータ:Facebook,
Twitter等
• 非構造コンテンツ
• センサーデータ
- GPS位置情報、天気情報、光量、移動、振
幅、気圧、RFID/NFC等
• 業種・業界特化データ
- CDR:通話明細、銀行トランザクション等
出典:The Real-World Use
of Big Data Said Business
School Oxford and IBM,
October 2012
© Talend 2014 7
困難な点:ソースデータの複雑さ
• データの種類が多岐にわたる
- RDB等で管理された構造化データ
- 半構造化データ:XML, HTML, JSON等
- 非構造データ:テキスト
- マシン生成データ:センサーデータ等の特殊フォーマット
• データ量があまりに膨大
- ギガからペタへ
- 億から数十億へ
• 情報の鮮度に対する要求の高度化
- バッチ処理からストリームへの対応も考慮が必要
• データの意味を理解しなければならない
- データ項目には様々な意味があります
© Talend 2014 8
困難な点:ソースデータの複雑さ
アクセスログ
XML
画像データ
© Talend 2014 9
例:Twitter
タイムスタンプ
スクリーンネーム
時間帯
つぶやき
※以下は加工済みです
© Talend 2014 10
分析作業の負荷軽減と
精度向上、定着化のために
データの整理整頓が必要
© Talend 2014 11
データ分析と
ビッグデータインテグレーション
© Talend 2014 12
データ分析におけるプロセスと役割
仮説構築
データ
収集
データ
整備・変換
視覚化
データ
分析
データ
活用
データ
サイエンティスト
データ分析者
データ
インテグレーション
担当者
システム基盤
担当者
© Talend 2014 13
データ分析システム
昨今のデータ分析システムが保持すべき3つの機能
データ
インテグレーション機能
ビジネスインテリジェンス
機能
ビッグデータストア機能
仮説構築
データ
収集
データ
整備・変換
視覚化
データ
分析
データ
活用
© Talend 2014 14
ビッグデータストア機能とBIの役割
• ビッグデータストア機能
- Hadoop:大量データを蓄積
- NoSQL DB:データ・検索手法に
対する最適化
- Spark:インメモリ
• ビジネスインテリジェンス機能
- データ収集(必要なデータを見
つける)
- データ整理(有効な項目を見つ
ける)
- 視覚化
- 分析
© Talend 2014 15
データインテグレーション機能の役割
• データ収集の自動化
• コンバージョン
• クレンジング・フィルタリング
• 属性の付与・結合
• データストアへ投入
さらにインテグレーション担当者は、
• 分析担当者がパイロットした分析アルゴリズムを定形処理に実装
• 自動実行化することで定着化
© Talend 2014 16
データ分析システム
データ
インテグレーション機能
ビジネスインテリジェンス
機能
ビッグデータストア機能
モノ(道具と基盤)は投資獲得と共に順次拡張
例:ブループリント作成フェーズ
仮説構築
データ
収集
データ
整備・変換
視覚化
データ
分析
データ
活用
小規模体制、低コストで PRJプランニング、戦略、予算策定
© Talend 2014 17
データ分析システム
データ
インテグレーション機能
ビジネスインテリジェンス
機能
ビッグデータストア機能
モノ(道具と基盤)は投資獲得と共に順次拡張
例:コアシステム化フェーズ
OSS系インテグレーションツール BIツール
仮説構築
データ
収集
データ
整備・変換
視覚化
データ
分析
データ
活用
小規模体制、先ずはBIツールと基盤へ予算を振分けることも勘案
© Talend 2014 18
データ分析システム
データ
インテグレーション機能
ビジネスインテリジェンス
機能
ビッグデータストア機能
モノ(道具と基盤)は投資獲得と共に順次拡張
例:システム運用フェーズ
仮説構築
データ
収集
データ
整備・変換
視覚化
データ
分析
データ
活用
定形処理は、インテグレーションへ。小さなP-D-C-Aを積上げる
商用版インテグレーションツール BIツール
© Talend 2014 19
ビッグデータインテグレーションのポイント
システム構築やデータ分析は最終目標ではない、
データ分析やデータ統合によってビジネスを推進する、
ビジネス目標を達成することこそ目的
目的と手段を
取り違えない
スナップショットによるデータ統合や分析ではなく、
仮説・検証・データ分析という「PDCAサイクル」を
まわして実績を積み上げていく
スパイラル
アプローチ
データサイエンティスト(データ分析者)、データインテ
グレーション担当者、システム基盤担当者が一体と
なって進めることが重要
三身一体
© Talend 2014 20
ビッグデータ統合の
Talendを御紹介
© Talend 2014 21
Talendの概要と製品紹介
© Talend 2014 22
Talend Open Studio for
Talend Platform for ….
Talend製品体系
Talend Enterprise
With
Big Data
With
Big Data
With
Big Data
Talend Enterprise
Data Integration
Talend Enterprise
Big Data
Talend Enterprise
ESB
Talend Platform for
Big Data
Talend Platform for
Data Management
Talend Platform for
Data Services
Talend Platform for
Master Data Management
Talend Platform for
Enterprise Integration
© Talend 2014 23
複雑なMap Reduce処理をGUIで開発
• Map Reduceジョブデザインワークスペースでインディケーターを表示
- 実行時にMapステップとReduceステップの進捗状況とステータスをリアルタイム表示
- Map Reduceジョブのチューニングがビジュアルに可能
ビッグデータ
インテグレー
ションの
生産性を
飛躍的に
向上!
© Talend 2014 24
Talendの特徴:ダイナミックインテグレーション
• ダイナミックに発生するデータを迅速に取得していくインテグレーション
多種多様なソースデータの取得・収集を可能とする
500コンポーネントを搭載。
コミュニティには300以上のユーザー作成コンポーネントも
500以上の
コンポーネント
ビッグデータ統合処理をMapReduce上でネイティブでの
実行することが可能なため投資効果を高く保ちながら
無限のスケーラビリティを実現
Hadoop
ネイティブ稼働
ライセンス対象はTalendを使う人
データ量、サーバー数、CPU数、コネクター数はライセンス対象ではない
コンポーネントは無料提供
プライスモデルは、サブスクリプションモデル
ビジネスモデル
© Talend 2014 25
Talend製品で実装済みのコネクターやコンポーネント
Hadoop NoSQL DB DWH, Technology
Amazon Elastic
MapReduce
© Talend 2014 26
金融サービス
保険
通信
サービス
製造業
流通小売り
公共機関
教育
導入顧客例:ワールドワイド4,000+社、国内
200+社でご活用
© Talend 2014 27
Contact us:
info@talend.com
Learn more:
www.talend.com
お問合せ:
GroupSalesJP@talend.com
WEBサイト:
http://jp.talend.com
ご清聴有難う御座いました

Weitere ähnliche Inhalte

Was ist angesagt?

Talend5.4~もう少し深く知る~(技術セッション)
Talend5.4~もう少し深く知る~(技術セッション)Talend5.4~もう少し深く知る~(技術セッション)
Talend5.4~もう少し深く知る~(技術セッション)
Talend KK
 
大規模サイトを支えるビッグデータプラットフォーム技術
大規模サイトを支えるビッグデータプラットフォーム技術大規模サイトを支えるビッグデータプラットフォーム技術
大規模サイトを支えるビッグデータプラットフォーム技術
Yahoo!デベロッパーネットワーク
 

Was ist angesagt? (20)

Talend5.4~もう少し深く知る~(技術セッション)
Talend5.4~もう少し深く知る~(技術セッション)Talend5.4~もう少し深く知る~(技術セッション)
Talend5.4~もう少し深く知る~(技術セッション)
 
Use case and Live demo : Agile data integration from Legacy system to Hadoop ...
Use case and Live demo : Agile data integration from Legacy system to Hadoop ...Use case and Live demo : Agile data integration from Legacy system to Hadoop ...
Use case and Live demo : Agile data integration from Legacy system to Hadoop ...
 
【2017年5月時点】セルフサービスBIからエンタープライズまで展開できるOracle Business Analytics クラウドプラットフォームのご紹介
【2017年5月時点】セルフサービスBIからエンタープライズまで展開できるOracle Business Analytics クラウドプラットフォームのご紹介【2017年5月時点】セルフサービスBIからエンタープライズまで展開できるOracle Business Analytics クラウドプラットフォームのご紹介
【2017年5月時点】セルフサービスBIからエンタープライズまで展開できるOracle Business Analytics クラウドプラットフォームのご紹介
 
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
 
Investment in Yahoo! JAPAN's dataplatform and business growth by big data
Investment in Yahoo! JAPAN's dataplatform and business growth by big dataInvestment in Yahoo! JAPAN's dataplatform and business growth by big data
Investment in Yahoo! JAPAN's dataplatform and business growth by big data
 
ビッグデータとデータマート
ビッグデータとデータマートビッグデータとデータマート
ビッグデータとデータマート
 
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
 
大規模サイトを支えるビッグデータプラットフォーム技術
大規模サイトを支えるビッグデータプラットフォーム技術大規模サイトを支えるビッグデータプラットフォーム技術
大規模サイトを支えるビッグデータプラットフォーム技術
 
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
 
オープンソースカンファレンスBi勉強会20141018
オープンソースカンファレンスBi勉強会20141018オープンソースカンファレンスBi勉強会20141018
オープンソースカンファレンスBi勉強会20141018
 
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
 
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
 
【2017年4月時点】Oracle Essbase 概要
【2017年4月時点】Oracle Essbase 概要【2017年4月時点】Oracle Essbase 概要
【2017年4月時点】Oracle Essbase 概要
 
Oracle Data Integrator Cloud Serviceユーザーズガイド
Oracle Data Integrator Cloud ServiceユーザーズガイドOracle Data Integrator Cloud Serviceユーザーズガイド
Oracle Data Integrator Cloud Serviceユーザーズガイド
 
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
 
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
 
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
 
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
 
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
 
オープンデータプラグイン紹介資料
オープンデータプラグイン紹介資料オープンデータプラグイン紹介資料
オープンデータプラグイン紹介資料
 

Andere mochten auch

ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
Recruit Technologies
 
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
Amazon Web Services Japan
 

Andere mochten auch (20)

【Webinar-Slide】Talend2012年の戦略
【Webinar-Slide】Talend2012年の戦略【Webinar-Slide】Talend2012年の戦略
【Webinar-Slide】Talend2012年の戦略
 
Pdf
PdfPdf
Pdf
 
Talend勉強会 20150414
Talend勉強会 20150414Talend勉強会 20150414
Talend勉強会 20150414
 
業界での勝ち組になるためのビッグデータの取り組み~ここから始めよう!~
業界での勝ち組になるためのビッグデータの取り組み~ここから始めよう!~業界での勝ち組になるためのビッグデータの取り組み~ここから始めよう!~
業界での勝ち組になるためのビッグデータの取り組み~ここから始めよう!~
 
リクルートにおけるPaaS活用事例
リクルートにおけるPaaS活用事例リクルートにおけるPaaS活用事例
リクルートにおけるPaaS活用事例
 
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
 
リクルートにおけるhadoop活用事例+α
リクルートにおけるhadoop活用事例+αリクルートにおけるhadoop活用事例+α
リクルートにおけるhadoop活用事例+α
 
成功事例に学べ! これからの時代のビッグデータ活用最新ベストプラクティス [Oracle Cloud Days Tokyo 2016]
成功事例に学べ! これからの時代のビッグデータ活用最新ベストプラクティス [Oracle Cloud Days Tokyo 2016]成功事例に学べ! これからの時代のビッグデータ活用最新ベストプラクティス [Oracle Cloud Days Tokyo 2016]
成功事例に学べ! これからの時代のビッグデータ活用最新ベストプラクティス [Oracle Cloud Days Tokyo 2016]
 
ビッグデータはどこまで効率化できるか?
ビッグデータはどこまで効率化できるか?ビッグデータはどこまで効率化できるか?
ビッグデータはどこまで効率化できるか?
 
ユーザー企業内製CSIRTにおける対応のポイント
ユーザー企業内製CSIRTにおける対応のポイントユーザー企業内製CSIRTにおける対応のポイント
ユーザー企業内製CSIRTにおける対応のポイント
 
Case study of DevOps for Hadoop in Recruit.
Case study of DevOps for Hadoop in Recruit.Case study of DevOps for Hadoop in Recruit.
Case study of DevOps for Hadoop in Recruit.
 
RANCHERを使ったDev(Ops)
RANCHERを使ったDev(Ops)RANCHERを使ったDev(Ops)
RANCHERを使ったDev(Ops)
 
Struggle against cross-domain data complexity in Recruit group
Struggle against cross-domain data complexity in Recruit groupStruggle against cross-domain data complexity in Recruit group
Struggle against cross-domain data complexity in Recruit group
 
Spring “BigData”
Spring “BigData”Spring “BigData”
Spring “BigData”
 
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
 
「リクルートデータセット」 ~公開までの道のりとこれから~
「リクルートデータセット」 ~公開までの道のりとこれから~「リクルートデータセット」 ~公開までの道のりとこれから~
「リクルートデータセット」 ~公開までの道のりとこれから~
 
マーケティング・戦略・組織視点のBIGDATA活用について
マーケティング・戦略・組織視点のBIGDATA活用についてマーケティング・戦略・組織視点のBIGDATA活用について
マーケティング・戦略・組織視点のBIGDATA活用について
 
EMRでスポットインスタンスの自動入札ツールを作成する
EMRでスポットインスタンスの自動入札ツールを作成するEMRでスポットインスタンスの自動入札ツールを作成する
EMRでスポットインスタンスの自動入札ツールを作成する
 
クラウドを使って競争優位なビッグデータ活用の実現へ [Oracle Cloud Days Tokyo 2016]
クラウドを使って競争優位なビッグデータ活用の実現へ [Oracle Cloud Days Tokyo 2016]クラウドを使って競争優位なビッグデータ活用の実現へ [Oracle Cloud Days Tokyo 2016]
クラウドを使って競争優位なビッグデータ活用の実現へ [Oracle Cloud Days Tokyo 2016]
 

Ähnlich wie Data scientist summit 2014

[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
Amazon Web Services Japan
 
データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供
Denodo
 
Sap business suite on hana適合シナリオ診断 bsr サンプルレポート
Sap business suite on hana適合シナリオ診断 bsr サンプルレポートSap business suite on hana適合シナリオ診断 bsr サンプルレポート
Sap business suite on hana適合シナリオ診断 bsr サンプルレポート
Shiroh Kinoshita
 
企業の成長に合わせたシステムを選んで使えるクラウド型ERP『マネーフォワード クラウドERP』のご紹介_株式会社マネーフォワード
企業の成長に合わせたシステムを選んで使えるクラウド型ERP『マネーフォワード クラウドERP』のご紹介_株式会社マネーフォワード企業の成長に合わせたシステムを選んで使えるクラウド型ERP『マネーフォワード クラウドERP』のご紹介_株式会社マネーフォワード
企業の成長に合わせたシステムを選んで使えるクラウド型ERP『マネーフォワード クラウドERP』のご紹介_株式会社マネーフォワード
aokiyuka
 
IBMメインフレームデータのオープンシステム活用の様々な課題をPrecisely Connectが解決!
IBMメインフレームデータのオープンシステム活用の様々な課題をPrecisely Connectが解決!IBMメインフレームデータのオープンシステム活用の様々な課題をPrecisely Connectが解決!
IBMメインフレームデータのオープンシステム活用の様々な課題をPrecisely Connectが解決!
Precisely
 

Ähnlich wie Data scientist summit 2014 (20)

[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
 
HCCJP teradata final_20190906
HCCJP teradata final_20190906HCCJP teradata final_20190906
HCCJP teradata final_20190906
 
Speeda 20200507 saleshub
Speeda 20200507 saleshubSpeeda 20200507 saleshub
Speeda 20200507 saleshub
 
データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供
 
失敗談から学ぶ!アクションにつながるデータ分析のコツ[2014.12.11 開催セミナー]
失敗談から学ぶ!アクションにつながるデータ分析のコツ[2014.12.11 開催セミナー]失敗談から学ぶ!アクションにつながるデータ分析のコツ[2014.12.11 開催セミナー]
失敗談から学ぶ!アクションにつながるデータ分析のコツ[2014.12.11 開催セミナー]
 
プロジェクト管理支援環境の高度化に向けた取り組み
プロジェクト管理支援環境の高度化に向けた取り組みプロジェクト管理支援環境の高度化に向けた取り組み
プロジェクト管理支援環境の高度化に向けた取り組み
 
―政治力 Political power―クラウド型SFA/CRM/MSシステム開発-Cloud type SFA/CRM/MS systems deve...
―政治力 Political power―クラウド型SFA/CRM/MSシステム開発-Cloud type SFA/CRM/MS systems deve...―政治力 Political power―クラウド型SFA/CRM/MSシステム開発-Cloud type SFA/CRM/MS systems deve...
―政治力 Political power―クラウド型SFA/CRM/MSシステム開発-Cloud type SFA/CRM/MS systems deve...
 
株式会社ウェディス(wediss)会社案内
株式会社ウェディス(wediss)会社案内 株式会社ウェディス(wediss)会社案内
株式会社ウェディス(wediss)会社案内
 
Sap business suite on hana適合シナリオ診断 bsr サンプルレポート
Sap business suite on hana適合シナリオ診断 bsr サンプルレポートSap business suite on hana適合シナリオ診断 bsr サンプルレポート
Sap business suite on hana適合シナリオ診断 bsr サンプルレポート
 
疎結合設計の経済合理性判定モデルの検討
疎結合設計の経済合理性判定モデルの検討疎結合設計の経済合理性判定モデルの検討
疎結合設計の経済合理性判定モデルの検討
 
企業の成長に合わせたシステムを選んで使えるクラウド型ERP『マネーフォワード クラウドERP』のご紹介_株式会社マネーフォワード
企業の成長に合わせたシステムを選んで使えるクラウド型ERP『マネーフォワード クラウドERP』のご紹介_株式会社マネーフォワード企業の成長に合わせたシステムを選んで使えるクラウド型ERP『マネーフォワード クラウドERP』のご紹介_株式会社マネーフォワード
企業の成長に合わせたシステムを選んで使えるクラウド型ERP『マネーフォワード クラウドERP』のご紹介_株式会社マネーフォワード
 
IBMメインフレームデータのオープンシステム活用の様々な課題をPrecisely Connectが解決!
IBMメインフレームデータのオープンシステム活用の様々な課題をPrecisely Connectが解決!IBMメインフレームデータのオープンシステム活用の様々な課題をPrecisely Connectが解決!
IBMメインフレームデータのオープンシステム活用の様々な課題をPrecisely Connectが解決!
 
SIビジネスを変えよう。~ Ruby+Ruby on RailsによるエンタープライズCloudアプリケーション事業とは~
SIビジネスを変えよう。~ Ruby+Ruby on RailsによるエンタープライズCloudアプリケーション事業とは~SIビジネスを変えよう。~ Ruby+Ruby on RailsによるエンタープライズCloudアプリケーション事業とは~
SIビジネスを変えよう。~ Ruby+Ruby on RailsによるエンタープライズCloudアプリケーション事業とは~
 
Midworks
MidworksMidworks
Midworks
 
売上に効くデータ組織~データから売上や利益を作るために何をしているか~
売上に効くデータ組織~データから売上や利益を作るために何をしているか~売上に効くデータ組織~データから売上や利益を作るために何をしているか~
売上に効くデータ組織~データから売上や利益を作るために何をしているか~
 
Big Data Visual Analytics Realized By Hadoop and Tableau
Big Data Visual Analytics Realized By Hadoop and TableauBig Data Visual Analytics Realized By Hadoop and Tableau
Big Data Visual Analytics Realized By Hadoop and Tableau
 
ビジネスに貢献するIT部門への変革に必要な3つのポイント
ビジネスに貢献するIT部門への変革に必要な3つのポイントビジネスに貢献するIT部門への変革に必要な3つのポイント
ビジネスに貢献するIT部門への変革に必要な3つのポイント
 
HBの人材育成について 2022
HBの人材育成について 2022HBの人材育成について 2022
HBの人材育成について 2022
 
ランプライト
ランプライトランプライト
ランプライト
 
パブリッククラウド導入の実践ノウハウ
パブリッククラウド導入の実践ノウハウパブリッククラウド導入の実践ノウハウ
パブリッククラウド導入の実践ノウハウ
 

Kürzlich hochgeladen

Kürzlich hochgeladen (12)

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 

Data scientist summit 2014

  • 1. © Talend 2014 1 ビッグデータの収集、整備、統合、活用の ティップス 日時 :2014年6月27日(金) 於 :秋葉原コンベンションホール 主催 :翔泳社 Talend株式会社 コンサルティングマネージャー 正金秀規 DATA SCIENTIST SUMMIT 2014 【A-4】 15:30~16:10 本スライド内で引用される全ての商標、商標名、画像、ロゴ等は各社に帰属します
  • 2. © Talend 2014 2 データ分析の阻害要因
  • 3. © Talend 2014 3 歴史のある典型的なDWHシステム DWHシステム データマートDWHステージングエリア ファイル類 ERP Cloud / SaaS DBMS DWH 分析・ レポーティング 業務システム 最適化が必要 顧客情報分析、リスク分析 売上傾向分析、管理会計 サプライヤ分析、その他
  • 4. © Talend 2014 4 ビジネスが 新たなデータを 要求する時代に
  • 5. © Talend 2014 5 想定していなかった情報が業務を取り巻いてきています 天気情報 マーケット・ニュース オープンデータ センサーネットワーク スマートメーター データ量 データの種類 ソース数 データ量 データの鮮度
  • 6. © Talend 2014 6 ビッグデータでトレンドな分析対象 〜構造・半構造・多構造・非構造データ〜 • 顧客インタラクションデータ - クリックストリーム、WEBアクセスログ - コールセンターのボイスデータ、e-mail • ソーシャルネットワークデータ:Facebook, Twitter等 • 非構造コンテンツ • センサーデータ - GPS位置情報、天気情報、光量、移動、振 幅、気圧、RFID/NFC等 • 業種・業界特化データ - CDR:通話明細、銀行トランザクション等 出典:The Real-World Use of Big Data Said Business School Oxford and IBM, October 2012
  • 7. © Talend 2014 7 困難な点:ソースデータの複雑さ • データの種類が多岐にわたる - RDB等で管理された構造化データ - 半構造化データ:XML, HTML, JSON等 - 非構造データ:テキスト - マシン生成データ:センサーデータ等の特殊フォーマット • データ量があまりに膨大 - ギガからペタへ - 億から数十億へ • 情報の鮮度に対する要求の高度化 - バッチ処理からストリームへの対応も考慮が必要 • データの意味を理解しなければならない - データ項目には様々な意味があります
  • 8. © Talend 2014 8 困難な点:ソースデータの複雑さ アクセスログ XML 画像データ
  • 9. © Talend 2014 9 例:Twitter タイムスタンプ スクリーンネーム 時間帯 つぶやき ※以下は加工済みです
  • 10. © Talend 2014 10 分析作業の負荷軽減と 精度向上、定着化のために データの整理整頓が必要
  • 11. © Talend 2014 11 データ分析と ビッグデータインテグレーション
  • 12. © Talend 2014 12 データ分析におけるプロセスと役割 仮説構築 データ 収集 データ 整備・変換 視覚化 データ 分析 データ 活用 データ サイエンティスト データ分析者 データ インテグレーション 担当者 システム基盤 担当者
  • 13. © Talend 2014 13 データ分析システム 昨今のデータ分析システムが保持すべき3つの機能 データ インテグレーション機能 ビジネスインテリジェンス 機能 ビッグデータストア機能 仮説構築 データ 収集 データ 整備・変換 視覚化 データ 分析 データ 活用
  • 14. © Talend 2014 14 ビッグデータストア機能とBIの役割 • ビッグデータストア機能 - Hadoop:大量データを蓄積 - NoSQL DB:データ・検索手法に 対する最適化 - Spark:インメモリ • ビジネスインテリジェンス機能 - データ収集(必要なデータを見 つける) - データ整理(有効な項目を見つ ける) - 視覚化 - 分析
  • 15. © Talend 2014 15 データインテグレーション機能の役割 • データ収集の自動化 • コンバージョン • クレンジング・フィルタリング • 属性の付与・結合 • データストアへ投入 さらにインテグレーション担当者は、 • 分析担当者がパイロットした分析アルゴリズムを定形処理に実装 • 自動実行化することで定着化
  • 16. © Talend 2014 16 データ分析システム データ インテグレーション機能 ビジネスインテリジェンス 機能 ビッグデータストア機能 モノ(道具と基盤)は投資獲得と共に順次拡張 例:ブループリント作成フェーズ 仮説構築 データ 収集 データ 整備・変換 視覚化 データ 分析 データ 活用 小規模体制、低コストで PRJプランニング、戦略、予算策定
  • 17. © Talend 2014 17 データ分析システム データ インテグレーション機能 ビジネスインテリジェンス 機能 ビッグデータストア機能 モノ(道具と基盤)は投資獲得と共に順次拡張 例:コアシステム化フェーズ OSS系インテグレーションツール BIツール 仮説構築 データ 収集 データ 整備・変換 視覚化 データ 分析 データ 活用 小規模体制、先ずはBIツールと基盤へ予算を振分けることも勘案
  • 18. © Talend 2014 18 データ分析システム データ インテグレーション機能 ビジネスインテリジェンス 機能 ビッグデータストア機能 モノ(道具と基盤)は投資獲得と共に順次拡張 例:システム運用フェーズ 仮説構築 データ 収集 データ 整備・変換 視覚化 データ 分析 データ 活用 定形処理は、インテグレーションへ。小さなP-D-C-Aを積上げる 商用版インテグレーションツール BIツール
  • 19. © Talend 2014 19 ビッグデータインテグレーションのポイント システム構築やデータ分析は最終目標ではない、 データ分析やデータ統合によってビジネスを推進する、 ビジネス目標を達成することこそ目的 目的と手段を 取り違えない スナップショットによるデータ統合や分析ではなく、 仮説・検証・データ分析という「PDCAサイクル」を まわして実績を積み上げていく スパイラル アプローチ データサイエンティスト(データ分析者)、データインテ グレーション担当者、システム基盤担当者が一体と なって進めることが重要 三身一体
  • 20. © Talend 2014 20 ビッグデータ統合の Talendを御紹介
  • 21. © Talend 2014 21 Talendの概要と製品紹介
  • 22. © Talend 2014 22 Talend Open Studio for Talend Platform for …. Talend製品体系 Talend Enterprise With Big Data With Big Data With Big Data Talend Enterprise Data Integration Talend Enterprise Big Data Talend Enterprise ESB Talend Platform for Big Data Talend Platform for Data Management Talend Platform for Data Services Talend Platform for Master Data Management Talend Platform for Enterprise Integration
  • 23. © Talend 2014 23 複雑なMap Reduce処理をGUIで開発 • Map Reduceジョブデザインワークスペースでインディケーターを表示 - 実行時にMapステップとReduceステップの進捗状況とステータスをリアルタイム表示 - Map Reduceジョブのチューニングがビジュアルに可能 ビッグデータ インテグレー ションの 生産性を 飛躍的に 向上!
  • 24. © Talend 2014 24 Talendの特徴:ダイナミックインテグレーション • ダイナミックに発生するデータを迅速に取得していくインテグレーション 多種多様なソースデータの取得・収集を可能とする 500コンポーネントを搭載。 コミュニティには300以上のユーザー作成コンポーネントも 500以上の コンポーネント ビッグデータ統合処理をMapReduce上でネイティブでの 実行することが可能なため投資効果を高く保ちながら 無限のスケーラビリティを実現 Hadoop ネイティブ稼働 ライセンス対象はTalendを使う人 データ量、サーバー数、CPU数、コネクター数はライセンス対象ではない コンポーネントは無料提供 プライスモデルは、サブスクリプションモデル ビジネスモデル
  • 25. © Talend 2014 25 Talend製品で実装済みのコネクターやコンポーネント Hadoop NoSQL DB DWH, Technology Amazon Elastic MapReduce
  • 26. © Talend 2014 26 金融サービス 保険 通信 サービス 製造業 流通小売り 公共機関 教育 導入顧客例:ワールドワイド4,000+社、国内 200+社でご活用
  • 27. © Talend 2014 27 Contact us: info@talend.com Learn more: www.talend.com お問合せ: GroupSalesJP@talend.com WEBサイト: http://jp.talend.com ご清聴有難う御座いました