SlideShare ist ein Scribd-Unternehmen logo
1 von 23
Downloaden Sie, um offline zu lesen
Hadoop Conference Japan 2009




SI事業の視点から見た Hadoop の適用領域と今後の展望
        ~ NTTデータにおけるHadoopへの取り組み ~



                                  2009年11月13日


                           株式会社 NTTデータ
                           基盤システム事業本部
                               政谷


                                  Copyright ©2009 NTT DATA Corporation
担当紹介
NTTデータ 基盤システム事業本部 OSS技術統括部
 Linux/OSSを利用したシステム構築・運用をサポートする業務を担当
  OSSによるシステム基盤 Prossione®
   – 徹底的に検証・評価したOSSの組み合わせ、設定・運用のノウハウの提供
   – 高品質なシステム基盤を実現する仕組みの整備

  OSSのサポートサービス Linaccident®
   – 幅広いOSSを対象とするプロフェッショナルサービスの提供


 最近は、OSSを活用したクラウド分散処理基盤 Hadoopの技術整備
 も担当


『象』 好きです
                                    PostgreSQL          Hadoop

                 Copyright ©2009 NTT DATA Corporation            1
本日のアジェンダ


Hadoopへの取り組み
OSSベースの企業ITシステム規模と動向
NTTデータの取り組み
Hadoop+OSSで今後のITはどう変わるのか




          Copyright ©2009 NTT DATA Corporation   2
Hadoopへの取り組み



   Copyright ©2009 NTT DATA Corporation   3
OSSの未来

    従来技術は、必要充分な性能をもっ
性
    た後発のローエンド技術に凌駕されて                                          ム)
能                                                            レー
    いく!
                                                イ ンフ
                                           (メ
                           OS
                         独自                    ws
                                              NI
                                                 X
                   ド+                     n do
                                            U
    一般的な        ハ ー
                         ー ド+          Wi       SS
    顧客が利
         用     自       ハ            +         O
             独                             +
        能
                    独 自         ーバ
    可能な性
                                      ーバ
                                                 「メトカーフの法則」
                            IAサ
                                   Aサ
                                                ネットワークの価値は
                                 I              ユーザ数の2乗に比例
                                                                    (マス・コラボレーションの時代)
                                                                       「ギルダーの法則」
                                                                     ネットワークの通信速度は
                              「ムーアの法則」                                  6~9ヵ月で2倍
                           半導体集積密度は18ヵ月で2倍                            (ネットワークの時代)

         1970         1980                         1990                2000      未来
                      Copyright ©2009 NTT DATA Corporation                             4
クラウド時代のITシステム ...
IT基盤をより Smart に
 無駄を減らすことによる効率化、資源のプール化などで実現
 単一性と多様性のバランスが練られたシステム
 コモディティ技術を使い切ることがポイントに

スケールアウト技術を身近なものに
 IAサーバ+OSSにより多数のサーバの利用が容易化
 新しい処理モデルやデータモデルの浸透
   従来のACIDを求める処理方式とは異なるモデル
   MapReduceアルゴリズム、Key-Valueストア、自律分散協調システム など




                  Copyright ©2009 NTT DATA Corporation   5
なぜ Hadoop か?
 今まで扱うことが難しかった領域を切り拓く
      ペタバイトクラスのデータ、大規模分散処理
      数千台規模のサーバを用いることで、従来は困難であった処理が実現できる

 『定型的な業務データ』 処理の枠組みにとらわれない
      単純なETLではなく 準定型的なデータも扱える 柔軟な ETL & ELT                                                (*1)

      プロセス指向だけでなく、データ指向に基づいた
      システムの浸透

                                                                  Extract      Transform          Load

 ターゲット                                                                         Transform
                                                                                Analyze
      現在: コスト、スケールに価値を
          見出す 『先見派』
                                                                   Source             Data
      今後: さらなる生産性向上の手段を                                                             Repository

          求めている 『実利派』
* “Impact of Cloud Computing on Research in Extreme Scale Analytics” Hamid Prahesh pirahesh@almaden.ibm.com
                                        Copyright ©2009 NTT DATA Corporation                                  6
OSSベースの企業ITシステム
     規模と動向



     Copyright ©2009 NTT DATA Corporation   7
OSS構築実績 (規模・処理量マップ)
 処理量
(万件/時)
                                                                                        ~150TPS
                                                                                        ~2TB
60

                                                                      ●



40
                 ●                                                            ●
                             ●
                                                             ●

20
                                     ●           敢えて乱暴に絵を描いてみる
                                                             ●



                                             ●
10
                                                   ●
                 ●                       ●                                ●
                                 ●
 5                                   ●                 ●              ●
         ●               ●
             ●                       ●

     10万件            100万件           300万件       500万件           1000万件           1億件     10億件
                                                                                        DB規模


                                                 Copyright ©2009 NTT DATA Corporation             8
OSS構築実績 (規模・処理量マップ)
 処理量
(万件/時)                                                                                           ~数PB


                                                                                                        構築・運用
60
                                                                                                         支援中
                                                                      ●



40
                 ●                                                            ●
                             ●
                                                             ●

20                                                                                      ●
                                     ●


                                             ●
10
                                                   ●                                        経産省
                 ●                       ●                                ●                 実証案件
                                 ●
 5                                   ●                 ●                                    実施中
                                                                      ●
         ●               ●
             ●                       ●

     10万件            100万件           300万件       500万件           1000万件           1億件     10億件
                                                                                        DB規模


                                                 Copyright ©2009 NTT DATA Corporation                           9
OSS構築実績 (規模・処理量マップ)
 処理量
(万件/時)



60
                                                                                                先見派
                                                                                        今後のターゲット
                                                                      ●
                                                                                          領域
40                                                                            実利派
                                                                              ●
                 ●
                             ●
                                                                                                    構築・運用
                                                                                                     支援中
                                                             ●

20                                                                                       ●
                                     ●


                                             ●
10
                                                   ●                                         経産省
                 ●                       ●                                ●                  実証案件
                                 ●
 5                                   ●                 ●                                     実施中
                                                                      ●
         ●               ●
             ●                       ●

     10万件            100万件           300万件       500万件           1000万件           1億件      10億件
                                                                                         DB規模


                                                 Copyright ©2009 NTT DATA Corporation                   10
NTTデータの取り組み



   Copyright ©2009 NTT DATA Corporation   11
2匹目の象を育むために
                           新技術普及の流れ
   顧
   客
   数                PostgreSQL                サーバLinux

                    キャズム
                                 パフォーマンス市場(ハイエンド)
           Hadoop
                                 バリュー市場(メインストリーム)
         先見派                                                               懐疑派
       マニア                       実利派                         保守派
                                                                                      時間
顧客が自分で改造   自分で組み合わせる       技術に強い、リスクは取らない               技術に強くはない、コモディティ化した技術を   組み込まれて目に
                           生産性向上の手段を求めている               マーケット・リーダから購入、手厚いサポート   見えなければ購入
                                                        必須




       要件定義支援サービス、設計・構築サービス の提供
       要件定義支援サービス、設計・構築サービス の提供
       OSからHadoopまで一貫した スタックサポートサービス、
       OSからHadoopまで一貫した スタックサポートサービス、
       オンサイト障害対応サービス の提供
       オンサイト障害対応サービス の提供
       OSS基盤を使ったシステム構築の 実績作り
       OSS基盤を使ったシステム構築の 実績作り
                                  Copyright ©2009 NTT DATA Corporation                     12
3つのクラウドタイプ

              Amazon                    Force.com         Hadoop
             タイプのIaaS                  タイプのPaaS          タイプのPaaS
                                      徹底した                 徹底した
             徹底した
  特徴      仮想化インフラの追及
                                  マルチテナンシーの追及           スケーラビリティの追及
                                     (DB仮想化)               (BASE)
                                         Webアプリ           大規模データ
             Webアプリ                      ワークフロー             BI/DWH
             一品モノ                      ビジネスプロセス系           センサー系
適したアプリ    既存アプリのマイグレー                   参照・問合せ系          分析系、バッチ系
              ション                      キャンペーンサイト         参照・問合せ系
                                        社内システム             メディア系

                                       高トランザクション           リアルタイム
                                       高インタラクティブ
適さないアプリ   大規模データ、BI/DWH               メディア系コンテンツ
                                                          トランザクション
                                     大規模データ、BI/DWH       高インタラクティブ

           (Web/AP/DB)サーバ                                 MapReduce
                                   (AP/API/検索)サーバ
          ゲストOS、ゲストOS、・・・                               分散ファイルシステム
スタック構成    VMM(ハイパーバイザー)
                                       DBクラスタ
                                                             OS
                                         ハード
                 ハード                                        ハード




                 Copyright ©2009 NTT DATA Corporation                 13
経産省 「実証事業」 に Hadoopベースの提案が採択

テーマ:クラウド型分散処理基盤 (Hadoop) の適用性評価
基盤の観点では...

 クラウド基盤信頼性向上への取り組み
  Master Server の冗長化
    確立した Heartbeat + DRBD に加えて Kemari + DRBD を評価


 クラウド基盤運用効率化への取り組み
  初期構築・増設、故障交換時のノードの自動構成を標準的な
  製品機能とOSSの組合せで実現
  サーバの種別・機種が混在する環境でも適用可能な実装を実証



                    Copyright ©2009 NTT DATA Corporation   14
Heartbeat + DRBD による Master Server の冗長化
Master Server(NameNode,JobTracker)の冗長化を実現
  Heartbeat
      Linux-HAプロジェクトによって開発されたサーバのHAソフトウェア
      http://www.linux-ha.org/ja/HomePage_ja
  DRBD(Distributed Replicated Block Device)
      2台のサーバ間でディスク上のデータミラーリングを実現するソフトウェア
      http://www.drbd.org/



                 NameNode                                               NameNode

                 heartbeat                                              heartbeat
                                永続データの同期型ミラー
                  DRBD                                                   DRBD

                                                                                NameNode(待機系)
 NameNode(現用系)




          イメージファイル
                 editsファイル    Heartbeat/ミラーリング LAN
                                                                    イメージファイル
                                                                           editsファイル

                             Copyright ©2009 NTT DATA Corporation                               15
Master Server冗長化 (続き)
Master Serverのうち、 Job Trackerは永続データの引き継ぎは不要
NameNodeの冗長化では永続データの引継ぎが必要

  イメージファイル
    HDFS上のデータに対する格納先ノード、ブロックサイズなどのメタ情報が格納されたファイル
    NameNode起動時にメモリにロードされ、チェックポイントのタイミング及び、NameNode停止
    時にディスク上のファイルにフラッシュされる。
  editsファイル
    イメージファイルに対するトンラザクションログ
    メタ情報の更新時はイメージファイルではなく、トランザクションログに更新内容が出力

  NameNodeの異常終了(プロセスダウンなど)後にNameNodeを起動する場合、
  イメージファイルにeditsファイルの更新内容が適用され、異常終了直前の整合性が
  維持された状態にメタ情報が復元される。



Job Trackerのハード故障時、実行中のJobの内容は失われる...
 長時間かけた処理の結果が失われるのは辛い


                   Copyright ©2009 NTT DATA Corporation   16
“Kemari” ?




蹴鞠    (Kemari)

鞠を落とさない!
 ↓
サーバを落とさない!




http://www.ntt.co.jp/cclab/activity/category_6/a_product_01.html
http://www.osrg.net/kemari/
                      Copyright © 2007-2008 Nippon Telegraph and Telephone Corporation   17   17
                                     Copyright ©2009 NTT DATA Corporation
“Kemari” + DRBD による Master Server の冗長化

Job Tracker ハード故障時でも、Job の中断・再試行を回避できる

Kemari KVM版 開発中!!

[2] 運用系の差分を転送                                                          [3] 差分で待機系を更新


     Kemari
     Kemari                                                                                Kemari
     差分転送
     差分転送                                                                                  差分更新
   Dom0                    DomU
                                            Sync DomU                    DomU             Dom0

    Back-end              Front-end                                     Front-end          Back-end


          Kemari イベントチャネル
          Kemari イベントチャネル                                                           Xen
                 Xen
                                                Network
               Hardware                                                         Hardware

[1] 特定のイベントを                            DRBD or SAN
 補足し、VMを一時停止



                                Copyright ©2009 NTT DATA Corporation                                  18
Hadoopで
今後のITはどう変わるのか


    Copyright ©2009 NTT DATA Corporation   19
まずは、大規模データ処理ニーズを取り込む
現在: 先見派 ~ コスト・スケールメリットを訴求
 とにかく大きなデータを扱いたい - 大量の生データ
   あまり複雑な処理まで未だ望んでいない
   バッチ処理でデータを抄訳、...

 メリットがあるところから適材適所で使われる
 まずは大規模バッチへの適用から、適宜従来システムとのハイブリッド化
 (例 Facebookのハイブリッド構成)

 基盤の経済的な構築・運用の実績作りの段階

今後: 実利派 ~ 『生産性向上』 のシナリオ
 データ指向に基づいたITシステムの活用が新しいIT領域を
 切り拓き、新しいビジネスを創出する

 より抽象度の高いツールの使いこなし                 ← 今後の取り組み
 適切な可視化ツールの整備


              Copyright ©2009 NTT DATA Corporation   20
大規模データを対象としたITシステム
今まで扱うことが難しかった領域を切り拓く
   ~ 大規模データを扱うシステム それ自体が「新しいITシステム」

 大量データを扱うプラットフォームを Commodity で実現するのが当り前に
   長期に渡るデータの収集、Webスケールのデータ収集を可能に
   → HDFS + IAサーバ


 プロセス指向のITシステムからデータ指向に基づいたITシステムへの転換
   プロセス指向のIT化 ~ データの扱いは ETL
    Extract     Transform      Load
    ドメイン・業務分析 → 構造化できるデータを特定 → システム化活用
                 予め解釈を与えておいて
   データ指向のIT化
    Gather   Extract       Load & Transform
    集めて      面白そうな対象を選び    システムに取り込みモデル化を試みる

   分析対象のモデル化作業自体をIT化の対象とする Extreme Analytics
   データを対象にした extreme programming 様のプラットフォームとして Hadoop が普及    ☺

                      Copyright ©2009 NTT DATA Corporation       21
お問い合わせ先:
 株式会社NTTデータ 基盤システム事業本部
 システム方式技術ビジネスユニット OSS技術統括部 (担当: 濱野, 政谷)
 メール: hadoop@kits.nttdata.co.jp TEL: 050-5546-2496


記載されている会社名、商品名、又はサービス名は、各社の登録商標又は商標です。

Weitere ähnliche Inhalte

Was ist angesagt?

Gmo media.inc 第9回西日本ossの普及を考える会
Gmo media.inc 第9回西日本ossの普及を考える会Gmo media.inc 第9回西日本ossの普及を考える会
Gmo media.inc 第9回西日本ossの普及を考える会Dai Utsui
 
JAWSUG佐賀 「灯台下暗し!?社内から考えるクラウド活用事例」
JAWSUG佐賀 「灯台下暗し!?社内から考えるクラウド活用事例」JAWSUG佐賀 「灯台下暗し!?社内から考えるクラウド活用事例」
JAWSUG佐賀 「灯台下暗し!?社内から考えるクラウド活用事例」Aya Komuro
 
OpenStack, Hadoop -- OSSクラウドの最新動向
OpenStack, Hadoop -- OSSクラウドの最新動向OpenStack, Hadoop -- OSSクラウドの最新動向
OpenStack, Hadoop -- OSSクラウドの最新動向 Masanori Itoh
 
メタデータスキーマレジストリ MetaBridge
メタデータスキーマレジストリ MetaBridgeメタデータスキーマレジストリ MetaBridge
メタデータスキーマレジストリ MetaBridgeMitsuharu Nagamori
 
Cloudianを利用したソリューション (Cloudian Summit 2012)
Cloudianを利用したソリューション (Cloudian Summit 2012)Cloudianを利用したソリューション (Cloudian Summit 2012)
Cloudianを利用したソリューション (Cloudian Summit 2012)CLOUDIAN KK
 
Cloudianを利用したソリューション (Cloudian Summit 2012)
Cloudianを利用したソリューション (Cloudian Summit 2012)Cloudianを利用したソリューション (Cloudian Summit 2012)
Cloudianを利用したソリューション (Cloudian Summit 2012)CLOUDIAN KK
 
[db tech showcase Sapporo 2015] B16:ビッグデータには、なぜ列指向が有効なのか? by 日本ヒューレット・パッカード株式...
[db tech showcase Sapporo 2015] B16:ビッグデータには、なぜ列指向が有効なのか? by 日本ヒューレット・パッカード株式...[db tech showcase Sapporo 2015] B16:ビッグデータには、なぜ列指向が有効なのか? by 日本ヒューレット・パッカード株式...
[db tech showcase Sapporo 2015] B16:ビッグデータには、なぜ列指向が有効なのか? by 日本ヒューレット・パッカード株式...Insight Technology, Inc.
 
スキーマレスカラムナフォーマット「Yosegi」で実現する スキーマの柔軟性と処理性能を両立したログ収集システム / Hadoop / Spark Con...
スキーマレスカラムナフォーマット「Yosegi」で実現する スキーマの柔軟性と処理性能を両立したログ収集システム / Hadoop / Spark Con...スキーマレスカラムナフォーマット「Yosegi」で実現する スキーマの柔軟性と処理性能を両立したログ収集システム / Hadoop / Spark Con...
スキーマレスカラムナフォーマット「Yosegi」で実現する スキーマの柔軟性と処理性能を両立したログ収集システム / Hadoop / Spark Con...Yahoo!デベロッパーネットワーク
 
組み込みDb empressのご紹介
組み込みDb empressのご紹介組み込みDb empressのご紹介
組み込みDb empressのご紹介ITDORAKU
 

Was ist angesagt? (13)

Hadoopカンファレンス2013
Hadoopカンファレンス2013Hadoopカンファレンス2013
Hadoopカンファレンス2013
 
JTPA Geek Salon Dec 2009
JTPA Geek Salon Dec 2009JTPA Geek Salon Dec 2009
JTPA Geek Salon Dec 2009
 
Gmo media.inc 第9回西日本ossの普及を考える会
Gmo media.inc 第9回西日本ossの普及を考える会Gmo media.inc 第9回西日本ossの普及を考える会
Gmo media.inc 第9回西日本ossの普及を考える会
 
JAWSUG佐賀 「灯台下暗し!?社内から考えるクラウド活用事例」
JAWSUG佐賀 「灯台下暗し!?社内から考えるクラウド活用事例」JAWSUG佐賀 「灯台下暗し!?社内から考えるクラウド活用事例」
JAWSUG佐賀 「灯台下暗し!?社内から考えるクラウド活用事例」
 
OpenStack, Hadoop -- OSSクラウドの最新動向
OpenStack, Hadoop -- OSSクラウドの最新動向OpenStack, Hadoop -- OSSクラウドの最新動向
OpenStack, Hadoop -- OSSクラウドの最新動向
 
ミニシアター用 V1.6w
ミニシアター用 V1.6wミニシアター用 V1.6w
ミニシアター用 V1.6w
 
メタデータスキーマレジストリ MetaBridge
メタデータスキーマレジストリ MetaBridgeメタデータスキーマレジストリ MetaBridge
メタデータスキーマレジストリ MetaBridge
 
Multiple Dimension Spreadのご紹介
Multiple Dimension Spreadのご紹介Multiple Dimension Spreadのご紹介
Multiple Dimension Spreadのご紹介
 
Cloudianを利用したソリューション (Cloudian Summit 2012)
Cloudianを利用したソリューション (Cloudian Summit 2012)Cloudianを利用したソリューション (Cloudian Summit 2012)
Cloudianを利用したソリューション (Cloudian Summit 2012)
 
Cloudianを利用したソリューション (Cloudian Summit 2012)
Cloudianを利用したソリューション (Cloudian Summit 2012)Cloudianを利用したソリューション (Cloudian Summit 2012)
Cloudianを利用したソリューション (Cloudian Summit 2012)
 
[db tech showcase Sapporo 2015] B16:ビッグデータには、なぜ列指向が有効なのか? by 日本ヒューレット・パッカード株式...
[db tech showcase Sapporo 2015] B16:ビッグデータには、なぜ列指向が有効なのか? by 日本ヒューレット・パッカード株式...[db tech showcase Sapporo 2015] B16:ビッグデータには、なぜ列指向が有効なのか? by 日本ヒューレット・パッカード株式...
[db tech showcase Sapporo 2015] B16:ビッグデータには、なぜ列指向が有効なのか? by 日本ヒューレット・パッカード株式...
 
スキーマレスカラムナフォーマット「Yosegi」で実現する スキーマの柔軟性と処理性能を両立したログ収集システム / Hadoop / Spark Con...
スキーマレスカラムナフォーマット「Yosegi」で実現する スキーマの柔軟性と処理性能を両立したログ収集システム / Hadoop / Spark Con...スキーマレスカラムナフォーマット「Yosegi」で実現する スキーマの柔軟性と処理性能を両立したログ収集システム / Hadoop / Spark Con...
スキーマレスカラムナフォーマット「Yosegi」で実現する スキーマの柔軟性と処理性能を両立したログ収集システム / Hadoop / Spark Con...
 
組み込みDb empressのご紹介
組み込みDb empressのご紹介組み込みDb empressのご紹介
組み込みDb empressのご紹介
 

Andere mochten auch

Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~
Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~
Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~Sotaro Kimura
 
F流 『オブジェクト指向の考え方の基礎の基礎』 ~ソフトウェア開発の原則編~
F流『オブジェクト指向の考え方の基礎の基礎』~ソフトウェア開発の原則編~F流『オブジェクト指向の考え方の基礎の基礎』~ソフトウェア開発の原則編~
F流 『オブジェクト指向の考え方の基礎の基礎』 ~ソフトウェア開発の原則編~Fujio Kojima
 
Hadoop World 2011: Hadoop’s Life in Enterprise Systems - Y Masatani, NTTData
Hadoop World 2011: Hadoop’s Life in Enterprise Systems - Y Masatani, NTTDataHadoop World 2011: Hadoop’s Life in Enterprise Systems - Y Masatani, NTTData
Hadoop World 2011: Hadoop’s Life in Enterprise Systems - Y Masatani, NTTDataCloudera, Inc.
 
NTTデータにおけるHadoopへの取り組み & Hadoop Summit 2010 レポート
NTTデータにおけるHadoopへの取り組み & Hadoop Summit 2010 レポートNTTデータにおけるHadoopへの取り組み & Hadoop Summit 2010 レポート
NTTデータにおけるHadoopへの取り組み & Hadoop Summit 2010 レポートNTT DATA OSS Professional Services
 
Tuning maniax 2014 Hadoop編
Tuning maniax 2014 Hadoop編Tuning maniax 2014 Hadoop編
Tuning maniax 2014 Hadoop編ThinkIT_impress
 
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組みNTT DATA OSS Professional Services
 
Hadoop Operations #cwt2013
Hadoop Operations #cwt2013Hadoop Operations #cwt2013
Hadoop Operations #cwt2013Cloudera Japan
 
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)Akira Shimosako
 
データ活用を効率化するHadoop WebUIと権限管理改善事例
データ活用を効率化するHadoop WebUIと権限管理改善事例データ活用を効率化するHadoop WebUIと権限管理改善事例
データ活用を効率化するHadoop WebUIと権限管理改善事例Masahiro Kiura
 
Sparkを用いたビッグデータ解析 〜 前編 〜
Sparkを用いたビッグデータ解析 〜 前編 〜Sparkを用いたビッグデータ解析 〜 前編 〜
Sparkを用いたビッグデータ解析 〜 前編 〜x1 ichi
 
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)NTT DATA OSS Professional Services
 
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...MapR Technologies Japan
 
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)NTT DATA OSS Professional Services
 

Andere mochten auch (20)

Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~
Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~
Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~
 
日々進化するHadoopの 「いま」
日々進化するHadoopの 「いま」日々進化するHadoopの 「いま」
日々進化するHadoopの 「いま」
 
Apache Spark の紹介(前半:Sparkのキホン)
Apache Spark の紹介(前半:Sparkのキホン)Apache Spark の紹介(前半:Sparkのキホン)
Apache Spark の紹介(前半:Sparkのキホン)
 
F流 『オブジェクト指向の考え方の基礎の基礎』 ~ソフトウェア開発の原則編~
F流『オブジェクト指向の考え方の基礎の基礎』~ソフトウェア開発の原則編~F流『オブジェクト指向の考え方の基礎の基礎』~ソフトウェア開発の原則編~
F流 『オブジェクト指向の考え方の基礎の基礎』 ~ソフトウェア開発の原則編~
 
Hadoop World 2011: Hadoop’s Life in Enterprise Systems - Y Masatani, NTTData
Hadoop World 2011: Hadoop’s Life in Enterprise Systems - Y Masatani, NTTDataHadoop World 2011: Hadoop’s Life in Enterprise Systems - Y Masatani, NTTData
Hadoop World 2011: Hadoop’s Life in Enterprise Systems - Y Masatani, NTTData
 
NTTデータにおけるHadoopへの取り組み & Hadoop Summit 2010 レポート
NTTデータにおけるHadoopへの取り組み & Hadoop Summit 2010 レポートNTTデータにおけるHadoopへの取り組み & Hadoop Summit 2010 レポート
NTTデータにおけるHadoopへの取り組み & Hadoop Summit 2010 レポート
 
Tuning maniax 2014 Hadoop編
Tuning maniax 2014 Hadoop編Tuning maniax 2014 Hadoop編
Tuning maniax 2014 Hadoop編
 
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
 
Apache Sparkのご紹介 (後半:技術トピック)
Apache Sparkのご紹介 (後半:技術トピック)Apache Sparkのご紹介 (後半:技術トピック)
Apache Sparkのご紹介 (後半:技術トピック)
 
Hadoop Operations #cwt2013
Hadoop Operations #cwt2013Hadoop Operations #cwt2013
Hadoop Operations #cwt2013
 
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
 
はやわかりHadoop
はやわかりHadoopはやわかりHadoop
はやわかりHadoop
 
データ活用を効率化するHadoop WebUIと権限管理改善事例
データ活用を効率化するHadoop WebUIと権限管理改善事例データ活用を効率化するHadoop WebUIと権限管理改善事例
データ活用を効率化するHadoop WebUIと権限管理改善事例
 
Sparkを用いたビッグデータ解析 〜 前編 〜
Sparkを用いたビッグデータ解析 〜 前編 〜Sparkを用いたビッグデータ解析 〜 前編 〜
Sparkを用いたビッグデータ解析 〜 前編 〜
 
Yahoo! JAPANでのHadoop利用について
Yahoo! JAPANでのHadoop利用についてYahoo! JAPANでのHadoop利用について
Yahoo! JAPANでのHadoop利用について
 
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
 
HTrace: Tracing in HBase and HDFS (HBase Meetup)
HTrace: Tracing in HBase and HDFS (HBase Meetup)HTrace: Tracing in HBase and HDFS (HBase Meetup)
HTrace: Tracing in HBase and HDFS (HBase Meetup)
 
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...
 
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
 
Hadoop2.6の最新機能+
Hadoop2.6の最新機能+Hadoop2.6の最新機能+
Hadoop2.6の最新機能+
 

Ähnlich wie Hadoop Conference Japan 2009 - NTT Data

LTEモバイルクラウドセミナ[講演1] R 20101116
LTEモバイルクラウドセミナ[講演1] R 20101116LTEモバイルクラウドセミナ[講演1] R 20101116
LTEモバイルクラウドセミナ[講演1] R 20101116知礼 八子
 
クラウド座談会資料
クラウド座談会資料クラウド座談会資料
クラウド座談会資料知礼 八子
 
オブジェクトストレージの適用領域とCloudianの位置づけ (Cloudian Summit 2012)
オブジェクトストレージの適用領域とCloudianの位置づけ (Cloudian Summit 2012)オブジェクトストレージの適用領域とCloudianの位置づけ (Cloudian Summit 2012)
オブジェクトストレージの適用領域とCloudianの位置づけ (Cloudian Summit 2012)CLOUDIAN KK
 
SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)
SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)
SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)NTT DATA OSS Professional Services
 
IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~
IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~ IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~
IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~ griddb
 
Lx styleのご紹介201009
Lx styleのご紹介201009Lx styleのご紹介201009
Lx styleのご紹介201009Tadashi Sugita
 
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
110421講演資料「クラウド時代の事業継続に必要なインフラとは」(福岡ruby・コンテンツ産業振興センター)
110421講演資料「クラウド時代の事業継続に必要なインフラとは」(福岡ruby・コンテンツ産業振興センター)110421講演資料「クラウド時代の事業継続に必要なインフラとは」(福岡ruby・コンテンツ産業振興センター)
110421講演資料「クラウド時代の事業継続に必要なインフラとは」(福岡ruby・コンテンツ産業振興センター)niftycloud
 
【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイント
【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイント【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイント
【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイントgriddb
 
国内初Cloud stack採用のオープンクラウドサービス
国内初Cloud stack採用のオープンクラウドサービス国内初Cloud stack採用のオープンクラウドサービス
国内初Cloud stack採用のオープンクラウドサービスKajiBook
 
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例terurou
 
高速ネットワーク技術と周辺動向(特別講義)
高速ネットワーク技術と周辺動向(特別講義)高速ネットワーク技術と周辺動向(特別講義)
高速ネットワーク技術と周辺動向(特別講義)Naoto MATSUMOTO
 
C22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by Taichi Umeda
C22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by  Taichi UmedaC22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by  Taichi Umeda
C22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by Taichi UmedaInsight Technology, Inc.
 
もうSQLとNoSQLを選ぶ必要はない!?~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!?~両者を備えたスケールアウトデータベースGridDB~もうSQLとNoSQLを選ぶ必要はない!?~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!?~両者を備えたスケールアウトデータベースGridDB~griddb
 
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~griddb
 
[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...
[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...
[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...Insight Technology, Inc.
 

Ähnlich wie Hadoop Conference Japan 2009 - NTT Data (20)

LTEモバイルクラウドセミナ[講演1] R 20101116
LTEモバイルクラウドセミナ[講演1] R 20101116LTEモバイルクラウドセミナ[講演1] R 20101116
LTEモバイルクラウドセミナ[講演1] R 20101116
 
クラウド座談会資料
クラウド座談会資料クラウド座談会資料
クラウド座談会資料
 
オブジェクトストレージの適用領域とCloudianの位置づけ (Cloudian Summit 2012)
オブジェクトストレージの適用領域とCloudianの位置づけ (Cloudian Summit 2012)オブジェクトストレージの適用領域とCloudianの位置づけ (Cloudian Summit 2012)
オブジェクトストレージの適用領域とCloudianの位置づけ (Cloudian Summit 2012)
 
SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)
SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)
SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)
 
IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~
IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~ IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~
IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~
 
Lx styleのご紹介201009
Lx styleのご紹介201009Lx styleのご紹介201009
Lx styleのご紹介201009
 
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
110421講演資料「クラウド時代の事業継続に必要なインフラとは」(福岡ruby・コンテンツ産業振興センター)
110421講演資料「クラウド時代の事業継続に必要なインフラとは」(福岡ruby・コンテンツ産業振興センター)110421講演資料「クラウド時代の事業継続に必要なインフラとは」(福岡ruby・コンテンツ産業振興センター)
110421講演資料「クラウド時代の事業継続に必要なインフラとは」(福岡ruby・コンテンツ産業振興センター)
 
【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイント
【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイント【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイント
【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイント
 
国内初Cloud stack採用のオープンクラウドサービス
国内初Cloud stack採用のオープンクラウドサービス国内初Cloud stack採用のオープンクラウドサービス
国内初Cloud stack採用のオープンクラウドサービス
 
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
 
serversman
serversmanserversman
serversman
 
高速ネットワーク技術と周辺動向(特別講義)
高速ネットワーク技術と周辺動向(特別講義)高速ネットワーク技術と周辺動向(特別講義)
高速ネットワーク技術と周辺動向(特別講義)
 
C22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by Taichi Umeda
C22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by  Taichi UmedaC22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by  Taichi Umeda
C22 スプリットブレインになっても一貫性を保証するインメモリデータグリッド製品 by Taichi Umeda
 
もうSQLとNoSQLを選ぶ必要はない!?~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!?~両者を備えたスケールアウトデータベースGridDB~もうSQLとNoSQLを選ぶ必要はない!?~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!?~両者を備えたスケールアウトデータベースGridDB~
 
So net
So netSo net
So net
 
aws seminer_so-net_public
aws seminer_so-net_publicaws seminer_so-net_public
aws seminer_so-net_public
 
Amazon Redshift 概要 (20分版)
Amazon Redshift 概要 (20分版)Amazon Redshift 概要 (20分版)
Amazon Redshift 概要 (20分版)
 
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
 
[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...
[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...
[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...
 

Mehr von NTT DATA OSS Professional Services

Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力NTT DATA OSS Professional Services
 
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~NTT DATA OSS Professional Services
 
PostgreSQL10を導入!大規模データ分析事例からみるDWHとしてのPostgreSQL活用のポイント
PostgreSQL10を導入!大規模データ分析事例からみるDWHとしてのPostgreSQL活用のポイントPostgreSQL10を導入!大規模データ分析事例からみるDWHとしてのPostgreSQL活用のポイント
PostgreSQL10を導入!大規模データ分析事例からみるDWHとしてのPostgreSQL活用のポイントNTT DATA OSS Professional Services
 
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~NTT DATA OSS Professional Services
 
データ活用をもっともっと円滑に! ~データ処理・分析基盤編を少しだけ~
データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~
データ活用をもっともっと円滑に! ~データ処理・分析基盤編を少しだけ~NTT DATA OSS Professional Services
 
商用ミドルウェアのPuppet化で気を付けたい5つのこと
商用ミドルウェアのPuppet化で気を付けたい5つのこと商用ミドルウェアのPuppet化で気を付けたい5つのこと
商用ミドルウェアのPuppet化で気を付けたい5つのことNTT DATA OSS Professional Services
 

Mehr von NTT DATA OSS Professional Services (20)

Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力
 
Spark SQL - The internal -
Spark SQL - The internal -Spark SQL - The internal -
Spark SQL - The internal -
 
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
 
Hadoopエコシステムのデータストア振り返り
Hadoopエコシステムのデータストア振り返りHadoopエコシステムのデータストア振り返り
Hadoopエコシステムのデータストア振り返り
 
HDFS Router-based federation
HDFS Router-based federationHDFS Router-based federation
HDFS Router-based federation
 
PostgreSQL10を導入!大規模データ分析事例からみるDWHとしてのPostgreSQL活用のポイント
PostgreSQL10を導入!大規模データ分析事例からみるDWHとしてのPostgreSQL活用のポイントPostgreSQL10を導入!大規模データ分析事例からみるDWHとしてのPostgreSQL活用のポイント
PostgreSQL10を導入!大規模データ分析事例からみるDWHとしてのPostgreSQL活用のポイント
 
Apache Hadoopの新機能Ozoneの現状
Apache Hadoopの新機能Ozoneの現状Apache Hadoopの新機能Ozoneの現状
Apache Hadoopの新機能Ozoneの現状
 
Distributed data stores in Hadoop ecosystem
Distributed data stores in Hadoop ecosystemDistributed data stores in Hadoop ecosystem
Distributed data stores in Hadoop ecosystem
 
Structured Streaming - The Internal -
Structured Streaming - The Internal -Structured Streaming - The Internal -
Structured Streaming - The Internal -
 
Apache Hadoopの未来 3系になって何が変わるのか?
Apache Hadoopの未来 3系になって何が変わるのか?Apache Hadoopの未来 3系になって何が変わるのか?
Apache Hadoopの未来 3系になって何が変わるのか?
 
Apache Hadoop and YARN, current development status
Apache Hadoop and YARN, current development statusApache Hadoop and YARN, current development status
Apache Hadoop and YARN, current development status
 
HDFS basics from API perspective
HDFS basics from API perspectiveHDFS basics from API perspective
HDFS basics from API perspective
 
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
 
20170303 java9 hadoop
20170303 java9 hadoop20170303 java9 hadoop
20170303 java9 hadoop
 
ブロックチェーンの仕組みと動向(入門編)
ブロックチェーンの仕組みと動向(入門編)ブロックチェーンの仕組みと動向(入門編)
ブロックチェーンの仕組みと動向(入門編)
 
Application of postgre sql to large social infrastructure jp
Application of postgre sql to large social infrastructure jpApplication of postgre sql to large social infrastructure jp
Application of postgre sql to large social infrastructure jp
 
Application of postgre sql to large social infrastructure
Application of postgre sql to large social infrastructureApplication of postgre sql to large social infrastructure
Application of postgre sql to large social infrastructure
 
Apache Hadoop 2.8.0 の新機能 (抜粋)
Apache Hadoop 2.8.0 の新機能 (抜粋)Apache Hadoop 2.8.0 の新機能 (抜粋)
Apache Hadoop 2.8.0 の新機能 (抜粋)
 
データ活用をもっともっと円滑に! ~データ処理・分析基盤編を少しだけ~
データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~
データ活用をもっともっと円滑に! ~データ処理・分析基盤編を少しだけ~
 
商用ミドルウェアのPuppet化で気を付けたい5つのこと
商用ミドルウェアのPuppet化で気を付けたい5つのこと商用ミドルウェアのPuppet化で気を付けたい5つのこと
商用ミドルウェアのPuppet化で気を付けたい5つのこと
 

Kürzlich hochgeladen

プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価sugiuralab
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directoryosamut
 
プレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールプレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールsugiuralab
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000Shota Ito
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxAtomu Hidaka
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 

Kürzlich hochgeladen (7)

プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory
 
プレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールプレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツール
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
 

Hadoop Conference Japan 2009 - NTT Data

  • 1. Hadoop Conference Japan 2009 SI事業の視点から見た Hadoop の適用領域と今後の展望 ~ NTTデータにおけるHadoopへの取り組み ~ 2009年11月13日 株式会社 NTTデータ 基盤システム事業本部 政谷 Copyright ©2009 NTT DATA Corporation
  • 2. 担当紹介 NTTデータ 基盤システム事業本部 OSS技術統括部 Linux/OSSを利用したシステム構築・運用をサポートする業務を担当 OSSによるシステム基盤 Prossione® – 徹底的に検証・評価したOSSの組み合わせ、設定・運用のノウハウの提供 – 高品質なシステム基盤を実現する仕組みの整備 OSSのサポートサービス Linaccident® – 幅広いOSSを対象とするプロフェッショナルサービスの提供 最近は、OSSを活用したクラウド分散処理基盤 Hadoopの技術整備 も担当 『象』 好きです PostgreSQL Hadoop Copyright ©2009 NTT DATA Corporation 1
  • 4. Hadoopへの取り組み Copyright ©2009 NTT DATA Corporation 3
  • 5. OSSの未来 従来技術は、必要充分な性能をもっ 性 た後発のローエンド技術に凌駕されて ム) 能 レー いく! イ ンフ (メ OS 独自 ws NI X ド+ n do U 一般的な ハ ー ー ド+ Wi SS 顧客が利 用 自 ハ + O 独 + 能 独 自 ーバ 可能な性 ーバ 「メトカーフの法則」 IAサ Aサ ネットワークの価値は I ユーザ数の2乗に比例 (マス・コラボレーションの時代) 「ギルダーの法則」 ネットワークの通信速度は 「ムーアの法則」 6~9ヵ月で2倍 半導体集積密度は18ヵ月で2倍 (ネットワークの時代) 1970 1980 1990 2000 未来 Copyright ©2009 NTT DATA Corporation 4
  • 6. クラウド時代のITシステム ... IT基盤をより Smart に 無駄を減らすことによる効率化、資源のプール化などで実現 単一性と多様性のバランスが練られたシステム コモディティ技術を使い切ることがポイントに スケールアウト技術を身近なものに IAサーバ+OSSにより多数のサーバの利用が容易化 新しい処理モデルやデータモデルの浸透 従来のACIDを求める処理方式とは異なるモデル MapReduceアルゴリズム、Key-Valueストア、自律分散協調システム など Copyright ©2009 NTT DATA Corporation 5
  • 7. なぜ Hadoop か? 今まで扱うことが難しかった領域を切り拓く ペタバイトクラスのデータ、大規模分散処理 数千台規模のサーバを用いることで、従来は困難であった処理が実現できる 『定型的な業務データ』 処理の枠組みにとらわれない 単純なETLではなく 準定型的なデータも扱える 柔軟な ETL & ELT (*1) プロセス指向だけでなく、データ指向に基づいた システムの浸透 Extract Transform Load ターゲット Transform Analyze 現在: コスト、スケールに価値を 見出す 『先見派』 Source Data 今後: さらなる生産性向上の手段を Repository 求めている 『実利派』 * “Impact of Cloud Computing on Research in Extreme Scale Analytics” Hamid Prahesh pirahesh@almaden.ibm.com Copyright ©2009 NTT DATA Corporation 6
  • 8. OSSベースの企業ITシステム 規模と動向 Copyright ©2009 NTT DATA Corporation 7
  • 9. OSS構築実績 (規模・処理量マップ) 処理量 (万件/時) ~150TPS ~2TB 60 ● 40 ● ● ● ● 20 ● 敢えて乱暴に絵を描いてみる ● ● 10 ● ● ● ● ● 5 ● ● ● ● ● ● ● 10万件 100万件 300万件 500万件 1000万件 1億件 10億件 DB規模 Copyright ©2009 NTT DATA Corporation 8
  • 10. OSS構築実績 (規模・処理量マップ) 処理量 (万件/時) ~数PB 構築・運用 60 支援中 ● 40 ● ● ● ● 20 ● ● ● 10 ● 経産省 ● ● ● 実証案件 ● 5 ● ● 実施中 ● ● ● ● ● 10万件 100万件 300万件 500万件 1000万件 1億件 10億件 DB規模 Copyright ©2009 NTT DATA Corporation 9
  • 11. OSS構築実績 (規模・処理量マップ) 処理量 (万件/時) 60 先見派 今後のターゲット ● 領域 40 実利派 ● ● ● 構築・運用 支援中 ● 20 ● ● ● 10 ● 経産省 ● ● ● 実証案件 ● 5 ● ● 実施中 ● ● ● ● ● 10万件 100万件 300万件 500万件 1000万件 1億件 10億件 DB規模 Copyright ©2009 NTT DATA Corporation 10
  • 12. NTTデータの取り組み Copyright ©2009 NTT DATA Corporation 11
  • 13. 2匹目の象を育むために 新技術普及の流れ 顧 客 数 PostgreSQL サーバLinux キャズム パフォーマンス市場(ハイエンド) Hadoop バリュー市場(メインストリーム) 先見派 懐疑派 マニア 実利派 保守派 時間 顧客が自分で改造 自分で組み合わせる 技術に強い、リスクは取らない 技術に強くはない、コモディティ化した技術を 組み込まれて目に 生産性向上の手段を求めている マーケット・リーダから購入、手厚いサポート 見えなければ購入 必須 要件定義支援サービス、設計・構築サービス の提供 要件定義支援サービス、設計・構築サービス の提供 OSからHadoopまで一貫した スタックサポートサービス、 OSからHadoopまで一貫した スタックサポートサービス、 オンサイト障害対応サービス の提供 オンサイト障害対応サービス の提供 OSS基盤を使ったシステム構築の 実績作り OSS基盤を使ったシステム構築の 実績作り Copyright ©2009 NTT DATA Corporation 12
  • 14. 3つのクラウドタイプ Amazon Force.com Hadoop タイプのIaaS タイプのPaaS タイプのPaaS 徹底した 徹底した 徹底した 特徴 仮想化インフラの追及 マルチテナンシーの追及 スケーラビリティの追及 (DB仮想化) (BASE) Webアプリ 大規模データ Webアプリ ワークフロー BI/DWH 一品モノ ビジネスプロセス系 センサー系 適したアプリ 既存アプリのマイグレー 参照・問合せ系 分析系、バッチ系 ション キャンペーンサイト 参照・問合せ系 社内システム メディア系 高トランザクション リアルタイム 高インタラクティブ 適さないアプリ 大規模データ、BI/DWH メディア系コンテンツ トランザクション 大規模データ、BI/DWH 高インタラクティブ (Web/AP/DB)サーバ MapReduce (AP/API/検索)サーバ ゲストOS、ゲストOS、・・・ 分散ファイルシステム スタック構成 VMM(ハイパーバイザー) DBクラスタ OS ハード ハード ハード Copyright ©2009 NTT DATA Corporation 13
  • 15. 経産省 「実証事業」 に Hadoopベースの提案が採択 テーマ:クラウド型分散処理基盤 (Hadoop) の適用性評価 基盤の観点では... クラウド基盤信頼性向上への取り組み Master Server の冗長化 確立した Heartbeat + DRBD に加えて Kemari + DRBD を評価 クラウド基盤運用効率化への取り組み 初期構築・増設、故障交換時のノードの自動構成を標準的な 製品機能とOSSの組合せで実現 サーバの種別・機種が混在する環境でも適用可能な実装を実証 Copyright ©2009 NTT DATA Corporation 14
  • 16. Heartbeat + DRBD による Master Server の冗長化 Master Server(NameNode,JobTracker)の冗長化を実現 Heartbeat Linux-HAプロジェクトによって開発されたサーバのHAソフトウェア http://www.linux-ha.org/ja/HomePage_ja DRBD(Distributed Replicated Block Device) 2台のサーバ間でディスク上のデータミラーリングを実現するソフトウェア http://www.drbd.org/ NameNode NameNode heartbeat heartbeat 永続データの同期型ミラー DRBD DRBD NameNode(待機系) NameNode(現用系) イメージファイル editsファイル Heartbeat/ミラーリング LAN イメージファイル editsファイル Copyright ©2009 NTT DATA Corporation 15
  • 17. Master Server冗長化 (続き) Master Serverのうち、 Job Trackerは永続データの引き継ぎは不要 NameNodeの冗長化では永続データの引継ぎが必要 イメージファイル HDFS上のデータに対する格納先ノード、ブロックサイズなどのメタ情報が格納されたファイル NameNode起動時にメモリにロードされ、チェックポイントのタイミング及び、NameNode停止 時にディスク上のファイルにフラッシュされる。 editsファイル イメージファイルに対するトンラザクションログ メタ情報の更新時はイメージファイルではなく、トランザクションログに更新内容が出力 NameNodeの異常終了(プロセスダウンなど)後にNameNodeを起動する場合、 イメージファイルにeditsファイルの更新内容が適用され、異常終了直前の整合性が 維持された状態にメタ情報が復元される。 Job Trackerのハード故障時、実行中のJobの内容は失われる... 長時間かけた処理の結果が失われるのは辛い Copyright ©2009 NTT DATA Corporation 16
  • 18. “Kemari” ? 蹴鞠 (Kemari) 鞠を落とさない! ↓ サーバを落とさない! http://www.ntt.co.jp/cclab/activity/category_6/a_product_01.html http://www.osrg.net/kemari/ Copyright © 2007-2008 Nippon Telegraph and Telephone Corporation 17 17 Copyright ©2009 NTT DATA Corporation
  • 19. “Kemari” + DRBD による Master Server の冗長化 Job Tracker ハード故障時でも、Job の中断・再試行を回避できる Kemari KVM版 開発中!! [2] 運用系の差分を転送 [3] 差分で待機系を更新 Kemari Kemari Kemari 差分転送 差分転送 差分更新 Dom0 DomU Sync DomU DomU Dom0 Back-end Front-end Front-end Back-end Kemari イベントチャネル Kemari イベントチャネル Xen Xen Network Hardware Hardware [1] 特定のイベントを DRBD or SAN 補足し、VMを一時停止 Copyright ©2009 NTT DATA Corporation 18
  • 20. Hadoopで 今後のITはどう変わるのか Copyright ©2009 NTT DATA Corporation 19
  • 21. まずは、大規模データ処理ニーズを取り込む 現在: 先見派 ~ コスト・スケールメリットを訴求 とにかく大きなデータを扱いたい - 大量の生データ あまり複雑な処理まで未だ望んでいない バッチ処理でデータを抄訳、... メリットがあるところから適材適所で使われる まずは大規模バッチへの適用から、適宜従来システムとのハイブリッド化 (例 Facebookのハイブリッド構成) 基盤の経済的な構築・運用の実績作りの段階 今後: 実利派 ~ 『生産性向上』 のシナリオ データ指向に基づいたITシステムの活用が新しいIT領域を 切り拓き、新しいビジネスを創出する より抽象度の高いツールの使いこなし ← 今後の取り組み 適切な可視化ツールの整備 Copyright ©2009 NTT DATA Corporation 20
  • 22. 大規模データを対象としたITシステム 今まで扱うことが難しかった領域を切り拓く ~ 大規模データを扱うシステム それ自体が「新しいITシステム」 大量データを扱うプラットフォームを Commodity で実現するのが当り前に 長期に渡るデータの収集、Webスケールのデータ収集を可能に → HDFS + IAサーバ プロセス指向のITシステムからデータ指向に基づいたITシステムへの転換 プロセス指向のIT化 ~ データの扱いは ETL Extract Transform Load ドメイン・業務分析 → 構造化できるデータを特定 → システム化活用 予め解釈を与えておいて データ指向のIT化 Gather Extract Load & Transform 集めて 面白そうな対象を選び システムに取り込みモデル化を試みる 分析対象のモデル化作業自体をIT化の対象とする Extreme Analytics データを対象にした extreme programming 様のプラットフォームとして Hadoop が普及 ☺ Copyright ©2009 NTT DATA Corporation 21
  • 23. お問い合わせ先: 株式会社NTTデータ 基盤システム事業本部 システム方式技術ビジネスユニット OSS技術統括部 (担当: 濱野, 政谷) メール: hadoop@kits.nttdata.co.jp TEL: 050-5546-2496 記載されている会社名、商品名、又はサービス名は、各社の登録商標又は商標です。