SlideShare ist ein Scribd-Unternehmen logo
1 von 52
Downloaden Sie, um offline zu lesen
Spider Storage Engineのご紹介




                          斯波健徳
      kentokushiba at gmail dot com
MySQLとは?
MySQLは、オープンソース(ソースコードが公開されている)
のリレーショナルデータベースです。

Webサービスと相性がよく、ドワンゴ、Google、Yahoo、
楽天、facebook、mixi、gree、DeNAなどで
利用されています。

GPLというライセンスに従って、自由に利用、変更、再配布
を行うことができます。
ストレージエンジンとは?
MySQLは、プラガブルストレージエンジンアーキテクチャ
というものを採用しており、ストレージエンジンというものを
用途に応じて取り替えることができます。

ストレージエンジンは、データベースの中でデータを
格納したり取り出したりすることを司る部分です。
ストレージエンジンとは?

          クライアント      クライアント      クライアント




                コネクションプール
          perser/optimizer/cache ...etc...
              ストレージエンジンAPI

 MyISAM InnoDB MEMORY Blackhole       q4m    Spider
                   MySQLサーバ
ストレージエンジンとは?
このようにストレージエンジンが複数あるため、テーブルの
用途に応じて最適なストレージエンジンを選択することが
できます。

ストレージエンジンは、テーブル単位で変更可能で、
例えばマスターのテーブルにはMyISAMというストレージ
エンジン、取引情報テーブルにはInnoDBというストレージ
エンジンを使うというようなことが可能です。
ストレージエンジンとは?
ストレージエンジンとその特徴(例)
・MyISAM
  トランザクションに対応していないが、その代わり
  構造が単純で、参照性能が高い。
  並列性が低いが、並列性を必要としないテンポラリ
  テーブルなどの用途に向いている。
・InnoDB(InnoDB plugin)
  トランザクションに対応している。
  OracleやPostgreSQLなどに使い勝手が近い。
  現在は主にInnoDB pluginに拡張や改良が
  おこなわれている。
ストレージエンジンとは?
ストレージエンジンとその特徴(例)
・MEMORY
 オンメモリで動作するので非常に高速なストレージ
 エンジン。トランザクションはサポートしていない。

・BLACKHOLE
 どんなにinsertしても、データがたまらないストレージ
 エンジン。データはたまらないがレプリケーション用の
 ログは残るので、非常に激しいinsertのリクエストを
 非同期で反映するために利用される。
ストレージエンジンとは?
ストレージエンジンとその特徴(例)
・Archive
 監査用ログなどひたすらinsertしまくって、
 参照(解析)は、あとでじっくり別の場所でやれば
 いいような場合に利用されるストレージエンジン。
 圧縮されるのでデータサイズがコンパクトで、
 高速なinsertが可能。
・CSV
 CSV形式のデータを、そのままテーブルとして
 利用することを可能にするストレージエンジン。
ストレージエンジンとは?
ストレージエンジンとその特徴(例)
・q4m
 テーブルをキューとして利用するための
 ストレージエンジン。
 ●サイボウズラボ㈱の奥一穂さんが作成。
・Vertical Partitioning
 MySQLのテーブルパーティショニングがレコードごとの
 分割機能であるのに対し、このストレージエンジンは
 カラムごとの分割機能を提供する。
 ●私が作成。
ストレージエンジンとは?
ストレージエンジンとその特徴(例)
・mroonga(groongaストレージエンジン)
 MySQLで高速かつ並列性の高い全文検索を
 可能にするストレージエンジン。
 ●住商情報システム㈱の池田徹郎さんが作成。
 Spiderで分散構成ができるよう、機能拡張を計画中。
・BlitzDB
 MySQLのforkであるDrizzle用のストレージエンジン。
 Drizzleでトランザクション非対応型のストレージエンジンを
 選択する際の、第一の選択肢になっている。
 ●前坂徹さんが作成。
ストレージエンジンとは?
ストレージエンジンとその特徴(例)
・Tritonn
 MySQL 5.0系のMyISAMを改造して、日本語の全文検索
 を可能にしたストレージエンジン。
 mroongaはその後継。
 ●住商情報システム㈱の池田徹郎さんが作成。
・XtraDB
 InnoDBのPerconaチューニング版ストレージエンジン。
 バックアップツールとして、InnoDB Hot Backupを
 改良したXtraBackupがある。
 ●Percona Inc.の木下靖文さんががっつり関係。
その他のプラグイン・UDF
今回プラグインの話なので、ストレージエンジン以外の
プラグインのご紹介(例)
・handlersocket plugin
 MySQLのストレージエンジンにKVS的アクセスを
 提供するプラグイン。
 PK参照750,000qpsを出したことで、世界に注目される
 こととなった。
   (http://yoshinorimatsunobu.blogspot.com/2010/10/usi
   ng-mysql-as-nosql-story-for.html)
 ●㈱DeNAの樋口証さんが作成。
 Spiderで分散構成ができるよう、機能拡張を計画中。
その他のプラグイン・UDF
今回プラグインの話なので、ストレージエンジン以外の
プラグインのご紹介(例)
・MySQL full-text parser plugin collection
 MyISAMに全文検索機能のパーサ
   (bigram,mecab,space,suffix,snowball)を追加提供する
 プラグイン。
 ●Kawai Hiroakiさんが作成。
その他のプラグイン・UDF
今回プラグインの話なので、ストレージエンジン以外の
プラグインのご紹介(例)
・mregexp
 マルチバイト文字(日本語含む)に対応した正規表現を
 利用することができるようになるUDF。
 ●えとらぼ㈱のひろせまさあきさん作成。
その他のプラグイン・UDF
今回プラグインの話なので、ストレージエンジン以外の
プラグインのご紹介(例)
・テーブルに直接アクセスするUDF
 実用的に利用されている例は聞いたことはないが、
 InnoDBは、直接アクセスすれば非常に高速である
 ということを証明するという点で、大きな役割を果たした。
 ●サイボウズラボ㈱の奥一穂さん作成、
 ●㈱DeNAの松信嘉範さん作成など
 複数タイプが作成されている。
その他のプラグイン・UDF
今回プラグインの話なので、ストレージエンジン以外の
プラグインのご紹介(例)
・spider_direct_sql
 Spiderストレージエンジンをインストールすると、
 おまけで利用できるようになるUDF。
 リモートのMySQLサーバに任意のSQLを発行できる。
 複数のリモートMySQLサーバで集計した結果を、
 ローカルMySQLサーバに集めて2段階で集計する
 用途などで利用する。
 ●私が作成。
Spiderストレージエンジンとは?
Spiderストレージエンジンとは、これらストレージエンジンの
1種で、複数のデータベースサーバにあるテーブルを
束ねて、1つのテーブルとして利用することを可能に
します。

これは、クラウド環境においては、増え続けるデータを、
サーバをどんどん増やしながら分割して管理する
ために利用することができます。
Spiderを利用した構成例

          AP        AP

               LB



          DB        DB


          DB        DB

   アプリケーションはSpiderの入ったMySQLに
 SQL(参照/更新)を実行すると、Spiderが透過的に
後ろにあるデータノードにアクセスして結果を返します。
 SQLは、DB1台だったときと同じものでOKです。
Spiderを利用した構成例

     AP   AP        AP   AP

               LB



     DB   DB        DB   DB


     DB   DB        DB   DB

トラフィックが増えたり、データが増えたりした場合は、
このようにサーバを追加して、負荷分散を行います。
Spiderでクラウド対応

Spiderを使うと、トラフィックやデータ量に
合わせてサーバを追加(削除)していくことが
できるので、クラウド環境において、
伸縮自在のRDBを構築することができます。
「Spider」の主な機能

1. Spiderストレージエンジンは、ローカルDBからリモート
   DBに対してテーブルリンクを生成

2. Spiderは、「database sharding」を実現可能

3. Spiderは、「XAトランザクション」と「テーブルパーティショ
   ニング」を利用可能

4. Spiderは、GPLライセンスで公開中
           http://spiderformysql.com
テーブルリンク
                                                            Spider Storage
  Create table tbl_a (           tbl_a                tbl_a
    col_a int,                                              Engine’s table
    col_b int,
    primary key(col_a)
                                         DB1
  ) engine = Spider                                         Other Storage
  Connection ‘
                                         2.Get data   tbl_a
    host “DB1”,                                             Engine’s table
    table “tbl_a”,
    user “user”,
    password “pass”
  ‘;                             tbl_a tbl_b
                                   Local DB       3.Join
      1.Request
       select tbl_a.col_a,
             tbl_b.col_c                       4.Response
       from tbl_a, tbl_b
       where tbl_a.col_a = 1 and
             tbl_a.col_b = tbl_b.col_b

Spiderは、リモートMySQLサーバのテーブルをローカルMySQL
    サーバのテーブルのように利用することを可能にします。
「Spider」とは

1. Spiderストレージエンジンは、ローカルDBからリ
   モートDBに対してテーブルリンクを生成

2. Spiderは、「database sharding」を実現可能

3. Spiderは、「XAトランザクション」と「テーブル
   パーティショニング」を利用可能

4. Spiderは、GPLライセンスで公開中
            http://spiderformysql.com
SpiderのXAトランザクション

                       tbl_a           tbl_b            tbl_c
                       DB1              DB2             DB3
my.cnf                         2.XA prepare 2.XA prepare 2.XA prepare
------------------              3.XA commit 3.XA commit 3.XA commit
……
……
spider_internal_xa=1
……
……                             tbl_a tbl_b tbl_c
                                    Local DB

                       1.Request                4.Response
                       commit


     SpiderはDBクラスタリングに利用可能です。
Spiderのテーブルパーティショニング
Create table tbl_a (                    col_a%3=0                 col_a%3=1          col_a%3=2
  col_a int,
  col_b int,
  primary key(col_a)
) engine = Spider
                                          tbl_a                     tbl_a             tbl_a
Connection ‘
  table “tbl_a”,
                                           DB1                       DB2               DB3
  user “user”,
  password “pass”                                           2.Get data
‘
partition by list(
  mod(col_a, 3)) (
  partition pt1 values in(0)               tbl_a tbl_b
  comment ‘host “DB1”’,
  partition pt2 values in(1)                 Local DB             3.Join
  comment ‘host “DB2”’,
  partition pt3 values in(2)
  comment ‘host “DB3”’
);                                                         4.Response
                               1.Request
                               select tbl_a.col_a, tbl_b.col_c from tbl_a, tbl_b
                               where tbl_a.col_a = 1 and tbl_a.col_b = tbl_b.col_b

      Spiderは「DB sharding※」をサポートしています。
    ※「DB sharding」とは、データを複数のデータベースサーバに分散させて管理する手法のことを言います。
「Spider」とは

1. Spiderストレージエンジンは、ローカルDBからリモート
   DBに対してテーブルリンクを生成

2. Spiderは、「database sharding」を実現可能

3. Spiderは、「XAトランザクション」と「テーブルパーティショ
   ニング」を利用可能

4. Spiderは、GPLライセンスで公開中
           http://spiderformysql.com
Spiderの「DB SHARDING※」




    ※「DB SHARDING」とは、データを複数のデータベース
     サーバに分散させて管理する手法のことを言います。
アプリケーションによる「DB sharding」



   アプリケーションによる「DB sharding」は、
   データの増加や更新リクエストの増加に伴う
   パフォーマンスの低下の問題を解決するために
   利用されます。
アプリケーションによる「DB sharding」
                   col_a%3=0       col_a%3=1    col_a%3=2

                    tbl_a           tbl_a         tbl_a
                     DB1             DB2          DB3
                                2.Choose a connection and get data


                     AP1             AP2          AP3

1.Request                   3.Response
 tbl_a.col_a = 1



            アプリケーションによる「DB sharding」は
データ増加に伴うパフォーマンスの低下問題を解決します。
アプリケーションによる「DB sharding」
しかし…
アプリケーションによる「DB sharding」には、
以下の問題点が挙げられるます。

– 異なるDBサーバのテーブルをjoinできない
– 異なるDBサーバに行われた更新の同期は、アプリ
  ケーションで保障しなければならない
– アプリケーションエンジニアは、「database sharding」
  を実現するために高いDBスキルが必要
– 「database sharding」 が実装されていないアプリケー
  ションに、新たに「database sharding」を追加するに
  は、多くの時間と工数が必要になる
Spiderの「DB sharding」




              Spiderは
    これらの問題を解消します。
Spiderの「DB sharding」
                  col_a%3=0                col_a%3=1   col_a%3=2

                   tbl_a                    tbl_a       tbl_a
                    DB1                      DB2         DB3
                                   3.Choose a connection and get data

                   tbl_a                    tbl_a       tbl_a
                    DB                     DB            DB
2.Request                     4.Response
                 AP1
  from application                        AP2
                                to application           AP3

1.Request                  5.Response
  from client                  to client
       Spiderの「DB sharding」は
tbl_a.col_a = 1


データ増加に伴うパフォーマンス低下問題を解決します。
Spiderの「DB sharding」

 そして…

 – 異なるDBサーバのテーブルをjoinできる
 – アプリケーションは、異なるDBサーバに行われた更
   新の同期を保障する必要がない(Spiderが保障する)
 – アプリケーションエンジニアは、「DB sharding」を実装
   する必要がない
 – 「DB sharding」が実装されていないアプリケーション
   でも、アプリケーションを変更しないで「DB sharding」
   を実現できるため、導入が容易である
導入事例
【導入事例1】 Sagool.tv

                  Sagool.tvは、
      www.youtube.comのような動画サイトです。
  ただし、全てのコンテンツはインターネットからクロールされ、
     動画は、TVのように流し見することができます。

                 Sagool.tvは、

              【Team Lab Inc. ]

               が運営しています。

             http://www.team-lab.com
             http://www.team-lab.net
Sagool.tv (検索ページ)




        Sagool.tv was created by Team Lab Inc.
Sagool.tv (動画再生ページ)




        Sagool.tv was created by Team Lab Inc.
Sagool.tvの変更前構成図

      Master       Master
       DB           DB        Crawler     Crawler ……
            replication

 ……   Slave         Slave     Full-text Full-text ……
       DB            DB       search     search
                 1.Get data       2.Register     again,
                                                 again…
 ……                                               ……
       AP             AP       Batch     Batch

バッチ処理は、毎日全文インデックスを生成する必要があります。
当時のSagool.tvの問題点

しかし…

  動画のレコードが増加するに従い、DB参照性能が
  低下していき、
  3000万レコードを超えた時には、バッチ処理が24時間で
  完了しなくなっていました。

  このケースでは、サーバにMySQL clusterを導入するために
  十分なメモリがなかったため、 MySQL clusterは
  導入できませんでした。

       そのため、Spiderを使いました。
SPIDER利用後のSagool.tvの構成図

                                                                         …
    Master      Master replication   tbl_a           Crawler   Crawler
     DB          DB
                                      DB
             replication col_a%4=0        col_a%4=3 Full-text Full-text …
                                    Data            search     search
                          tbl_a   sharding tbl_a             again, again…
…   Slave        Slave
                                  by Spider
     DB           DB        DB                DB
                                                          2.Register
                                                    1.Get data
                                                     tbl_a     tbl_a
                                 tbl_a tbl_a           DB        DB
…                               DB     DB                                …
     AP           AP                                 Batch     Batch
                           col_a%4=1 col_a%4=2
                                                1.Get data

      まず、Spiderを利用したスレーブDBと
       4つのリモートDBを追加しました。
次に、バッチサーバにSpiderを利用したMySQLを追加しました。
Sagool.tv: パフォーマンスの改善
結果

1. Spiderを利用したshardingで、各DBサーバのレコードを減ら
   すことにより、パフォーマンスが劇的に改善しました。

  – DBのパフォーマンスは約10倍改善。
  – バッチ処理は約5倍改善。
    (バッチ処理は8時間で完了するようになりました)

2. Spiderの導入にアプリケーションの変更は不要でした。
3. Spiderは問題が発生している場所にピンポイントで導入できる
   ので、動作確認工数が少なく済みました。

   SPIDERの「SHARDING」は簡単です。
【導入事例2】 KADOKAWord.jp

角川グループはメディア、本、商品などの、多くの
ウェブサイトを運営しています。(80以上)

KADOKAWord.jpは、これらのウェブサイトの
コンテンツを横断的に検索できるサービスです。
KADOKAWord.jpは
株式会社角川メディアマネジメント
が運営しています。
KADOKAWord.jpで利用されるSPIDERについて


KADOKAWord.jpでは、
BlackholeとSpiderを利用しています。
なぜなら・・・

  グループサイトからの急激なログトラフィックが
  あるためです。
KADOKAWord.jp: ログサーバ構成図


                 …     tbl_a    tbl_a
                        DB       DB      3.Log data collecting
     2.Replication                           using Spider
                 replication

      tbl_a    tbl_a       Blackhole     tbl_a
       DB       DB                      Statistical
 …                     1.Write log         DB
       AP       AP


             現在、
急激なログトラフィックがあっても、問題は発生していません。
【導入事例3】株式会社マイクロアド




      株式会社マイクロアドは
    行動ターゲティングというテクノロジーで、
       配信する広告を最適化できる
   広告配信サービスを提供している企業です。


                   【MicroAd, Inc.]
           http://www.microad.jp/
Spider導入前構成

 ……                                                  ……
       AP             AP          AP         AP

                            LVS


      Slave         Slave
       DB            DB      Register new statistical rules
            replication      from batch server
                   Master
                                             Batch
                    DB

このシステムでは、バッチ処理が毎日新しい統計結果で、
  広告配信のルールを更新する必要があります。
事業拡大に伴う課題
・更新負荷の増大
これまで1日につき、2000万レコードの更新が限界
だったものを、事業拡大に伴い1億レコードを
更新できるようにする必要があった。
・参照負荷の増大
基本的にはレプリケーションスレーブを追加することで
対応するが、1台あたりの更新が減らないと、スレーブ
追加のメリットが薄れる。
・アプリケーション修正
データベース分割の為に、大幅なアプリケーションの
修正は避けたい。

  そのために、Spiderが選択されました。
Spider導入後構成
 ……         AP                AP                  AP               AP         ……
        with Spider       with Spider         with Spider      with Spider
Spider sharding
           LVS                          LVS                        LVS

   SlaveDB      SlaveDB      SlaveDB      SlaveDB           SlaveDB     SlaveDB
         replication              replication                   replication
         MasterDB                 MasterDB                      MasterDB

Spider sharding                                         Register new
                                  statistical rules from batch server
            SpiderDB
        (MySQL with Spider)                                   Batch


       彼らは、データベースの分割の単位で
      レプリケーションを構成するという手法を
             採用しました。
改善結果

その結果、
彼らは、毎日1億レコードの更新という目標を達成し、
参照性能の向上にも成功しました。

また、データベース分割のためのアプリケーションの
修正は、ほとんど不要でした。

彼らは現在、事業の更なる拡大のため、データベース
の再拡張(re-sharding)を計画しています。
Spider Storage Engine

       まとめ
まとめ
Spider Storage Engineは ・・・・・
1.    他のストレージエンジンと連携することで、その機能を強化・拡張することができる。
2.    リモートのMySQLサーバにあるテーブルを、ローカルのMySQLサーバにあるテーブル
      として利用する事ができる。
3.    XAトランザクションで、複数のサーバに行われた更新を同期することができる。
4.    MySQL 5.1から利用可能となったテーブルパーティションをサポートしており、テーブル
      の各パーティションはそれぞれ別のサーバを利用することができる。

これら4つの機能により ・・・・・
     Spiderはトランザクション機能付で「DB sharding」を実現できる。
     Spiderはアプリケーションの機能性を損なうことなく「Sharding」を
      実現できる。
     (このあたりがクラウド対応RDB構築用)
     Spiderの導入に、アプリケーションは変更の必要がない。
     Spiderは必要なところだけにピンポイントで利用できる。
Any Questions?


Thank you for taking
    your time!!



  Kentoku SHIBA (kentokushiba at gmail dot com)
  http://wild-growth.blogspot.com/
  http://spiderformysql.com

Weitere ähnliche Inhalte

Was ist angesagt?

ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
Evolution of Impala #hcj2014
Evolution of Impala #hcj2014Evolution of Impala #hcj2014
Evolution of Impala #hcj2014Cloudera Japan
 
BigtopでHadoopをビルドする(Open Source Conference 2021 Online/Spring 発表資料)
BigtopでHadoopをビルドする(Open Source Conference 2021 Online/Spring 発表資料)BigtopでHadoopをビルドする(Open Source Conference 2021 Online/Spring 発表資料)
BigtopでHadoopをビルドする(Open Source Conference 2021 Online/Spring 発表資料)NTT DATA Technology & Innovation
 
Coherenceを利用するときに気をつけること #OracleCoherence
Coherenceを利用するときに気をつけること #OracleCoherenceCoherenceを利用するときに気をつけること #OracleCoherence
Coherenceを利用するときに気をつけること #OracleCoherenceToshiaki Maki
 
Apache Arrow - データ処理ツールの次世代プラットフォーム
Apache Arrow - データ処理ツールの次世代プラットフォームApache Arrow - データ処理ツールの次世代プラットフォーム
Apache Arrow - データ処理ツールの次世代プラットフォームKouhei Sutou
 
[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...
[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...
[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...Insight Technology, Inc.
 
HBaseを用いたグラフDB「Hornet」の設計と運用
HBaseを用いたグラフDB「Hornet」の設計と運用HBaseを用いたグラフDB「Hornet」の設計と運用
HBaseを用いたグラフDB「Hornet」の設計と運用Toshihiro Suzuki
 
Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...
Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...
Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...NTT DATA Technology & Innovation
 
Qlik Replicate - 双方向レプリケーション(Bidirectional Replication)の利用
Qlik Replicate - 双方向レプリケーション(Bidirectional Replication)の利用Qlik Replicate - 双方向レプリケーション(Bidirectional Replication)の利用
Qlik Replicate - 双方向レプリケーション(Bidirectional Replication)の利用QlikPresalesJapan
 
SIGMOD’12勉強会 -Session 7-
SIGMOD’12勉強会 -Session 7-SIGMOD’12勉強会 -Session 7-
SIGMOD’12勉強会 -Session 7-Takeshi Yamamuro
 
刊行記念セミナー「HBase徹底入門」
刊行記念セミナー「HBase徹底入門」刊行記念セミナー「HBase徹底入門」
刊行記念セミナー「HBase徹底入門」cyberagent
 
Hadoopのシステム設計・運用のポイント
Hadoopのシステム設計・運用のポイントHadoopのシステム設計・運用のポイント
Hadoopのシステム設計・運用のポイントCloudera Japan
 
国会図書館サーチの概要
国会図書館サーチの概要国会図書館サーチの概要
国会図書館サーチの概要Kosuke Tanabe
 
PostgreSQL10徹底解説
PostgreSQL10徹底解説PostgreSQL10徹底解説
PostgreSQL10徹底解説Masahiko Sawada
 
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジLINE Corporation
 

Was ist angesagt? (20)

ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
Evolution of Impala #hcj2014
Evolution of Impala #hcj2014Evolution of Impala #hcj2014
Evolution of Impala #hcj2014
 
BigtopでHadoopをビルドする(Open Source Conference 2021 Online/Spring 発表資料)
BigtopでHadoopをビルドする(Open Source Conference 2021 Online/Spring 発表資料)BigtopでHadoopをビルドする(Open Source Conference 2021 Online/Spring 発表資料)
BigtopでHadoopをビルドする(Open Source Conference 2021 Online/Spring 発表資料)
 
Coherenceを利用するときに気をつけること #OracleCoherence
Coherenceを利用するときに気をつけること #OracleCoherenceCoherenceを利用するときに気をつけること #OracleCoherence
Coherenceを利用するときに気をつけること #OracleCoherence
 
Apache Arrow - データ処理ツールの次世代プラットフォーム
Apache Arrow - データ処理ツールの次世代プラットフォームApache Arrow - データ処理ツールの次世代プラットフォーム
Apache Arrow - データ処理ツールの次世代プラットフォーム
 
hscj2019_ishizaki_public
hscj2019_ishizaki_publichscj2019_ishizaki_public
hscj2019_ishizaki_public
 
[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...
[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...
[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...
 
20111130 10 aws-meister-emr_long-public
20111130 10 aws-meister-emr_long-public20111130 10 aws-meister-emr_long-public
20111130 10 aws-meister-emr_long-public
 
Hadoop入門
Hadoop入門Hadoop入門
Hadoop入門
 
HBaseを用いたグラフDB「Hornet」の設計と運用
HBaseを用いたグラフDB「Hornet」の設計と運用HBaseを用いたグラフDB「Hornet」の設計と運用
HBaseを用いたグラフDB「Hornet」の設計と運用
 
Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...
Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...
Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...
 
Qlik Replicate - 双方向レプリケーション(Bidirectional Replication)の利用
Qlik Replicate - 双方向レプリケーション(Bidirectional Replication)の利用Qlik Replicate - 双方向レプリケーション(Bidirectional Replication)の利用
Qlik Replicate - 双方向レプリケーション(Bidirectional Replication)の利用
 
SIGMOD’12勉強会 -Session 7-
SIGMOD’12勉強会 -Session 7-SIGMOD’12勉強会 -Session 7-
SIGMOD’12勉強会 -Session 7-
 
刊行記念セミナー「HBase徹底入門」
刊行記念セミナー「HBase徹底入門」刊行記念セミナー「HBase徹底入門」
刊行記念セミナー「HBase徹底入門」
 
MapReduce入門
MapReduce入門MapReduce入門
MapReduce入門
 
Hadoopのシステム設計・運用のポイント
Hadoopのシステム設計・運用のポイントHadoopのシステム設計・運用のポイント
Hadoopのシステム設計・運用のポイント
 
国会図書館サーチの概要
国会図書館サーチの概要国会図書館サーチの概要
国会図書館サーチの概要
 
PostgreSQL10徹底解説
PostgreSQL10徹底解説PostgreSQL10徹底解説
PostgreSQL10徹底解説
 
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
 
Apache Hadoopの未来 3系になって何が変わるのか?
Apache Hadoopの未来 3系になって何が変わるのか?Apache Hadoopの未来 3系になって何が変わるのか?
Apache Hadoopの未来 3系になって何が変わるのか?
 

Andere mochten auch

hs_spider_hs_something_20110906
hs_spider_hs_something_20110906hs_spider_hs_something_20110906
hs_spider_hs_something_20110906Kentoku
 
Mroonga 20141129
Mroonga 20141129Mroonga 20141129
Mroonga 20141129Kentoku
 
Charms of MySQL 20101206(DTT#7)
Charms of MySQL 20101206(DTT#7)Charms of MySQL 20101206(DTT#7)
Charms of MySQL 20101206(DTT#7)Kentoku
 
Spiderの最新動向 20131009
Spiderの最新動向 20131009Spiderの最新動向 20131009
Spiderの最新動向 20131009Kentoku
 
Newest topic of spider 20131016 in Buenos Aires Argentina
Newest topic of spider 20131016 in Buenos Aires ArgentinaNewest topic of spider 20131016 in Buenos Aires Argentina
Newest topic of spider 20131016 in Buenos Aires ArgentinaKentoku
 
Spider Shibuya.pm #12
Spider Shibuya.pm #12Spider Shibuya.pm #12
Spider Shibuya.pm #12Kentoku
 
Advanced Sharding Techniques with Spider (MUC2010)
Advanced Sharding Techniques with Spider (MUC2010)Advanced Sharding Techniques with Spider (MUC2010)
Advanced Sharding Techniques with Spider (MUC2010)Kentoku
 
Mroonga 20131129
Mroonga 20131129Mroonga 20131129
Mroonga 20131129Kentoku
 
Spider HA 20100922(DTT#7)
Spider HA 20100922(DTT#7)Spider HA 20100922(DTT#7)
Spider HA 20100922(DTT#7)Kentoku
 
MariaDB ColumnStore 20160721
MariaDB ColumnStore 20160721MariaDB ColumnStore 20160721
MariaDB ColumnStore 20160721Kentoku
 
Spider Performance Test(Bench Mark04242009)
Spider Performance Test(Bench Mark04242009)Spider Performance Test(Bench Mark04242009)
Spider Performance Test(Bench Mark04242009)Kentoku
 
Spider DeNA Technology Seminar #2
Spider DeNA Technology Seminar #2Spider DeNA Technology Seminar #2
Spider DeNA Technology Seminar #2Kentoku
 
MariaDB Spider Mroonga 20140218
MariaDB Spider Mroonga 20140218MariaDB Spider Mroonga 20140218
MariaDB Spider Mroonga 20140218Kentoku
 
Sharding with spider solutions 20160721
Sharding with spider solutions 20160721Sharding with spider solutions 20160721
Sharding with spider solutions 20160721Kentoku
 
Spider storage engine (dec212016)
Spider storage engine (dec212016)Spider storage engine (dec212016)
Spider storage engine (dec212016)Kentoku
 
Using spider for sharding in production
Using spider for sharding in productionUsing spider for sharding in production
Using spider for sharding in productionKentoku
 
Spiderストレージエンジンのご紹介
Spiderストレージエンジンのご紹介Spiderストレージエンジンのご紹介
Spiderストレージエンジンのご紹介Kentoku
 

Andere mochten auch (18)

hs_spider_hs_something_20110906
hs_spider_hs_something_20110906hs_spider_hs_something_20110906
hs_spider_hs_something_20110906
 
Mroonga 20141129
Mroonga 20141129Mroonga 20141129
Mroonga 20141129
 
Charms of MySQL 20101206(DTT#7)
Charms of MySQL 20101206(DTT#7)Charms of MySQL 20101206(DTT#7)
Charms of MySQL 20101206(DTT#7)
 
Spiderの最新動向 20131009
Spiderの最新動向 20131009Spiderの最新動向 20131009
Spiderの最新動向 20131009
 
Newest topic of spider 20131016 in Buenos Aires Argentina
Newest topic of spider 20131016 in Buenos Aires ArgentinaNewest topic of spider 20131016 in Buenos Aires Argentina
Newest topic of spider 20131016 in Buenos Aires Argentina
 
Spider Shibuya.pm #12
Spider Shibuya.pm #12Spider Shibuya.pm #12
Spider Shibuya.pm #12
 
Advanced Sharding Techniques with Spider (MUC2010)
Advanced Sharding Techniques with Spider (MUC2010)Advanced Sharding Techniques with Spider (MUC2010)
Advanced Sharding Techniques with Spider (MUC2010)
 
Mroonga 20131129
Mroonga 20131129Mroonga 20131129
Mroonga 20131129
 
Galaxy Big Data with MariaDB
Galaxy Big Data with MariaDBGalaxy Big Data with MariaDB
Galaxy Big Data with MariaDB
 
Spider HA 20100922(DTT#7)
Spider HA 20100922(DTT#7)Spider HA 20100922(DTT#7)
Spider HA 20100922(DTT#7)
 
MariaDB ColumnStore 20160721
MariaDB ColumnStore 20160721MariaDB ColumnStore 20160721
MariaDB ColumnStore 20160721
 
Spider Performance Test(Bench Mark04242009)
Spider Performance Test(Bench Mark04242009)Spider Performance Test(Bench Mark04242009)
Spider Performance Test(Bench Mark04242009)
 
Spider DeNA Technology Seminar #2
Spider DeNA Technology Seminar #2Spider DeNA Technology Seminar #2
Spider DeNA Technology Seminar #2
 
MariaDB Spider Mroonga 20140218
MariaDB Spider Mroonga 20140218MariaDB Spider Mroonga 20140218
MariaDB Spider Mroonga 20140218
 
Sharding with spider solutions 20160721
Sharding with spider solutions 20160721Sharding with spider solutions 20160721
Sharding with spider solutions 20160721
 
Spider storage engine (dec212016)
Spider storage engine (dec212016)Spider storage engine (dec212016)
Spider storage engine (dec212016)
 
Using spider for sharding in production
Using spider for sharding in productionUsing spider for sharding in production
Using spider for sharding in production
 
Spiderストレージエンジンのご紹介
Spiderストレージエンジンのご紹介Spiderストレージエンジンのご紹介
Spiderストレージエンジンのご紹介
 

Ähnlich wie Introducing Spider 20101206(DTT#7)

カウチなやつら CouchDB in the room
カウチなやつら CouchDB in the roomカウチなやつら CouchDB in the room
カウチなやつら CouchDB in the roomMakoto Ohnami
 
IBM Cloudant の細かすぎて伝わりにくい機能(その2) データの変更履歴が自動管理できるらしい
IBM Cloudant の細かすぎて伝わりにくい機能(その2) データの変更履歴が自動管理できるらしいIBM Cloudant の細かすぎて伝わりにくい機能(その2) データの変更履歴が自動管理できるらしい
IBM Cloudant の細かすぎて伝わりにくい機能(その2) データの変更履歴が自動管理できるらしいK Kimura
 
Spiderの最新動向 20130419
Spiderの最新動向 20130419Spiderの最新動向 20130419
Spiderの最新動向 20130419Kentoku
 
PHP開発者のためのNoSQL入門
PHP開発者のためのNoSQL入門PHP開発者のためのNoSQL入門
PHP開発者のためのNoSQL入門じゅん なかざ
 
Sql database その裏側に迫る
Sql database その裏側に迫るSql database その裏側に迫る
Sql database その裏側に迫るMasayuki Ozawa
 
大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニック
大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニック大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニック
大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニックinfinite_loop
 
超実践 Cloud Spanner 設計講座
超実践 Cloud Spanner 設計講座超実践 Cloud Spanner 設計講座
超実践 Cloud Spanner 設計講座Samir Hammoudi
 
Lv1から始めるWebサービスのインフラ構築
Lv1から始めるWebサービスのインフラ構築Lv1から始めるWebサービスのインフラ構築
Lv1から始めるWebサービスのインフラ構築伊藤 祐策
 
Web Operations and Perl kansai.pm#14
Web Operations and Perl kansai.pm#14Web Operations and Perl kansai.pm#14
Web Operations and Perl kansai.pm#14Masahiro Nagano
 
SQL Azure のシームレスな管理
SQL Azure のシームレスな管理SQL Azure のシームレスな管理
SQL Azure のシームレスな管理junichi anno
 
ioMemoryとAtomic Writeによるデータベース高速化
ioMemoryとAtomic Writeによるデータベース高速化ioMemoryとAtomic Writeによるデータベース高速化
ioMemoryとAtomic Writeによるデータベース高速化IIJ
 
Amazon dynamo db、cloudant、blockchainの紹介 20160706
Amazon dynamo db、cloudant、blockchainの紹介 20160706Amazon dynamo db、cloudant、blockchainの紹介 20160706
Amazon dynamo db、cloudant、blockchainの紹介 20160706Tsuyoshi Hirayama
 
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
SQL Server 使いのための Azure Synapse Analytics - Spark 入門SQL Server 使いのための Azure Synapse Analytics - Spark 入門
SQL Server 使いのための Azure Synapse Analytics - Spark 入門Daiyu Hatakeyama
 
Rails初心者レッスン lesson1 3rd edition
Rails初心者レッスン lesson1 3rd editionRails初心者レッスン lesson1 3rd edition
Rails初心者レッスン lesson1 3rd editionGoh Matsumoto
 
RとSQLiteで気軽にデータベース作成
RとSQLiteで気軽にデータベース作成RとSQLiteで気軽にデータベース作成
RとSQLiteで気軽にデータベース作成弘毅 露崎
 
1台から500台までのMySQL運用(YAPC::Asia編)
1台から500台までのMySQL運用(YAPC::Asia編)1台から500台までのMySQL運用(YAPC::Asia編)
1台から500台までのMySQL運用(YAPC::Asia編)Masahiro Nagano
 
中規模Androidアプリ開発の過程に生じた問題と対策の紹介
中規模Androidアプリ開発の過程に生じた問題と対策の紹介中規模Androidアプリ開発の過程に生じた問題と対策の紹介
中規模Androidアプリ開発の過程に生じた問題と対策の紹介NilOne Ltd.
 
C16 45分でわかるPostgreSQLの仕組み by 山田努
C16 45分でわかるPostgreSQLの仕組み by 山田努C16 45分でわかるPostgreSQLの仕組み by 山田努
C16 45分でわかるPostgreSQLの仕組み by 山田努Insight Technology, Inc.
 
AWSクラウドデザインパターン(CDP) - Eコマース編 -
AWSクラウドデザインパターン(CDP) - Eコマース編 -AWSクラウドデザインパターン(CDP) - Eコマース編 -
AWSクラウドデザインパターン(CDP) - Eコマース編 -SORACOM, INC
 

Ähnlich wie Introducing Spider 20101206(DTT#7) (20)

カウチなやつら CouchDB in the room
カウチなやつら CouchDB in the roomカウチなやつら CouchDB in the room
カウチなやつら CouchDB in the room
 
IBM Cloudant の細かすぎて伝わりにくい機能(その2) データの変更履歴が自動管理できるらしい
IBM Cloudant の細かすぎて伝わりにくい機能(その2) データの変更履歴が自動管理できるらしいIBM Cloudant の細かすぎて伝わりにくい機能(その2) データの変更履歴が自動管理できるらしい
IBM Cloudant の細かすぎて伝わりにくい機能(その2) データの変更履歴が自動管理できるらしい
 
Spiderの最新動向 20130419
Spiderの最新動向 20130419Spiderの最新動向 20130419
Spiderの最新動向 20130419
 
MongoDB
MongoDBMongoDB
MongoDB
 
PHP開発者のためのNoSQL入門
PHP開発者のためのNoSQL入門PHP開発者のためのNoSQL入門
PHP開発者のためのNoSQL入門
 
Sql database その裏側に迫る
Sql database その裏側に迫るSql database その裏側に迫る
Sql database その裏側に迫る
 
大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニック
大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニック大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニック
大規模ソーシャルゲーム開発から学んだPHP&MySQL実践テクニック
 
超実践 Cloud Spanner 設計講座
超実践 Cloud Spanner 設計講座超実践 Cloud Spanner 設計講座
超実践 Cloud Spanner 設計講座
 
Lv1から始めるWebサービスのインフラ構築
Lv1から始めるWebサービスのインフラ構築Lv1から始めるWebサービスのインフラ構築
Lv1から始めるWebサービスのインフラ構築
 
Web Operations and Perl kansai.pm#14
Web Operations and Perl kansai.pm#14Web Operations and Perl kansai.pm#14
Web Operations and Perl kansai.pm#14
 
SQL Azure のシームレスな管理
SQL Azure のシームレスな管理SQL Azure のシームレスな管理
SQL Azure のシームレスな管理
 
ioMemoryとAtomic Writeによるデータベース高速化
ioMemoryとAtomic Writeによるデータベース高速化ioMemoryとAtomic Writeによるデータベース高速化
ioMemoryとAtomic Writeによるデータベース高速化
 
Amazon dynamo db、cloudant、blockchainの紹介 20160706
Amazon dynamo db、cloudant、blockchainの紹介 20160706Amazon dynamo db、cloudant、blockchainの紹介 20160706
Amazon dynamo db、cloudant、blockchainの紹介 20160706
 
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
SQL Server 使いのための Azure Synapse Analytics - Spark 入門SQL Server 使いのための Azure Synapse Analytics - Spark 入門
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
 
Rails初心者レッスン lesson1 3rd edition
Rails初心者レッスン lesson1 3rd editionRails初心者レッスン lesson1 3rd edition
Rails初心者レッスン lesson1 3rd edition
 
RとSQLiteで気軽にデータベース作成
RとSQLiteで気軽にデータベース作成RとSQLiteで気軽にデータベース作成
RとSQLiteで気軽にデータベース作成
 
1台から500台までのMySQL運用(YAPC::Asia編)
1台から500台までのMySQL運用(YAPC::Asia編)1台から500台までのMySQL運用(YAPC::Asia編)
1台から500台までのMySQL運用(YAPC::Asia編)
 
中規模Androidアプリ開発の過程に生じた問題と対策の紹介
中規模Androidアプリ開発の過程に生じた問題と対策の紹介中規模Androidアプリ開発の過程に生じた問題と対策の紹介
中規模Androidアプリ開発の過程に生じた問題と対策の紹介
 
C16 45分でわかるPostgreSQLの仕組み by 山田努
C16 45分でわかるPostgreSQLの仕組み by 山田努C16 45分でわかるPostgreSQLの仕組み by 山田努
C16 45分でわかるPostgreSQLの仕組み by 山田努
 
AWSクラウドデザインパターン(CDP) - Eコマース編 -
AWSクラウドデザインパターン(CDP) - Eコマース編 -AWSクラウドデザインパターン(CDP) - Eコマース編 -
AWSクラウドデザインパターン(CDP) - Eコマース編 -
 

Mehr von Kentoku

An issue of all slaves stop replication
An issue of all slaves stop replicationAn issue of all slaves stop replication
An issue of all slaves stop replicationKentoku
 
How to migrate_to_sharding_with_spider
How to migrate_to_sharding_with_spiderHow to migrate_to_sharding_with_spider
How to migrate_to_sharding_with_spiderKentoku
 
MariaDB 10.3から利用できるSpider関連の性能向上機能・便利機能ほか
MariaDB 10.3から利用できるSpider関連の性能向上機能・便利機能ほかMariaDB 10.3から利用できるSpider関連の性能向上機能・便利機能ほか
MariaDB 10.3から利用できるSpider関連の性能向上機能・便利機能ほかKentoku
 
Spiderストレージエンジンの使い方と利用事例 他ストレージエンジンの紹介
Spiderストレージエンジンの使い方と利用事例 他ストレージエンジンの紹介Spiderストレージエンジンの使い方と利用事例 他ストレージエンジンの紹介
Spiderストレージエンジンの使い方と利用事例 他ストレージエンジンの紹介Kentoku
 
Mroonga 20121129
Mroonga 20121129Mroonga 20121129
Mroonga 20121129Kentoku
 
Mroonga unsupported feature_20111129
Mroonga unsupported feature_20111129Mroonga unsupported feature_20111129
Mroonga unsupported feature_20111129Kentoku
 
Introducing mroonga 20111129
Introducing mroonga 20111129Introducing mroonga 20111129
Introducing mroonga 20111129Kentoku
 

Mehr von Kentoku (7)

An issue of all slaves stop replication
An issue of all slaves stop replicationAn issue of all slaves stop replication
An issue of all slaves stop replication
 
How to migrate_to_sharding_with_spider
How to migrate_to_sharding_with_spiderHow to migrate_to_sharding_with_spider
How to migrate_to_sharding_with_spider
 
MariaDB 10.3から利用できるSpider関連の性能向上機能・便利機能ほか
MariaDB 10.3から利用できるSpider関連の性能向上機能・便利機能ほかMariaDB 10.3から利用できるSpider関連の性能向上機能・便利機能ほか
MariaDB 10.3から利用できるSpider関連の性能向上機能・便利機能ほか
 
Spiderストレージエンジンの使い方と利用事例 他ストレージエンジンの紹介
Spiderストレージエンジンの使い方と利用事例 他ストレージエンジンの紹介Spiderストレージエンジンの使い方と利用事例 他ストレージエンジンの紹介
Spiderストレージエンジンの使い方と利用事例 他ストレージエンジンの紹介
 
Mroonga 20121129
Mroonga 20121129Mroonga 20121129
Mroonga 20121129
 
Mroonga unsupported feature_20111129
Mroonga unsupported feature_20111129Mroonga unsupported feature_20111129
Mroonga unsupported feature_20111129
 
Introducing mroonga 20111129
Introducing mroonga 20111129Introducing mroonga 20111129
Introducing mroonga 20111129
 

Introducing Spider 20101206(DTT#7)