3. History
‘70s RDBMS黎明期から開発は行われている
’76 カナダ統計局の RAPID (カナダの国勢調査および統計的処理システム)
* 80年代には世界中でRAPIDが共有され、90年代まで使用された(wikipedia)
’00 長年、Sybase IQが商用のColumnar Databaseとして存在
NOW 近年、大量データにおける分析需要の高まりから様々な製品およびプロジェクトが誕生
また、商用大手ベンダーも列指向と行指向のハイブリッド化を進めている
Commercial
Sybase IQ
Aster Data
Vertica
Greenplum
VectorWise
BigTable
Free or Open
InfiniDB CE
MonetDB
x100
LucidDB
3
4. • 列指向とは?
• メリットは?
(シーケンシャルな)アクセス効率 + データ圧縮 = 分析基盤に向いている
Prod ID Prod Name Date Prod ID Prod Name Date
Prod ID Prod Name Date Prod ID Prod Name Date
Prod ID Prod Name Date Prod ID Prod Name Date
Prod ID Prod Name Date Prod ID Prod Name Date
Prod ID Prod Name Date Prod ID Prod Name Date
1ブロックには様々な 1ブロックには同様の
タイプのデータが格納 タイプのデータが格納
されているので圧縮効 されているので圧縮効
率を上げにくい 率を上げやすい
4
5. • デメリットは?
一般的に
(ランダムな)アクセスが非効率 + データ圧縮 = OLTP基盤に向いていない
Prod ID Prod Name Date Prod ID Prod Name Date
Prod ID Prod Name Date Prod ID Prod Name Date
Prod ID Prod Name Date Prod ID Prod Name Date
Prod ID Prod Name Date Prod ID Prod Name Date
Prod ID Prod Name Date Prod ID Prod Name Date
更新時に圧縮・展開
のオーバーヘッドが
大きい(*1)
(*1) 圧縮のデメリットはカラムナーデータベースに限った話ではありません 5
9. 50% up/year:
- cpu speed
- mem size
- mem bandwidth
- disk bandwidth
1% up/year:
- mem latency
10% up/year:
- disk latency
MonetDB: A high performance database kernel for query-intensive applications
9
http://monetdb-xquery.org/Assets/monetdb_lecture.pdf