20. 20
株式会社サイバーエージェント
HiveQL
CREATE TABLE pigg_login
( time STRING, ameba_id STRING, ip STRING)
partitioned by(dt STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘¥t’
STORED AS SEQUENCEFILE;
SELECT p.age, count(distinct l.ameba_id)
FROM pigg_login l
JOIN profile p on (l.ameba_id=p.ameba_id)
WHERE l.dt= ‘2011-11-04‘ GROUP BY p.age;
• SQLライクに記述できるので便利
• Map/Reduceを直接書いた場合と同等の実行速度