1. HUG France #1 - 15 Mars 2012
Cascalog
des MapReduces concis
Bertrand DECHOUX
@BertrandDechoux
2. Casca... quoi?
Map/Reduce : pertinent mais insuffisant
Des alternatives : Pig, Hive... et Cascading !
Cascalog : Cascading + Datalog + Clojure
3. Cascading : les concepts
tuple : liste de valeurs nommées
tap : source et sink de données
▶ par défaut : LFS et HFS
▶ par la communauté : Avro, HBase, JDBC, JSON, Kryo,
Memcached, Membase, ElasticSearch, SimpleDB, Solr,
Thrift...
flow : tap(s) source + des opérations + tap(s) sink