Die Präsentation von Kai Voigt von Cloudera, gehalten am 6. Juni 2011, führt in die Konzepte von Big Data und Hadoop ein, einschließlich der Grundlagen des Hadoop Distributed File Systems (HDFS) und des MapReduce-Programmiermodells. Anhand von Beispielen wie der Wortzählung werden die Verarbeitung und Analyse großer Datensätze veranschaulicht, und verschiedene Anwendungsfälle, wie Empfehlungen und Textverarbeitung, werden dargestellt. Zudem wird auf das Hadoop-Ökosystem eingegangen, das Werkzeuge wie Hive, Pig und Mahout umfasst.