6. Etwas Geschichte
Dateisystem GFS HDFS
Verarbeitung MapReduce MapReduce
RealTime BigTable HBase
Lizenz nicht offen Apache
6
7. Apache Hadoop
• Software Framework für grosse Mengen an
unstrukturierten Daten
• Apache-Lizenz
• Zwei Kern-Komponenten
• HDFS: Verteilte Datenspeicherung
• MapReduce:Verteilte Datenverarbeitung
7
8. Hadoop Cluster
Data Node Data Node Data Node Data Node
Data Node Data Node Data Node Data Node
Data Node Data Node Data Node Data Node
Data Node Data Node Data Node Data Node
Data Node Data Node Data Node Data Node
Data Node Data Node Data Node Data Node
Data Node Data Node Data Node Data Node
Data Node: 4-16 Cores, 4-16 Disks,
8-64 GB RAM, 1-10GB Network
8