9. Scale up vs. Scale out
many “small” nodesBig single node system
Advantages
Problems
• Transparent for database system
• Management complexity constant
• Expensive hardware
• Limited scalability
Advantages
Problems
• Less expensive hardware
• High scalability
• Load balancing necessary
• Distributed lock and replication
protocols
• Increased management complexity
• Data distribution necessary
• Increased error rate
15. Name Node
Secondary Name
Node
Data Node Data Node ….. Data Node
Name Node verwaltet Verzeichnisse, Dateien im HDFS und Blöcke in den Data
Nodes
Data Nodes enthalten die eigentlichen Dateien und sind zuständig die
Auslieferung der Dateien für die Anfragen.
Master
Slave
Second. NN überprüft periodisch den NN und logt die checkpoints um den NN
bei Absturz neuzustarten.
HDFS