2. ΑΝΟΧΗ ΣΕ ΣΦΑΛΜΑΤΑ ΣΕ ΥΠΟΛΟΓΙΣΤΙΚΟ
ΠΕΡΙΒΑΛΛΟΝ ΝΕΦΟΥΣ (Fault Tolerance in Cloud Computing Systems)
● Αποθήκευση μεγάλων σε όγκο δεδομένων από πολλούς χρήστες
○ (Yahoo, Facebook, Google) [1]
● φθηνό υλικό (hardware) και αξιοπιστία σε ασφάλεια και με ανοχή σε
σφάλματα λογισμικό
Σφάλμα:
πτώση ή διακοπή παροχής ρεύματος [2],
απενεργοποίηση server/cluster,
...
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
3. Copysets: Reducing the Frequency of Data Loss in
Cloud Storage
Ερευνητικό Ερώτημα: Ελαχιστοποίηση πιθανότητας απώλειας δεδομένων.
(Tolerate Node Failures)
● Αντιγραφή (Replicate) σε τεμάχια (chunks) τυχαία (Random) [3,4]
● Αποτυχία επαναφοράς δεδομένων 0,5-1% [3,5]
● πτώση ρεύματος, δικτύου
○ 1-2 φορές το χρόνο [Google, Yahoo, LinkedIn][2]
● κόστος (χρόνος, επαναφορά δεδομένων)
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
Asaf Cidon, Stephen M. Rumble, Ryan Stutsman, Sachin Katti, John Ousterhout and Mendel Rosenblum
Stanford University, 2013
4. Copysets: Reducing the Frequency of Data Loss in
Cloud Storage
Υλοποίηση: Copyset Replication (1/3)
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
Asaf Cidon, Stephen M. Rumble, Ryan Stutsman, Sachin Katti, John Ousterhout and Mendel Rosenblum
Stanford University, 2013
5. Copysets: Reducing the Frequency of Data Loss in
Cloud Storage
Υλοποίηση: Copyset Replication (2/3)
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
Asaf Cidon, Stephen M. Rumble, Ryan Stutsman, Sachin Katti, John Ousterhout and Mendel Rosenblum
Stanford University, 2013
6. Copysets: Reducing the Frequency of Data Loss in
Cloud Storage
Υλοποίηση: Copyset Replication (3/3)
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
Asaf Cidon, Stephen M. Rumble, Ryan Stutsman, Sachin Katti, John Ousterhout and Mendel Rosenblum
Stanford University, 2013
7. Copysets: Reducing the Frequency of Data Loss in
Cloud Storage
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
Asaf Cidon, Stephen M. Rumble, Ryan Stutsman, Sachin Katti, John Ousterhout and Mendel Rosenblum
Stanford University, 2013
Αποτέλεσμα:
8. Qos-Aware Data Replication for Data-Intensive
Applications in Cloud Computing Systems
Ερευνητικό Ερώτημα: Ελαχιστοποίηση του κόστους της αντιγραφής δεδομένων
(Data Replication cost) και του αριθμού των παραβιάσεων των αντιγράφων
(QoS-violated Data Replicas)
● πλήθος κόμβων + υλικό αποτυχίες υλικού [6,7,8]
● αποτέλεσμα : οι εφαρμογές να μη “φέρνουν-διαβάζουν” δεδομένα
● ελαχιστοποιώντας το κόστος η αντιγραφή γίνεται πιο γρήγορα,
ελαχιστοποιώντας τη πιθανότητα αποτυχίας
● Διακρίνουμε κόμβους υψηλής απόδοσης και χαμηλής απόδοσης
QoS: χρόνος πρόσβασης, εκτέλεσης (απόδοση)
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
Jenn-Wei Lin, Chien-Hung Chen, and J. Morris Chang, Senior Member,
IEEE,(January-June) 2013
9. Qos-Aware Data Replication for Data-Intensive
Applications in Cloud Computing Systems
Υλοποίηση: High-QoS First-Replication Algorithm
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
Jenn-Wei Lin, Chien-Hung Chen, and J. Morris Chang, Senior Member,
IEEE,(January-June) 2013
10. Qos-Aware Data Replication for Data-Intensive
Applications in Cloud Computing Systems
Υλοποίηση: Βέλτιστη Λύση στο HADR
● ILP
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
Jenn-Wei Lin, Chien-Hung Chen, and J. Morris Chang, Senior Member,
IEEE,(January-June) 2013
μεγάλη χρονική διάρκεια
υπολογισμού
11. Qos-Aware Data Replication for Data-Intensive
Applications in Cloud Computing Systems
Υλοποίηση: Μετασχηματισμός σε MCMF πρόβλημα
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
Jenn-Wei Lin, Chien-Hung Chen, and J. Morris Chang, Senior Member,
IEEE,(January-June) 2013
12. Qos-Aware Data Replication for Data-Intensive
Applications in Cloud Computing Systems
Υλοποίηση: Μετασχηματισμός σε MCMF πρόβλημα
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
Jenn-Wei Lin, Chien-Hung Chen, and J. Morris Chang, Senior Member,
IEEE,(January-June) 2013
13. Qos-Aware Data Replication for Data-Intensive
Applications in Cloud Computing Systems
Αποτέλεσμα: χρήση MatLab [9] σε 3.500 nodes (1/4)
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
Jenn-Wei Lin, Chien-Hung Chen, and J. Morris Chang, Senior Member,
IEEE,(January-June) 2013
14. Qos-Aware Data Replication for Data-Intensive
Applications in Cloud Computing Systems
Αποτέλεσμα: χρήση MatLab [9] σε 3.500 nodes (2/4)
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
Jenn-Wei Lin, Chien-Hung Chen, and J. Morris Chang, Senior Member,
IEEE,(January-June) 2013
15. Qos-Aware Data Replication for Data-Intensive
Applications in Cloud Computing Systems
Αποτέλεσμα: χρήση MatLab [9] σε 3.500 nodes (3/4)
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
Jenn-Wei Lin, Chien-Hung Chen, and J. Morris Chang, Senior Member,
IEEE,(January-June) 2013
16. Qos-Aware Data Replication for Data-Intensive
Applications in Cloud Computing Systems
Αποτέλεσμα: χρήση MatLab [9] σε 3.500 nodes (4/4)
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
Jenn-Wei Lin, Chien-Hung Chen, and J. Morris Chang, Senior Member,
IEEE,(January-June) 2013
17. Fault Tolerance in Cloud Computing Systems
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
Ερευνητικό Ερώτημα: Μελέτη, Ανάλυση,Υλοποίηση , Σύγκριση αλγορίθμων
ανοχής σε σφάλματα σε περιβάλλον υπολογιστικού νέφους
● Ελαχιστοποίηση πιθανότητας να συμβεί ένα σφάλμα
● Data Replication
● Java
● Cloudsim
(Framework For Modeling And Simulation Of Cloud Computing Infrastructures
And Services )
18. Αναφορές
2014-2015 Π.Μ.Σ.-Πληροφορικής & Τηλεματικής
[1] Thomas Kiencke, Institute of Telematics, Hadoop Distributed File System (HDFS), University of L¨ubeck, Germany.
[2] Asaf Cidon, Stephen M. Rumble, Ryan Stutsman,Sachin Katti, John Ousterhout and Mendel Rosenblum, Stanford
Universitys, Copysets: Reducing the Frequency of Data Loss in Cloud Storage.
[3] K. Shvachko, H. Kuang, S. Radia, and R. Chansler. The hadoop distributed file system. Mass Storage Systems and
Technologies, IEEE / NASA Goddard Conference on, 0:1–10, 2010.
[4] D. Ongaro, S. M. Rumble, R. Stutsman, J. K. Ousterhout, and M. Rosenblum. Fast crash recovery in RAMCloud. In
SOSP, pages 29–41, 2011.
[5] R. J. Chansler. Data Availability and Durability with the Hadoop Distributed File System. ;login: The USENIX
Magazine, 37(1), February 2012.
[6] K.V. Vishwanath and N. Nagappan, “Characterizing Cloud Computing Hardware Reliability,” Proc. ACM Symp.
Cloud Computing, pp. 193-204, June 2010.
[7] E. Pinheiro, W.-D. Weber, and L.A. Barroso, “Failure Trends in a Large Disk Drive Population,” Proc. Fifth USENIX
Conf. File and Storage Technologies, pp. 17-28, Feb. 2007.
[8] B. Schroeder and G.A. Gibson, “Disk Failures in the Real World: What Does an MTTF of 1,000,000 Hours Mean to
You?” Proc. Fifth USENIX Conf. File and Storage Technologies, pp. 1-16, Feb. 2007.
[9] MathWorks - MATLAB and Simulink for Technical Computing, http://www.mathworks.com, 2013.