Was genau macht eigentlich Erasure Coding, und wozu braucht man das?

Boston Webinar
Erasure Coding — Was ist das eigentlich genau?
Wolfgang Stief
Senior Consultant

§  Gegründet 1992 – 24 Jahre Innovation
§  Supermicros ältester & größter globaler Partner — seit über 20 Jahren
§  Lösungshersteller mit Fokus auf Technologie (First-to-Market Strategie)
§  London HQ, Niederlassungen in London City, München, Mumbai,
Bangalore, New York. Weitere Expansion geplant.
§  Experten im Lösungs- und HPC-System-Design unter Verwendung von
Premium-Komponenten von Supermicro und ausgewählten Partnern
§  Supermicros Fastest Growing Partner
Über uns

§  Ganz ohne Mathematik geht es nicht
Historie, Grundlagen, Begriﬀe
§  Einsatzgebiete und Grenzen des Erasure Coding
Rechenbeispiele und das Repair Problem
§  Anwendungen und Literaturhinweise
Agenda

§  Kodierungstheorie, fehlertolerante Codes
Gebiet der Zahlentheorie (Mathematik)
1960 Coding Theory
Reed Solomon, Berlekamp-Massey
(CD, DVD, digitale Datenübertragung)
1990 RAID-6 (Evenodd, RDP, X-Code) ➛ Storage
LDPC-Codes (Tornado, Raptor, LT) ➛ Netzwerk
2000 EC in Computernetzwerken zur Datenübertragung
Regenerating Codes
2010 Non-MDS Codes (Cloud, Recovery)
Woher kommt Erasure Coding?

Grundlagen
Aufgabe: Daten so auf Storage Nodes verteilen, dass bei Ausfall von
einzelnen Knoten alle Daten noch benutzbar bzw. rekonstruierbar sind.
Daten Storage Nodes

Von k, n und m (I)
Wie beschreibt man n Disks mit k gleich großen Datenbrocken +
Codierung, um einen Plattenausfall zu überleben?
k gleich große Stücke Daten insgesamt n Disks / Storage Nodes

Von k, n und m (II) — Horizontal Codes
Horizontal Erasure Code: k Data Nodes/Disks, m Coding od. Parity Nodes/
Disks. Coding/parity ist auf getrennten Nodes/Disks.
n = k + m
mcodingdisks

Von k, n und m (III) — Vertical Codes
Vertical Erasure Code: Code und Parity-Information liegen gemeinsam auf
einem Node/einer Disk.

Von k, n und m (IV) — Erasure Codes
Plattenausfall ➛ Daten auf ausgefallenen Platten werden unbrauchbar
bzw. korrupt. Dieser Fehlerzustand heißt „erasure“➛ Erasure Coding
n = k + m
mcodingdisks

Von k, n und m (V) — MDS
Kann der angewendete EC Algorithmus den Ausfall von m Platten
rekonstruieren, ist das ein Maximum Distance Separable Code (MDS).
n = k + m
mcodingdisks

§  EC(n,k), RS(n,k)
n ➛ Gesamtzahl der Nodes/Platten
k ➛ Anzahl der Datennodes/-platten
m ➛ Anzahl der Paritynodes/-platten (m=n-k)
§  Beispiel: EC(8,5)
5 Datenplatten, 3 Parityplatten
MDS = 3 (n-k)
Overhead = 8/5 (1,6) (n/k)
Notation
k n
m

§  Anforderung: hohe Redundanz bei vertretbarem Overhead
- mehrfache Replikation braucht viel Plattenplatz ➛ großer Overhead
§  robuste Skalierung über viele Nodes (Performance)
- RAID-5 oder RAID-6 mit >20 Platten ➛ unzuverlässig, hohe Rebuild-Zeiten
- RAID-5: m=1; RAID-6: m=2
- große Storage-Cluster (m>10)
§  häuﬁg bei Object Storage, eher selten (noch?) bei Block Storage
§  nicht sinnvoll: sehr viele sehr kleine Files
➛ Overhead wird zu groß
Virtualisierung/Cloud: Container, Images, >50MB
Wann ist Erasure Coding sinnvoll?

§  10 Datenplatten, 3x Replikation (typ. OpenStack Swift oder Ceph)
Rechenbeispiel

OpenStack Swift Replica
10 Disks, 3x Replikat
➛ 30 Disks insgesamt.
Ausfall der 3 „richtigen“ Disks macht
Storage irreparabel korrupt
Erasure Code (30,10)
10 Datendisks (k), 20 Paritydisk (m)
MDS-Code: Ausfall 20 beliebige
Platten, Storage bleibt funktionsfähig.
Overhead: 30/10 = 3 (!)
Ziel: 1,2 ... 1,5 (einfacher für größere k)
Ausfall 3 Platten = EC(13,10)
Overhead: 13/10 = 1,3

Aber! Repair Problem (I)

§  EC(4,2)
- Evenodd Algorithmus
- MDS (Maximum Distance Separable)
§  Ausfall A1/A2A1+A2+B2
A2+B1
A2+B2
A1+B1B1
B2
A1
A2

Aber! Repair Problem (II)

§  je nach Algorithmus müssen
mehrere bis viele Chunks bewegt
werden
- innerhalb Storage-System tolerierbar
- in Cloud ➛ Netzwerklast
§  Ziel: Optimum aus (n,k) und EC-
Algorithmus
§  im Einzelfall „secret sauce“ des
Herstellers
A1+A2+B2
A2+B1
A2+B2
A1+B1B1
B2
A1
A2
A1➛?
A2➛?
B2
A2+B2
A1+A2+B2

§  BeeGFS
§  teutoStack (OpenStack Swift)
§  Hadoop, Ceph (Appliance @ Boston)
§  Lustre Filesystem
§  All-Flash-Arrays (Zukunft)
für Array-interne Redundanz („RAID-Level“)
Wo läuft‘s?

§  Erasure Coding ist ein mathematisches Verfahren, um Daten mit
Redundanz zu versehen.
§  Erasure Coding bringt hohe Redundanz bei vergleichsweise
geringem Platz-Overhead.
§  EC(20,16) bedeutet, dass 16 Daten-Chunks auf 20 Speicher-Chunks
verteilt werden. Es können bis zu 4 Speicher-Chunks gleichzeitig
ausfallen, ohne dass Daten korrumpieren.
§  Die Reparatur per Erasure Coding kann CPU-intensiv sein und
vergleichsweise hohe I/O-Last bzw. Netzwerklast erzeugen.
Was Sie von heute mitnehmen sollten

§  Wikipedia (englisch) zu Erasure Coding und Foreward Error Correction
https://en.wikipedia.org/wiki/Erasure_code
https://en.wikipedia.org/wiki/Forward_error_correction
§  Paper: Repairing Erasure Codes, Dimitris S. Papailiopoulos
https://www.usenix.org/legacy/event/fast11/posters_ﬁles/Papailiopoulos.pdf
§  The Repair Problem (Erasure Coding for Distributed Storage Wiki)
http://storagewiki.ece.utexas.edu/doku.php?id=wiki:deﬁnitions:repair_problem
§  Tutorial on Erasure Coding for Storage Applications, James S. Plank
http://web.eecs.utk.edu/~plank/plank/papers/2013-02-11-FAST-Tutorial.pdf
Zum Weiterlesen

Kontakt
+49 89 9090199-3
www.boston-it.de
sales@boston-it.de
BostonITsolutions
@BostonGermany
Boston-server-&-storage-solutions-gmbh

Was genau macht eigentlich Erasure Coding, und wozu braucht man das?

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (12)

Ähnlich wie Was genau macht eigentlich Erasure Coding, und wozu braucht man das?

Ähnlich wie Was genau macht eigentlich Erasure Coding, und wozu braucht man das? (12)

Mehr von BOSTON Server & Storage Solutions GmbH

Mehr von BOSTON Server & Storage Solutions GmbH (10)

Was genau macht eigentlich Erasure Coding, und wozu braucht man das?