Effiziente Verarbeitung von großen Datenmengen

Eﬃziente Verarbeitung von großen Datenmengen
Andreas Eisenkolb

January 7, 2014

Andreas Eisenkolb


January 7, 2014

1 / 11

Inhaltsverzeichnis

1

Big Data

2

MapReduce

Andreas Eisenkolb


January 7, 2014

2 / 11

Big Data

Andreas Eisenkolb


January 7, 2014

3 / 11

Big Data

speichert ca. 2,5 Petabytes
1 Petabyte = 1 048 576 Gigabytes
IBM Festplatten-Cluster speichert 20 Petabayte
1

1

Quelle: http://www.dailytech.com/article.aspx?newsid=22558
Andreas Eisenkolb


January 7, 2014

4 / 11

Was versteht man unter Big Data?

Big Data
Big Data bezeichnet große Datenmengen aus vielf¨ltigen Quellen, die mit
a
Hilfe neu entwickelter Methoden und Technologien erfasst, verteilt,
gespeichert, durchsucht, analysiert und visualisiert werden k¨nnena .
o
a

Wissenschaftliche Dienste des Deutschen Bundestages

Andreas Eisenkolb


January 7, 2014

5 / 11

Big Data Challenge

Andreas Eisenkolb


January 7, 2014

6 / 11

Die 4 ”Vs” von Big Data

Andreas Eisenkolb


January 7, 2014

7 / 11

Was ist MapReduce?

MapReduce
MapReduce ist ein vom Unternehmen Google Inc. eingef¨hrtes
u
Programmiermodell f¨r nebenl¨uﬁge Berechnungen uber große
u
a
¨
Datenmengen auf Computerclustern.

Andreas Eisenkolb


January 7, 2014

8 / 11

Warum MapReduce?

Eﬃziente Verarbeitung großer Datenmengen
Einfache Benutzung (Fehlerbehandlung, Datenverteilung, etc.)

Andreas Eisenkolb


January 7, 2014

9 / 11

MapReduce

Andreas Eisenkolb


January 7, 2014

10 / 11

Andreas Eisenkolb


January 7, 2014

11 / 11

Effiziente Verarbeitung von großen Datenmengen

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Andere mochten auch

Andere mochten auch (13)

Mehr von Florian Stegmaier

Mehr von Florian Stegmaier (16)

Effiziente Verarbeitung von großen Datenmengen