SlideShare ist ein Scribd-Unternehmen logo
1 von 27
SMART DATA Developer
Conference
Köln 06.12.2016
4x4:
Big Data in der Cloud
Danny Linden
twitter: @CodingDanny
LinkedIn: linkedin.com/in/danny-linden
Xing: xing.com/profile/Danny_Linden
✉ danny@onpage.org
Über mich
1989 – Im wunderschönen Gelsenkirchen geboren
2005 – Softwaredeveloper
2011 – Auswandern nach München
2013 – Start bei OnPage.org
Interessen:
Webcrawling, Suchmaschinen, skalierbare Big Data Systeme
Gründer der Spark Meetup Gruppe München:
• http://www.meetup.com/de-DE/spark-munich/
> 250,000 User
40 mitarbeiter
> 300,000 Projects
bootstrapped
SaaS
Based in Munich
„Unter Cloud Computing (deutsch Rechnerwolke[1]) versteht man die Ausführung von
Programmen, die nicht auf dem lokalen Rechner installiert sind, sondern auf einem
anderen Rechner, der aus der Ferne aufgerufen wird (bspw. über das Internet).“
Cloud Computing
Die vier Provider
Maslowsche Entwickler Bedürfnispyramide
SaaS
(Machine Learning, ELK Stack,
Textanalyse)
PaaS
(Hadoop, Serverless Backend,
MySQL)
IaaS
(Computing, Storage, Network)
twitter: @CodingDanny
Infrastructure as a Service
Computing:
• Virtuelle Server
• Pay Per Use (Stunde/Minute)
• Schnelle skalierbakeit
• Standorte
• Nerviges Thema
• Spezialisierung
• CPU
• RAM
• Lokaler Storage (keine gute Idee)
• Netzwerk
twitter: @CodingDanny
IaaS: Computing
• Riesige Auswahl an Typen
• Art und Größe
• 14 Regionen
• EU: Irland & Frankfurt
• Bald: Paris & London
• 54 Edge Locations
• Spot
• Spot Fleets
• Reserved Instances
• Bandbreite Typabhängig
• 18 Server Typen
• Custom Typen
• 6 Regionen
• EU: Belgien
• Rabatt nach usage
twitter: @CodingDanny
Wahl der richtigen Instanz am Beispiel AWS EC2
• Wahl der richtigen Instanz-Familie
• M4: Die Haus & Hof Instanz
• C4: CPU Optimiert
• R4 & X1: Memory Optimiert
• G2 & P2: Grafiklastige Anwendungen
• I2: I/O Optimiert
• D2: Storage Optimiert
• F1: FPGAs
twitter: @CodingDanny
On Demand vs. Spot
Instanz Typ ECU Memory(GB) Preis/Stunde Preis/Stunde Spot
Preis/Mon
at Preis/Monat Spot
m4.large 6,5 8 $0,13
$0,02 $92,88 $15,12
m4.xlarge 13 16 $0,26
$0,03 $185,04 $24,12
m4.2xlarge 26 32 $0,51
$0,17 $369,36 $120,17
m4.4xlarge 53,5 64 $1,03
$0,17 $738,72 $119,66
m4.10xlarge 124,5 160 $2,57
$0,43 $1.846,80 $308,16
m4.16xlarge 188 256 $4,10
$0,67 $2.954,88 $485,64
• Applikation muss „Fault Tolerant“ gebaut sein
• Weitere Möglichkeit: Reserved Instances für 1 oder 3 Jahre (19% - 71%)
twitter: @CodingDanny
IaaS: AWS EC2 Spot (Fleets)
twitter: @CodingDanny
IaaS: Storage in der Cloud
• Objekt Storage
• z.b für Hadoop/Spark (HDFS Replacement)
• AWS: Simple Storage Service (S3)
• Google: Cloud Storage
• Azure: Blob Storage
• IBM: Object Storage
• Block Storage
• Virtuelle Festplatte für Compute Instanzen
• AWS: EBS
• Google: Persistant Disk
• Azure: Disk Storage
• IBM: Block Storage
twitter: @CodingDanny
Platform as a Service
„Herr Meier, installieren sie uns
doch mal dieses Hadoop“
PaaS: Hadoop/Spark/Hive/HBase/PIG/Impala/Presto...
AWS EMR Google Dataproc HDInsight(HDP 2.4.2) BigInsights
Hadoop 2.7.3 2.7.3 2.7.1 2.7.2
Spark 2.0.2 2.0.2 2.0.1 1.6.1
Hbase 1.2.3 - (Datastore) 1.1.2 1.2.0
Hive 2.1.0 2.1.0 1.2.1 1.2.1
Presto 0.152.3 - - -
Impala 1.2.4 - - -
Apache Storm -(Kinesis) 0.10.0 -
twitter: @CodingDanny
Platform as a Service
„Wir wollen auch BigData machen!
Können wir nicht unser $90erJahreDBMS
in die Cloud packen?“
PaaS: Datenbanken nach Provider
AWS
RDS
Aurora
DynamoDB
Redshift
ElastiCache
ElasticSearch
Athena
Google
Cloud SQL
Datastore
BigTable
BigQuery
Azure
MSSQL
SQL-MPP-DW
SQL Server Stretch
DB
DocumentDB
Table Storage
Redis Cache
Bluemix
Elasticsearch
Cloudant NoSQL
DB
MongoDB
dashDB
RethinkDB
Redis
Wer braucht mehr?
[...] Datenverarbeitungs- und Arbeitsspeicherressourcen skalieren und die Leistung Ihrer Bereitstellung
anpassen, bis zu einem Maximum von 32 vCPUs und 244 GiB RAM.
Automatische Skalierung von Speicher
Amazon Aurora vergrößert Ihr Datenbank-Volume automatisch, wenn der Datenbankspeicher mehr Platz
benötigt. Ihr Volume wächst in 10 GB-Schritten bis maximal 64 TB.
Platform as a Service
„Können wir dieses Serverless bei
uns installieren?“
PaaS: Serverless mit Appengine
• Es skaliert von Geisterhand
• Budgetlimit / Tag
• Custom Domain
• HTTP
• Scheduled Tasks / Cronjobs
• Module
• Versionen
• Lokales Entwickeln
twitter: @CodingDanny
PaaS: Serverless mit Appengine
twitter: @CodingDanny
PaaS: AWS Lambda
• Diverse, generische Trigger
• DynamoDB
• S3
• SNS
• HTTP
• ....
• Java 8
• NodeJs
• C# (seit letzter Woche)
twitter: @CodingDanny
SaaS: AWS Machine Learning
twitter: @CodingDanny
SaaS: IBM Bluemix / Watson
twitter: @CodingDanny
Meine <3 zu
twitter: @CodingDanny
Das ist doch geil oder?
SMART DATA Developer
Conference
Köln 06.12.2016
Vielen Dank
Danny Linden
twitter: @CodingDanny
LinkedIn: linkedin.com/in/danny-linden
Xing: xing.com/profile/Danny_Linden
✉ danny@onpage.org

Weitere ähnliche Inhalte

Was ist angesagt?

openstack Übersicht @GPN15
openstack Übersicht @GPN15openstack Übersicht @GPN15
openstack Übersicht @GPN15m1no
 
Mit OpenStack zur eigenen Cloud
Mit OpenStack zur eigenen CloudMit OpenStack zur eigenen Cloud
Mit OpenStack zur eigenen Cloudhastexo
 
Mit OpenStack zur eigenen Cloud (OSDC 2012)
Mit OpenStack zur eigenen Cloud (OSDC 2012)Mit OpenStack zur eigenen Cloud (OSDC 2012)
Mit OpenStack zur eigenen Cloud (OSDC 2012)hastexo
 
Title is loading ... Cache is cold.
Title is loading ... Cache is cold.Title is loading ... Cache is cold.
Title is loading ... Cache is cold.QAware GmbH
 
A Hitchhiker’s Guide to the Cloud Native Stack. #ContainerConf
A Hitchhiker’s Guide to the Cloud Native Stack. #ContainerConfA Hitchhiker’s Guide to the Cloud Native Stack. #ContainerConf
A Hitchhiker’s Guide to the Cloud Native Stack. #ContainerConfMario-Leander Reimer
 
Der Cloud Native Stack in a Nutshell. #CloudExpoEurope
Der Cloud Native Stack in a Nutshell. #CloudExpoEuropeDer Cloud Native Stack in a Nutshell. #CloudExpoEurope
Der Cloud Native Stack in a Nutshell. #CloudExpoEuropeMario-Leander Reimer
 
Mit OpenStack zur eigenen Cloud (LinuxWochen Wien, 2012)
Mit OpenStack zur eigenen Cloud (LinuxWochen Wien, 2012)Mit OpenStack zur eigenen Cloud (LinuxWochen Wien, 2012)
Mit OpenStack zur eigenen Cloud (LinuxWochen Wien, 2012)hastexo
 
10 Gute Gruende - NetApp Schutz vor Ransomware
10 Gute Gruende - NetApp Schutz vor Ransomware10 Gute Gruende - NetApp Schutz vor Ransomware
10 Gute Gruende - NetApp Schutz vor RansomwareNetApp_Germany
 
10 Gute Gruende - NetApp fuer IoT
10 Gute Gruende - NetApp fuer IoT10 Gute Gruende - NetApp fuer IoT
10 Gute Gruende - NetApp fuer IoTNetApp_Germany
 
Enterprise Cloud Native ist das neue Normal
Enterprise Cloud Native ist das neue NormalEnterprise Cloud Native ist das neue Normal
Enterprise Cloud Native ist das neue NormalQAware GmbH
 
Hadoop Einführung @codecentric
Hadoop Einführung @codecentricHadoop Einführung @codecentric
Hadoop Einführung @codecentricimalik8088
 
Die Leichtigkeit des Seins: Bindings für Eclipse SmartHome entwickeln
Die Leichtigkeit des Seins: Bindings für Eclipse SmartHome entwickelnDie Leichtigkeit des Seins: Bindings für Eclipse SmartHome entwickeln
Die Leichtigkeit des Seins: Bindings für Eclipse SmartHome entwickelnQAware GmbH
 
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2MongoDB
 
LinuxTag 2008 - Virtuelle Cold-Standby Server mit Linux
LinuxTag 2008 - Virtuelle Cold-Standby Server mit LinuxLinuxTag 2008 - Virtuelle Cold-Standby Server mit Linux
LinuxTag 2008 - Virtuelle Cold-Standby Server mit LinuxSchlomo Schapiro
 
Kubernetes ist so viel mehr als ein Container Orchestrierer
Kubernetes ist so viel mehr als ein Container OrchestriererKubernetes ist so viel mehr als ein Container Orchestrierer
Kubernetes ist so viel mehr als ein Container OrchestriererQAware GmbH
 
Hadoop in modernen BI-Infrastrukturen
Hadoop in modernen BI-InfrastrukturenHadoop in modernen BI-Infrastrukturen
Hadoop in modernen BI-Infrastruktureninovex GmbH
 
Quarkus Quickstart
Quarkus QuickstartQuarkus Quickstart
Quarkus QuickstartQAware GmbH
 

Was ist angesagt? (18)

openstack Übersicht @GPN15
openstack Übersicht @GPN15openstack Übersicht @GPN15
openstack Übersicht @GPN15
 
Devops
DevopsDevops
Devops
 
Mit OpenStack zur eigenen Cloud
Mit OpenStack zur eigenen CloudMit OpenStack zur eigenen Cloud
Mit OpenStack zur eigenen Cloud
 
Mit OpenStack zur eigenen Cloud (OSDC 2012)
Mit OpenStack zur eigenen Cloud (OSDC 2012)Mit OpenStack zur eigenen Cloud (OSDC 2012)
Mit OpenStack zur eigenen Cloud (OSDC 2012)
 
Title is loading ... Cache is cold.
Title is loading ... Cache is cold.Title is loading ... Cache is cold.
Title is loading ... Cache is cold.
 
A Hitchhiker’s Guide to the Cloud Native Stack. #ContainerConf
A Hitchhiker’s Guide to the Cloud Native Stack. #ContainerConfA Hitchhiker’s Guide to the Cloud Native Stack. #ContainerConf
A Hitchhiker’s Guide to the Cloud Native Stack. #ContainerConf
 
Der Cloud Native Stack in a Nutshell. #CloudExpoEurope
Der Cloud Native Stack in a Nutshell. #CloudExpoEuropeDer Cloud Native Stack in a Nutshell. #CloudExpoEurope
Der Cloud Native Stack in a Nutshell. #CloudExpoEurope
 
Mit OpenStack zur eigenen Cloud (LinuxWochen Wien, 2012)
Mit OpenStack zur eigenen Cloud (LinuxWochen Wien, 2012)Mit OpenStack zur eigenen Cloud (LinuxWochen Wien, 2012)
Mit OpenStack zur eigenen Cloud (LinuxWochen Wien, 2012)
 
10 Gute Gruende - NetApp Schutz vor Ransomware
10 Gute Gruende - NetApp Schutz vor Ransomware10 Gute Gruende - NetApp Schutz vor Ransomware
10 Gute Gruende - NetApp Schutz vor Ransomware
 
10 Gute Gruende - NetApp fuer IoT
10 Gute Gruende - NetApp fuer IoT10 Gute Gruende - NetApp fuer IoT
10 Gute Gruende - NetApp fuer IoT
 
Enterprise Cloud Native ist das neue Normal
Enterprise Cloud Native ist das neue NormalEnterprise Cloud Native ist das neue Normal
Enterprise Cloud Native ist das neue Normal
 
Hadoop Einführung @codecentric
Hadoop Einführung @codecentricHadoop Einführung @codecentric
Hadoop Einführung @codecentric
 
Die Leichtigkeit des Seins: Bindings für Eclipse SmartHome entwickeln
Die Leichtigkeit des Seins: Bindings für Eclipse SmartHome entwickelnDie Leichtigkeit des Seins: Bindings für Eclipse SmartHome entwickeln
Die Leichtigkeit des Seins: Bindings für Eclipse SmartHome entwickeln
 
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2
 
LinuxTag 2008 - Virtuelle Cold-Standby Server mit Linux
LinuxTag 2008 - Virtuelle Cold-Standby Server mit LinuxLinuxTag 2008 - Virtuelle Cold-Standby Server mit Linux
LinuxTag 2008 - Virtuelle Cold-Standby Server mit Linux
 
Kubernetes ist so viel mehr als ein Container Orchestrierer
Kubernetes ist so viel mehr als ein Container OrchestriererKubernetes ist so viel mehr als ein Container Orchestrierer
Kubernetes ist so viel mehr als ein Container Orchestrierer
 
Hadoop in modernen BI-Infrastrukturen
Hadoop in modernen BI-InfrastrukturenHadoop in modernen BI-Infrastrukturen
Hadoop in modernen BI-Infrastrukturen
 
Quarkus Quickstart
Quarkus QuickstartQuarkus Quickstart
Quarkus Quickstart
 

Andere mochten auch

Wide-column Stores für Architekten (HBase, Cassandra)
Wide-column Stores für Architekten (HBase, Cassandra)Wide-column Stores für Architekten (HBase, Cassandra)
Wide-column Stores für Architekten (HBase, Cassandra)Andreas Buckenhofer
 
Präsentation Werdegang tassilo koller
Präsentation Werdegang tassilo kollerPräsentation Werdegang tassilo koller
Präsentation Werdegang tassilo kollertassilok
 
Ganzheitliche Speicherlösungen: Unser Storage-Konzept in der Praxis
Ganzheitliche Speicherlösungen: Unser Storage-Konzept in der PraxisGanzheitliche Speicherlösungen: Unser Storage-Konzept in der Praxis
Ganzheitliche Speicherlösungen: Unser Storage-Konzept in der PraxisFujitsu Central Europe
 
Storage as a service v4 eng
Storage as a service v4 engStorage as a service v4 eng
Storage as a service v4 engDell EMC
 
Oracle Cloud Storage Service & Oracle Database Backup Cloud Service
Oracle Cloud Storage Service & Oracle Database Backup Cloud ServiceOracle Cloud Storage Service & Oracle Database Backup Cloud Service
Oracle Cloud Storage Service & Oracle Database Backup Cloud ServiceJean-Philippe PINTE
 
Future of Data Storage in the Cloud
Future of Data Storage in the CloudFuture of Data Storage in the Cloud
Future of Data Storage in the CloudBret Piatt
 
Discover hdp 2.2: Data storage innovations in Hadoop Distributed Filesystem (...
Discover hdp 2.2: Data storage innovations in Hadoop Distributed Filesystem (...Discover hdp 2.2: Data storage innovations in Hadoop Distributed Filesystem (...
Discover hdp 2.2: Data storage innovations in Hadoop Distributed Filesystem (...Hortonworks
 
An introduction to apache drill presentation
An introduction to apache drill presentationAn introduction to apache drill presentation
An introduction to apache drill presentationMapR Technologies
 
Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?
Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?
Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?inovex GmbH
 
Choosing the Right Data Storage Solution
Choosing the Right Data Storage SolutionChoosing the Right Data Storage Solution
Choosing the Right Data Storage SolutionAmazon Web Services
 
SQL Server auf Infrastructure-as-a-Services (IaaS) in der Cloud betreiben
SQL Server auf Infrastructure-as-a-Services (IaaS) in der Cloud betreibenSQL Server auf Infrastructure-as-a-Services (IaaS) in der Cloud betreiben
SQL Server auf Infrastructure-as-a-Services (IaaS) in der Cloud betreibenJan Hentschel
 
2016 07 26 Webinar pakadoo & Microsoft (forwerts)
2016 07 26 Webinar pakadoo & Microsoft (forwerts)2016 07 26 Webinar pakadoo & Microsoft (forwerts)
2016 07 26 Webinar pakadoo & Microsoft (forwerts)pakadoo Nachname
 
Reviewing computers
Reviewing computersReviewing computers
Reviewing computerssamina khan
 
Innovationen zur Mobilisierung von Geschäftsprozessen mit BlackBerry und Lotus
Innovationen zur Mobilisierung von Geschäftsprozessen mit BlackBerry und LotusInnovationen zur Mobilisierung von Geschäftsprozessen mit BlackBerry und Lotus
Innovationen zur Mobilisierung von Geschäftsprozessen mit BlackBerry und LotusIBM Lotus
 
Embracing Failure
Embracing FailureEmbracing Failure
Embracing FailureTim Lossen
 
Cloud Computing Übersicht
Cloud Computing ÜbersichtCloud Computing Übersicht
Cloud Computing Übersichtartgrohe
 
DB Infrastructure Challenge - Team One
DB Infrastructure Challenge - Team OneDB Infrastructure Challenge - Team One
DB Infrastructure Challenge - Team OneDBHackathon
 
Cubic Foot Gardening
Cubic Foot GardeningCubic Foot Gardening
Cubic Foot GardeningTim Lossen
 

Andere mochten auch (19)

Wide-column Stores für Architekten (HBase, Cassandra)
Wide-column Stores für Architekten (HBase, Cassandra)Wide-column Stores für Architekten (HBase, Cassandra)
Wide-column Stores für Architekten (HBase, Cassandra)
 
Präsentation Werdegang tassilo koller
Präsentation Werdegang tassilo kollerPräsentation Werdegang tassilo koller
Präsentation Werdegang tassilo koller
 
Ganzheitliche Speicherlösungen: Unser Storage-Konzept in der Praxis
Ganzheitliche Speicherlösungen: Unser Storage-Konzept in der PraxisGanzheitliche Speicherlösungen: Unser Storage-Konzept in der Praxis
Ganzheitliche Speicherlösungen: Unser Storage-Konzept in der Praxis
 
Network data storage
Network data storageNetwork data storage
Network data storage
 
Storage as a service v4 eng
Storage as a service v4 engStorage as a service v4 eng
Storage as a service v4 eng
 
Oracle Cloud Storage Service & Oracle Database Backup Cloud Service
Oracle Cloud Storage Service & Oracle Database Backup Cloud ServiceOracle Cloud Storage Service & Oracle Database Backup Cloud Service
Oracle Cloud Storage Service & Oracle Database Backup Cloud Service
 
Future of Data Storage in the Cloud
Future of Data Storage in the CloudFuture of Data Storage in the Cloud
Future of Data Storage in the Cloud
 
Discover hdp 2.2: Data storage innovations in Hadoop Distributed Filesystem (...
Discover hdp 2.2: Data storage innovations in Hadoop Distributed Filesystem (...Discover hdp 2.2: Data storage innovations in Hadoop Distributed Filesystem (...
Discover hdp 2.2: Data storage innovations in Hadoop Distributed Filesystem (...
 
An introduction to apache drill presentation
An introduction to apache drill presentationAn introduction to apache drill presentation
An introduction to apache drill presentation
 
Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?
Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?
Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?
 
Choosing the Right Data Storage Solution
Choosing the Right Data Storage SolutionChoosing the Right Data Storage Solution
Choosing the Right Data Storage Solution
 
SQL Server auf Infrastructure-as-a-Services (IaaS) in der Cloud betreiben
SQL Server auf Infrastructure-as-a-Services (IaaS) in der Cloud betreibenSQL Server auf Infrastructure-as-a-Services (IaaS) in der Cloud betreiben
SQL Server auf Infrastructure-as-a-Services (IaaS) in der Cloud betreiben
 
2016 07 26 Webinar pakadoo & Microsoft (forwerts)
2016 07 26 Webinar pakadoo & Microsoft (forwerts)2016 07 26 Webinar pakadoo & Microsoft (forwerts)
2016 07 26 Webinar pakadoo & Microsoft (forwerts)
 
Reviewing computers
Reviewing computersReviewing computers
Reviewing computers
 
Innovationen zur Mobilisierung von Geschäftsprozessen mit BlackBerry und Lotus
Innovationen zur Mobilisierung von Geschäftsprozessen mit BlackBerry und LotusInnovationen zur Mobilisierung von Geschäftsprozessen mit BlackBerry und Lotus
Innovationen zur Mobilisierung von Geschäftsprozessen mit BlackBerry und Lotus
 
Embracing Failure
Embracing FailureEmbracing Failure
Embracing Failure
 
Cloud Computing Übersicht
Cloud Computing ÜbersichtCloud Computing Übersicht
Cloud Computing Übersicht
 
DB Infrastructure Challenge - Team One
DB Infrastructure Challenge - Team OneDB Infrastructure Challenge - Team One
DB Infrastructure Challenge - Team One
 
Cubic Foot Gardening
Cubic Foot GardeningCubic Foot Gardening
Cubic Foot Gardening
 

Ähnlich wie 4×4: Big Data in der Cloud

Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“
Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“
Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“OPEN KNOWLEDGE GmbH
 
Webinar Big Data - Enterprise Readiness mit Hadoop
Webinar Big Data - Enterprise Readiness mit HadoopWebinar Big Data - Enterprise Readiness mit Hadoop
Webinar Big Data - Enterprise Readiness mit Hadoopfun communications GmbH
 
Steinzeit war gestern! Wege der Cloud-nativen Evolution.
Steinzeit war gestern! Wege der Cloud-nativen Evolution.Steinzeit war gestern! Wege der Cloud-nativen Evolution.
Steinzeit war gestern! Wege der Cloud-nativen Evolution.QAware GmbH
 
Steinzeit war gestern! Wege der cloud-nativen Evolution
Steinzeit war gestern! Wege der cloud-nativen EvolutionSteinzeit war gestern! Wege der cloud-nativen Evolution
Steinzeit war gestern! Wege der cloud-nativen EvolutionQAware GmbH
 
skilllocation Foliensatz zu Microsoft Azure
skilllocation Foliensatz zu Microsoft Azureskilllocation Foliensatz zu Microsoft Azure
skilllocation Foliensatz zu Microsoft AzureCarola Pantenburg
 
Big Data Webinar (Deutsch)
Big Data Webinar (Deutsch)Big Data Webinar (Deutsch)
Big Data Webinar (Deutsch)AWS Germany
 
Where are all transactions gone? Was in_der_cloud_alles_verboten_ist
Where are all transactions gone? Was in_der_cloud_alles_verboten_istWhere are all transactions gone? Was in_der_cloud_alles_verboten_ist
Where are all transactions gone? Was in_der_cloud_alles_verboten_istRamon Anger
 
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“OPEN KNOWLEDGE GmbH
 
Steinzeit war gestern! Wege der cloud-nativen Evolution
Steinzeit war gestern! Wege der cloud-nativen EvolutionSteinzeit war gestern! Wege der cloud-nativen Evolution
Steinzeit war gestern! Wege der cloud-nativen EvolutionQAware GmbH
 
Windows Azure Platform Overview
Windows Azure Platform   OverviewWindows Azure Platform   Overview
Windows Azure Platform OverviewOliver Michalski
 
Cloud Architekturen - von "less Server" zu Serverless
Cloud Architekturen - von "less Server" zu ServerlessCloud Architekturen - von "less Server" zu Serverless
Cloud Architekturen - von "less Server" zu ServerlessOPEN KNOWLEDGE GmbH
 
A NoSQL Summer - The Year After
A NoSQL Summer - The Year AfterA NoSQL Summer - The Year After
A NoSQL Summer - The Year AfterMeMo News AG
 
Parse: Backend as a Service @ AllFacebook Developer Conference
Parse: Backend as a Service @ AllFacebook Developer ConferenceParse: Backend as a Service @ AllFacebook Developer Conference
Parse: Backend as a Service @ AllFacebook Developer ConferenceAllFacebook.de
 
Big Data Konnektivität
Big Data KonnektivitätBig Data Konnektivität
Big Data KonnektivitätTrivadis
 
OSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger Koch
OSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger KochOSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger Koch
OSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger KochNETWAYS
 
Development in der Cloud-Ära
Development in der Cloud-ÄraDevelopment in der Cloud-Ära
Development in der Cloud-ÄraAndreas Koop
 

Ähnlich wie 4×4: Big Data in der Cloud (20)

Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“
Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“
Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“
 
How to use Big Data
How to use Big DataHow to use Big Data
How to use Big Data
 
Webinar Big Data - Enterprise Readiness mit Hadoop
Webinar Big Data - Enterprise Readiness mit HadoopWebinar Big Data - Enterprise Readiness mit Hadoop
Webinar Big Data - Enterprise Readiness mit Hadoop
 
Steinzeit war gestern! Wege der Cloud-nativen Evolution.
Steinzeit war gestern! Wege der Cloud-nativen Evolution.Steinzeit war gestern! Wege der Cloud-nativen Evolution.
Steinzeit war gestern! Wege der Cloud-nativen Evolution.
 
Steinzeit war gestern! Wege der cloud-nativen Evolution
Steinzeit war gestern! Wege der cloud-nativen EvolutionSteinzeit war gestern! Wege der cloud-nativen Evolution
Steinzeit war gestern! Wege der cloud-nativen Evolution
 
Cloud Computing
Cloud ComputingCloud Computing
Cloud Computing
 
skilllocation Foliensatz zu Microsoft Azure
skilllocation Foliensatz zu Microsoft Azureskilllocation Foliensatz zu Microsoft Azure
skilllocation Foliensatz zu Microsoft Azure
 
Big Data Webinar (Deutsch)
Big Data Webinar (Deutsch)Big Data Webinar (Deutsch)
Big Data Webinar (Deutsch)
 
Where are all transactions gone? Was in_der_cloud_alles_verboten_ist
Where are all transactions gone? Was in_der_cloud_alles_verboten_istWhere are all transactions gone? Was in_der_cloud_alles_verboten_ist
Where are all transactions gone? Was in_der_cloud_alles_verboten_ist
 
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
 
Steinzeit war gestern! Wege der cloud-nativen Evolution
Steinzeit war gestern! Wege der cloud-nativen EvolutionSteinzeit war gestern! Wege der cloud-nativen Evolution
Steinzeit war gestern! Wege der cloud-nativen Evolution
 
Windows Azure Platform Overview
Windows Azure Platform   OverviewWindows Azure Platform   Overview
Windows Azure Platform Overview
 
Cloud Architekturen - von "less Server" zu Serverless
Cloud Architekturen - von "less Server" zu ServerlessCloud Architekturen - von "less Server" zu Serverless
Cloud Architekturen - von "less Server" zu Serverless
 
A NoSQL Summer - The Year After
A NoSQL Summer - The Year AfterA NoSQL Summer - The Year After
A NoSQL Summer - The Year After
 
Cloud Konzepte und Strategien
Cloud Konzepte und StrategienCloud Konzepte und Strategien
Cloud Konzepte und Strategien
 
Parse: Backend as a Service @ AllFacebook Developer Conference
Parse: Backend as a Service @ AllFacebook Developer ConferenceParse: Backend as a Service @ AllFacebook Developer Conference
Parse: Backend as a Service @ AllFacebook Developer Conference
 
Big Data Konnektivität
Big Data KonnektivitätBig Data Konnektivität
Big Data Konnektivität
 
OSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger Koch
OSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger KochOSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger Koch
OSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger Koch
 
Development in der Cloud-Ära
Development in der Cloud-ÄraDevelopment in der Cloud-Ära
Development in der Cloud-Ära
 
Development in der Cloud-Ära
Development in der Cloud-ÄraDevelopment in der Cloud-Ära
Development in der Cloud-Ära
 

4×4: Big Data in der Cloud

  • 1. SMART DATA Developer Conference Köln 06.12.2016 4x4: Big Data in der Cloud
  • 2. Danny Linden twitter: @CodingDanny LinkedIn: linkedin.com/in/danny-linden Xing: xing.com/profile/Danny_Linden ✉ danny@onpage.org Über mich 1989 – Im wunderschönen Gelsenkirchen geboren 2005 – Softwaredeveloper 2011 – Auswandern nach München 2013 – Start bei OnPage.org Interessen: Webcrawling, Suchmaschinen, skalierbare Big Data Systeme Gründer der Spark Meetup Gruppe München: • http://www.meetup.com/de-DE/spark-munich/
  • 3. > 250,000 User 40 mitarbeiter > 300,000 Projects bootstrapped SaaS Based in Munich
  • 4. „Unter Cloud Computing (deutsch Rechnerwolke[1]) versteht man die Ausführung von Programmen, die nicht auf dem lokalen Rechner installiert sind, sondern auf einem anderen Rechner, der aus der Ferne aufgerufen wird (bspw. über das Internet).“ Cloud Computing
  • 5.
  • 7.
  • 8. Maslowsche Entwickler Bedürfnispyramide SaaS (Machine Learning, ELK Stack, Textanalyse) PaaS (Hadoop, Serverless Backend, MySQL) IaaS (Computing, Storage, Network) twitter: @CodingDanny
  • 9. Infrastructure as a Service Computing: • Virtuelle Server • Pay Per Use (Stunde/Minute) • Schnelle skalierbakeit • Standorte • Nerviges Thema • Spezialisierung • CPU • RAM • Lokaler Storage (keine gute Idee) • Netzwerk twitter: @CodingDanny
  • 10. IaaS: Computing • Riesige Auswahl an Typen • Art und Größe • 14 Regionen • EU: Irland & Frankfurt • Bald: Paris & London • 54 Edge Locations • Spot • Spot Fleets • Reserved Instances • Bandbreite Typabhängig • 18 Server Typen • Custom Typen • 6 Regionen • EU: Belgien • Rabatt nach usage twitter: @CodingDanny
  • 11. Wahl der richtigen Instanz am Beispiel AWS EC2 • Wahl der richtigen Instanz-Familie • M4: Die Haus & Hof Instanz • C4: CPU Optimiert • R4 & X1: Memory Optimiert • G2 & P2: Grafiklastige Anwendungen • I2: I/O Optimiert • D2: Storage Optimiert • F1: FPGAs twitter: @CodingDanny
  • 12. On Demand vs. Spot Instanz Typ ECU Memory(GB) Preis/Stunde Preis/Stunde Spot Preis/Mon at Preis/Monat Spot m4.large 6,5 8 $0,13 $0,02 $92,88 $15,12 m4.xlarge 13 16 $0,26 $0,03 $185,04 $24,12 m4.2xlarge 26 32 $0,51 $0,17 $369,36 $120,17 m4.4xlarge 53,5 64 $1,03 $0,17 $738,72 $119,66 m4.10xlarge 124,5 160 $2,57 $0,43 $1.846,80 $308,16 m4.16xlarge 188 256 $4,10 $0,67 $2.954,88 $485,64 • Applikation muss „Fault Tolerant“ gebaut sein • Weitere Möglichkeit: Reserved Instances für 1 oder 3 Jahre (19% - 71%) twitter: @CodingDanny
  • 13. IaaS: AWS EC2 Spot (Fleets) twitter: @CodingDanny
  • 14. IaaS: Storage in der Cloud • Objekt Storage • z.b für Hadoop/Spark (HDFS Replacement) • AWS: Simple Storage Service (S3) • Google: Cloud Storage • Azure: Blob Storage • IBM: Object Storage • Block Storage • Virtuelle Festplatte für Compute Instanzen • AWS: EBS • Google: Persistant Disk • Azure: Disk Storage • IBM: Block Storage twitter: @CodingDanny
  • 15. Platform as a Service „Herr Meier, installieren sie uns doch mal dieses Hadoop“
  • 16. PaaS: Hadoop/Spark/Hive/HBase/PIG/Impala/Presto... AWS EMR Google Dataproc HDInsight(HDP 2.4.2) BigInsights Hadoop 2.7.3 2.7.3 2.7.1 2.7.2 Spark 2.0.2 2.0.2 2.0.1 1.6.1 Hbase 1.2.3 - (Datastore) 1.1.2 1.2.0 Hive 2.1.0 2.1.0 1.2.1 1.2.1 Presto 0.152.3 - - - Impala 1.2.4 - - - Apache Storm -(Kinesis) 0.10.0 - twitter: @CodingDanny
  • 17. Platform as a Service „Wir wollen auch BigData machen! Können wir nicht unser $90erJahreDBMS in die Cloud packen?“
  • 18. PaaS: Datenbanken nach Provider AWS RDS Aurora DynamoDB Redshift ElastiCache ElasticSearch Athena Google Cloud SQL Datastore BigTable BigQuery Azure MSSQL SQL-MPP-DW SQL Server Stretch DB DocumentDB Table Storage Redis Cache Bluemix Elasticsearch Cloudant NoSQL DB MongoDB dashDB RethinkDB Redis
  • 19. Wer braucht mehr? [...] Datenverarbeitungs- und Arbeitsspeicherressourcen skalieren und die Leistung Ihrer Bereitstellung anpassen, bis zu einem Maximum von 32 vCPUs und 244 GiB RAM. Automatische Skalierung von Speicher Amazon Aurora vergrößert Ihr Datenbank-Volume automatisch, wenn der Datenbankspeicher mehr Platz benötigt. Ihr Volume wächst in 10 GB-Schritten bis maximal 64 TB.
  • 20. Platform as a Service „Können wir dieses Serverless bei uns installieren?“
  • 21. PaaS: Serverless mit Appengine • Es skaliert von Geisterhand • Budgetlimit / Tag • Custom Domain • HTTP • Scheduled Tasks / Cronjobs • Module • Versionen • Lokales Entwickeln twitter: @CodingDanny
  • 22. PaaS: Serverless mit Appengine twitter: @CodingDanny
  • 23. PaaS: AWS Lambda • Diverse, generische Trigger • DynamoDB • S3 • SNS • HTTP • .... • Java 8 • NodeJs • C# (seit letzter Woche) twitter: @CodingDanny
  • 24. SaaS: AWS Machine Learning twitter: @CodingDanny
  • 25. SaaS: IBM Bluemix / Watson twitter: @CodingDanny
  • 26. Meine <3 zu twitter: @CodingDanny Das ist doch geil oder?
  • 27. SMART DATA Developer Conference Köln 06.12.2016 Vielen Dank Danny Linden twitter: @CodingDanny LinkedIn: linkedin.com/in/danny-linden Xing: xing.com/profile/Danny_Linden ✉ danny@onpage.org

Hinweis der Redaktion

  1. möglichst viel mitnehmen kann aws ec2 ecs docker wer von 4x großen eingesetzt wer entscheident
  2. Wer sich schonmal mit HTML beschäftigt hat
  3. Cloud bedeutet das wir die Programme nicht lokal installeren
  4. Die vier großen AWS in 2006 Azure Für M$ relevant IBM Für Enterprise und Watson
  5. Die vier großen AWS in 2006 Azure Für M$ relevant Digital Ocean Rightscale IBM Für Enterprise und Watson
  6. AWS, Bluemix, Azure, Google Cloud redshift
  7. marktplätze saas
  8. Stunde Minute, selten nötig (Ticketverkauf, TV Werbung) Oracle DBA will kein Elasticsearch AWS x99999
  9. SSD, HDD, EBS(i/o), learnings: Bandbreite ----- Besprechungsnotizen (05.12.16 22:37) ----- rightscale
  10. SSD, HDD, EBS(i/o), learnings: Bandbreite
  11. SSD, HDD, EBS(i/o), learnings: Bandbreite ----- Besprechungsnotizen (05.12.16 22:37) ----- os
  12. SSD, HDD, EBS(i/o), learnings: Bandbreite HÄLFTE DES VORTRAGS
  13. SSD, HDD, EBS(i/o), learnings: Bandbreite
  14. In der Regel immer Compute Instanzen + Fee für die Konfiguration s3 komp api
  15. Stunde Minute, selten nötig (Ticketverkauf, TV Werbung) mysql admin traut sich nichts anderes zu Macht sinn: Scale zu seiner zeit Beispiel: Aurora ?TB
  16. MPP-Architektur (Massively Parallel Processing) SQL Server Stretch: Cold vs Hot in Cloud shiften einen Endpoint Cloudant NoSQL DB: CouchDB Based DB dashDB: DB2 + InMemory S3 redshift Aurora TB? BigTable AWS? Athena RethinkDB für JSON
  17. Stunde Minute, selten nötig (Ticketverkauf, TV Werbung)
  18. Stunde Minute, selten nötig (Ticketverkauf, TV Werbung)
  19. Sprachen Docker
  20. Sprachen Docker
  21. Sprachen Docker
  22. Sprachen Docker
  23. Sprachen Docker
  24. Sprachen Docker
  25. möglichst viel mitnehmen kann aws ec2 ecs docker wer von 4x großen eingesetzt wer entscheident