SlideShare ist ein Scribd-Unternehmen logo
1 von 37
Amazon Redshift
Data Warehouse als Cloud Service
Steffen Krause
Technology Evangelist
@AWS_Aktuell
skrause@amazon.de
Teilen Sie mir mit:
Was gut ist, was nicht
Was Sie bei unseren Veranstaltungen sehen
wollen
Was Sie sich von AWS wünschen
skrause@amazon.de
Ihr Feedback ist wichtig
Amazon DynamoDB
Schneller, vorhersagbarer, hoch skalierparer NoSQL Data Store
Amazon RDS
Verwalteter relationaler Datenbankdienst für
MySQL, Oracle und SQL Server
Amazon ElastiCache
In-Memory Caching Service
Amazon Redshift
Schneller, mächtiger, voll verwalteter, Petabyte skalierbarer
Data Warehouse Dienst
Compute Storage
AWS Global Infrastructure
Database
Application Services
Deployment & Administration
Networking
AWS Datenbankdienste
Skalierbare, hochperformante
Datenbanken in der Cloud
Amazon DynamoDB
Schneller, vorhersagbarer, hoch skalierparer NoSQL Data Store
Amazon RDS
Verwalteter relationaler Datenbankdienst für
MySQL, Oracle und SQL Server
Amazon ElastiCache
In-Memory Caching Service
Amazon Redshift
Schneller, mächtiger, voll verwalteter, Petabyte skalierbarer
Data Warehouse Dienst
Compute Storage
AWS Global Infrastructure
Database
Application Services
Deployment & Administration
Networking
AWS Datenbankdienste
Skalierbare, hochperformante
Datenbanken in der Cloud
Data Warehousing auf die AWS Art
• Keine
Investitionskosten, Bezahlung nach
Nutzung
• Sehr hohe Performance bei sehr niedrigem
Preis
• Offen und flexibel, von populären Tools unterstützt
• Leicht zu nutzen, massiv skalierbar
Was wir gebaut haben…
Ein schnelles, mächtiges Data Warehouse, das bis in die Petabytes skaliert
Viel schneller
Viel billiger
Viel einfacher
Als verwalteter Dienst
Amazon Redshift
Dramatische I/O Reduktion
ID Alter Ort
123 20 Berlin
345 25 Leipzig
678 40 Dresden
Zeilen-Speicherung Spalten-Speicherung
Scan-
Richtung
Amazon Redshift Architektur
• Leader Node
– SQL Endpoint
– Speichert Metadaten
– Koordiniert Abfrageausführung
• Compute Nodes
– Lokale spaltenbasierte Speicherung
– Parallele Abfrageausführung
– Load, Backup, Restore via Amazon S3
– Paralleles Laden aus Amazon
DynamoDB
• Einzel-Node-Version verfügbar
10 GigE
(HPC)
Laden
Backup
Restore
JDBC/ODBC
jdbc:postgresql://mycluster.c7lp0qs37f41.us-east-1.redshift.amazonaws.com:8192/mydb
Optimierte Hardware
HS1.8XL: 128 GB RAM, 16 Cores, 24 HDDs, 16 TB nutzbarer Platz, 2 GB/sec Scanrate
HS1.XL: 16 GB RAM, 2 Cores, 3 HDDs, 2 TB nutzbarer Platz
• Optimiert für I/O intensive Workloads
• Hohe Festplattendichte
• Läuft in HPC Netzwerk - schnell
• HS1.8XL verfügbar auf Amazon EC2
Klein anfangen, groß wachsen
Extra Large Node (HS1.XL)
3 HDDs, 2 TB, 16 GB RAM, 2 Cores
Single Node (2 TB)
Cluster 2-32 Nodes (4 TB – 64 TB)
Eight Extra Large Node (HS1.8XL)
24 HDDs, 16 TB, 128 GB RAM, 16 Cores, 10 GigE
Cluster 2-100 Nodes (32 TB – 1.6 PB)
Hinweis: Knoten nicht in selber Skala
Parallelisierung
Redshift parallelisiert und verteilt
alles
• Abfrage
• Laden
• Backup
• Restore
• Größenänderung
10 GigE
(HPC)
Laden
Backup
Restore
JDBC/ODBC
Günstige Preise
Pro Stunde für HS1.XL
Single Node
Effektiver Stundenpreis
pro TB
Effektiver Jahrespreis
pro TB
On-Demand $ 0,850 $ 0,425 $ 3.723
1 Year reserviert $ 0,500 $ 0,250 $ 2.190
3 Year reserviert $ 0,228 $ 0,114 $ 999
Einfache Preise
Anzahl Nodes x Kosten pro Stunde
Keine Kosten für Leader Node
Keine Investitionskosten
Pay as you go
Demo: Cluster erstellen
Amazon Redshift verwendet SQL
• Industriestandard SQL
• ODBC und JDBC Treiber für Datenzugriff
– verwendet Postgres 8.x Treiber
– Die meisten PostgreSQL Features werden unterstützt
– Siehe Dokumentation für Unterschiede
• INSERT/UPDATE/DELETE werden unterstützt
– Aber Daten laden aus S3 oder DynamoDB mit COPY-Befehl ist
deutlich schneller
– VACUUM-Befehl nach vielen DELETE oder UPDATE-Operationen
empfohlen
• Sort Key
– Mehrere Spalten möglich
– Definiert die Reihenfolge der Daten auf Platte
– Ermöglicht das Überspringen von Blöcken bei Abfrage
• wenn Sort Key in WHERE-Klausel
– Wenn neue Daten häufig abgefragt werden: timestamp-Spalte als Sort Key
• Distribution Key
– Eine Spalte
– Definiert Verteilung der Daten im Cluster
– Sollte für gleichmäßige Verteilung der Daten sorgen
• hohe, über die Zeit gleichmäßige Kardinalität
– Sollte in Abfragen nicht als „ist gleich“ Filter vorkommen
– Join-Key für häufige Joins ist guter Kandidat
– Wird keiner angegeben werden die Daten gleichmäßig per Row ID verteilt
Tabellendesign
Daten laden aus S3 oder DynamoDB
• Direktes Laden aus S3 oder DynamoDB unterstützt:
copy customer from 's3://mybucket/customer.txt’
credentials 'aws_access_key_id=<your-access-key-id>;
aws_secret_access_key=<your-secret-access-key>’
gzip delimiter '|’;
• Paralleles Laden von Daten
– Für paralleles Laden Daten in mehrere Dateien aufteilen
– Dateinamen mit gemeinsamem Präfix:
• customer.txt.1, customer.txt.2, …
– Große Dateien mit gzip komprimieren
• Nach Möglichkeit Daten in Sortierung des Sort Key laden
Daten-Komprimierung
• Komprimierung spart Platz und Disk I/O
• COPY analysiert die Daten automatisch und
wählt geeignete Komprimierung
– Ausschnitt der Daten für Auswahl der
Komprimierung verwendet
– Unterstützt: byte dictionary, delta, mostly n, run
length, text
• Kundenerfahrungen: 4-8-fache
Komprimierung mit Echtdaten
– 20x und mehr bei geeigneten Daten möglich
• ANALYZE COMPRESSION zur Anzeige des
gewählten Algorithmus
analyze compression listing;
Table | Column | Encoding
---------+----------------+---------
-
listing | listid | delta
listing | sellerid | delta32k
listing | eventid | delta32k
listing | dateid | bytedict
listing | numtickets | bytedict
listing | priceperticket | delta32k
listing | totalprice | mostly32
listing | listtime | raw
Einfach zu benutzen
• Provisionierung in Minuten
• Abfrageperformance überwachen
• Vergrößern und Verkleinern durch
Klick
• Eingebaute Sicherheit
• Automatische Backups
Größenänderung durch Klick
Cluster bleibt online (read only)
• Neuer Zielcluster im Hintergrund erstellt
• Bezahlung nur für Quellcluster
Cluster bleibt online
• Der Cluster bleibt bei Größenänderungen
online
• Komplett automatisch
– Daten automatisch neu verteilt
• Read Only Modus während
Größenänderung
• Paralleles Kopieren der Daten (Node to
Node)
• Automatische Endpoint-Wechsel per DNS
• Nur ein Cluster wird bezahlt
Demo: Verwaltung
Eingebaute Sicherheit
• SSL Verschlüsselung für Daten auf der
Leitung
• Optional Verschlüsselung für Daten auf
Festplatte
– AES-256, Hardware-beschleunigt
– Alle Blöcke auf Platte und in Amazon S3
verschlüsselt
• Kein direkter Zugriff auf Compute
Nodes
• Amazon VPC unterstützt
10 GigE
(HPC)
Laden
Backup
Restore
Kunden-VPC
Interner
VPC
JDBC/ODBC
Datensicherung und Verfügbarkeit
• Replikation innerhalb des Clusters und Backup nach S3 stellt mehrere Kopien der Daten zu jedem
Zeitpunkt sicher
• Backups nach Amazon S3 sind kontinuierlich, automatisch und inkrementell
– Entworfen für 11 Neunen Dauerhaftigkeit
• Kontinuierliche Überwachung und automatische Wiederherstellung im Fall von Festplatten- und
Node-Fehlern
• Wiederherstellung von Snapshots in beliebige Availability Zones innerhalb einer Region
Datenquellen
Amazon
DynamoDB
Amazon Elastic
MapReduce
Amazon Simple
Storage Service (S3)
Amazon Elastic
Compute Cloud (EC2)
AWS Storage
Gateway Service
Corporate
Data Center
Amazon Relational
Database Service (RDS)
Amazon
Redshift
Mehr bald…
Integration mit verschiedenen Datenquellen
Daten laden und entladen
• Upload nach Amazon S3
• AWS Import/Export
• AWS Direct Connect
• Partner
Data Integration Systems Integrators
Mehr bald…
Analysewerkzeuge
JDBC/ODBC
Amazon Redshift
Mehr bald…
Demo: Client Tools
Kundenbeispiel
Everyone Needs
Skilled People
At Home
At Work
In Life
Repeatedly
SkillPages
Data Architecture
Data Analyst
Raw Data
Get
Data
Join via Facebook
Add a Skill Page
Invite Friends
Web Servers Amazon S3
User Action Trace Events
EMR
Hive Scripts Process Content
• Process log files with regular
expressions to parse out the info
we need.
• Processes cookies into useful
searchable data such as
Session, UserId, API Security
token.
• Filters surplus info like internal
varnish logging.
Amazon S3
Aggregated Data
Raw Events
Internal Web
Excel Tableau
Amazon Redshift
Amazon Redshift ist
• Ein voll verwalteter Data Warehouse Service
• Schnell
• Kostengünstig
• Flexibel
• Abrechnung nach Nutzung
• Kompatibel mit bestehenden ETL und BI Tools
Zusammenfassung
Ressourcen
• Steffen Krause | skrause@amazon.de | @AWS_Aktuell
• http://aws.amazon.com/de/redshift
• Getting Started Guide: http://docs.aws.amazon.com/redshift/latest/gsg/welcome.html
• Setting Up SQL Workbench/J:
http://docs.aws.amazon.com/redshift/latest/mgmt/connecting-using-workbench.html
• SQL Reference: http://docs.aws.amazon.com/redshift/latest/dg/cm_chap_SQLCommandRef.html
• Client Tools:
• https://aws.amazon.com/marketplace/redshift/
• https://www.jaspersoft.com/webinar-AWS-Agile-Reporting-and-Analytics-in-the-Cloud
• http://aws.amazon.com/de
• Getting started with Free Tier:
http://aws.amazon.com/de/free/
• 25 US$ credits für neue Kunden:
http://aws.amazon.com/de/campaigns/account/
• Twitter: @AWS_Aktuell
• Facebook:
http://www.facebook.com/awsaktuell
• Webinare: http://aws.amazon.com/de/about-aws/events/
• Slides: http://de.slideshare.net/AWSAktuell
Ressourcen
1. Was ist Amazon Web Services und wofür kann ich AWS nutzen
2. Erste Schritte mit Amazon Web Services – von der Anmeldung bis
zur ersten Instanz
3. Amazon Web Services 1*1 – welche Dienste gibt es wofür?
4. Server in der Cloud – die AWS Compute-Dienste
5. Daten speichern in der Cloud – die AWS Storage-Dienste
6. Datenbanken in der Cloud – SQL und NoSQL
7. Amazon Web Services für eCommerce
Aufzeichnungen
http://aws.amazon.com/de/recorded-webinar/
Bisherige Webinare
• Big Data
– 15.07.2013, 16 Uhr
• Wie kann man ein Unternehmens-Rechenzentrum um Cloud-Ressourcen
erweitern? Netzwerke, Sicherheit, Ressource
– 23.07.2013, 16 Uhr
• Die erste Woche mit AWS
– 07.08.2013, 16 Uhr
• 8 Tipps für eine Cloud-Strategie – wie Unternehmen heute die Cloud
einsetzen
– 14.08.2013, 16 Uhr
• Optimieren Sie Ihre AWS Nutzung um Kosten zu sparen
– 21.08.2013, 16 Uhr
• http://aws.amazon.com/de/about-aws/events/
Kommende Webinare

Weitere ähnliche Inhalte

Was ist angesagt?

QUIBIQ Webcast: SAP on Azure - Erfolgsfaktor Integration für SAP-/MS-Partner
QUIBIQ Webcast: SAP on Azure - Erfolgsfaktor Integration für SAP-/MS-PartnerQUIBIQ Webcast: SAP on Azure - Erfolgsfaktor Integration für SAP-/MS-Partner
QUIBIQ Webcast: SAP on Azure - Erfolgsfaktor Integration für SAP-/MS-PartnerQUIBIQ Hamburg
 
Data Warehouse (DWH) with MySQL
Data Warehouse (DWH) with MySQLData Warehouse (DWH) with MySQL
Data Warehouse (DWH) with MySQLFromDual GmbH
 
20181210_ITTage2018_OracleNoSQLDB_KPatenge
20181210_ITTage2018_OracleNoSQLDB_KPatenge20181210_ITTage2018_OracleNoSQLDB_KPatenge
20181210_ITTage2018_OracleNoSQLDB_KPatengeKarin Patenge
 
Data Virtualization - Supernova
Data Virtualization - SupernovaData Virtualization - Supernova
Data Virtualization - SupernovaTorsten Glunde
 
Überblick zu Oracle Database 12c Release 2
Überblick zu Oracle Database 12c Release 2Überblick zu Oracle Database 12c Release 2
Überblick zu Oracle Database 12c Release 2Ulrike Schwinn
 
BPMN, BPEL oder vielleicht doch Java? Oder auch noch ESB?
BPMN, BPEL oder vielleicht doch Java? Oder auch noch ESB?BPMN, BPEL oder vielleicht doch Java? Oder auch noch ESB?
BPMN, BPEL oder vielleicht doch Java? Oder auch noch ESB?Guido Schmutz
 
Oracle Data Warehouse Integration Builder - Ein Selbstversuch (DOAG 2013)
Oracle Data Warehouse Integration Builder - Ein Selbstversuch (DOAG 2013)Oracle Data Warehouse Integration Builder - Ein Selbstversuch (DOAG 2013)
Oracle Data Warehouse Integration Builder - Ein Selbstversuch (DOAG 2013)Trivadis
 
Clickstream Analysis with Spark
Clickstream Analysis with Spark Clickstream Analysis with Spark
Clickstream Analysis with Spark Josef Adersberger
 
Eval Apache Storm vs. Spark Streaming - German
Eval Apache Storm vs. Spark Streaming - GermanEval Apache Storm vs. Spark Streaming - German
Eval Apache Storm vs. Spark Streaming - GermanErik Schmiegelow
 
SCAPE Skalierbare Langzeitarchivierung
SCAPE Skalierbare LangzeitarchivierungSCAPE Skalierbare Langzeitarchivierung
SCAPE Skalierbare LangzeitarchivierungSven Schlarb
 
Freie Fahrt für die Reisendeninformation mit Kafka Streams
Freie Fahrt für die Reisendeninformation mit Kafka StreamsFreie Fahrt für die Reisendeninformation mit Kafka Streams
Freie Fahrt für die Reisendeninformation mit Kafka Streamsconfluent
 
Trivadis Office365-Azure Case OdA
Trivadis Office365-Azure Case OdATrivadis Office365-Azure Case OdA
Trivadis Office365-Azure Case OdATrivadis
 
Data lake vs Data Warehouse: Hybrid Architectures
Data lake vs Data Warehouse: Hybrid ArchitecturesData lake vs Data Warehouse: Hybrid Architectures
Data lake vs Data Warehouse: Hybrid ArchitecturesComsysto Reply GmbH
 
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 1
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 1MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 1
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 1MongoDB
 
Oracle Database Backup Service
Oracle Database Backup ServiceOracle Database Backup Service
Oracle Database Backup ServiceTrivadis
 
Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...
Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...
Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...Spark Summit
 

Was ist angesagt? (19)

Big Data mit Apache Hadoop
Big Data mit Apache HadoopBig Data mit Apache Hadoop
Big Data mit Apache Hadoop
 
QUIBIQ Webcast: SAP on Azure - Erfolgsfaktor Integration für SAP-/MS-Partner
QUIBIQ Webcast: SAP on Azure - Erfolgsfaktor Integration für SAP-/MS-PartnerQUIBIQ Webcast: SAP on Azure - Erfolgsfaktor Integration für SAP-/MS-Partner
QUIBIQ Webcast: SAP on Azure - Erfolgsfaktor Integration für SAP-/MS-Partner
 
Data Warehouse (DWH) with MySQL
Data Warehouse (DWH) with MySQLData Warehouse (DWH) with MySQL
Data Warehouse (DWH) with MySQL
 
20181210_ITTage2018_OracleNoSQLDB_KPatenge
20181210_ITTage2018_OracleNoSQLDB_KPatenge20181210_ITTage2018_OracleNoSQLDB_KPatenge
20181210_ITTage2018_OracleNoSQLDB_KPatenge
 
Portfolio 2016
Portfolio 2016Portfolio 2016
Portfolio 2016
 
Data Virtualization - Supernova
Data Virtualization - SupernovaData Virtualization - Supernova
Data Virtualization - Supernova
 
Überblick zu Oracle Database 12c Release 2
Überblick zu Oracle Database 12c Release 2Überblick zu Oracle Database 12c Release 2
Überblick zu Oracle Database 12c Release 2
 
BPMN, BPEL oder vielleicht doch Java? Oder auch noch ESB?
BPMN, BPEL oder vielleicht doch Java? Oder auch noch ESB?BPMN, BPEL oder vielleicht doch Java? Oder auch noch ESB?
BPMN, BPEL oder vielleicht doch Java? Oder auch noch ESB?
 
Oracle Data Warehouse Integration Builder - Ein Selbstversuch (DOAG 2013)
Oracle Data Warehouse Integration Builder - Ein Selbstversuch (DOAG 2013)Oracle Data Warehouse Integration Builder - Ein Selbstversuch (DOAG 2013)
Oracle Data Warehouse Integration Builder - Ein Selbstversuch (DOAG 2013)
 
Clickstream Analysis with Spark
Clickstream Analysis with Spark Clickstream Analysis with Spark
Clickstream Analysis with Spark
 
The cloud 2011
The cloud 2011The cloud 2011
The cloud 2011
 
Eval Apache Storm vs. Spark Streaming - German
Eval Apache Storm vs. Spark Streaming - GermanEval Apache Storm vs. Spark Streaming - German
Eval Apache Storm vs. Spark Streaming - German
 
SCAPE Skalierbare Langzeitarchivierung
SCAPE Skalierbare LangzeitarchivierungSCAPE Skalierbare Langzeitarchivierung
SCAPE Skalierbare Langzeitarchivierung
 
Freie Fahrt für die Reisendeninformation mit Kafka Streams
Freie Fahrt für die Reisendeninformation mit Kafka StreamsFreie Fahrt für die Reisendeninformation mit Kafka Streams
Freie Fahrt für die Reisendeninformation mit Kafka Streams
 
Trivadis Office365-Azure Case OdA
Trivadis Office365-Azure Case OdATrivadis Office365-Azure Case OdA
Trivadis Office365-Azure Case OdA
 
Data lake vs Data Warehouse: Hybrid Architectures
Data lake vs Data Warehouse: Hybrid ArchitecturesData lake vs Data Warehouse: Hybrid Architectures
Data lake vs Data Warehouse: Hybrid Architectures
 
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 1
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 1MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 1
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 1
 
Oracle Database Backup Service
Oracle Database Backup ServiceOracle Database Backup Service
Oracle Database Backup Service
 
Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...
Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...
Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...
 

Andere mochten auch

First for Cloud AWS partner webinar 1july2016
First for Cloud AWS partner webinar 1july2016First for Cloud AWS partner webinar 1july2016
First for Cloud AWS partner webinar 1july2016Russell Warne
 
Einführung in Amazon Machine Learning - AWS Machine Learning Web Day
Einführung in Amazon Machine Learning  - AWS Machine Learning Web DayEinführung in Amazon Machine Learning  - AWS Machine Learning Web Day
Einführung in Amazon Machine Learning - AWS Machine Learning Web DayAWS Germany
 
AWS Summit 2011 : How to become an AWS Solution Provider
AWS Summit 2011 : How to become an AWS Solution ProviderAWS Summit 2011 : How to become an AWS Solution Provider
AWS Summit 2011 : How to become an AWS Solution ProviderAmazon Web Services
 
Overview of AWS Partner Programs in the Public Sector
Overview of AWS Partner Programs in the Public SectorOverview of AWS Partner Programs in the Public Sector
Overview of AWS Partner Programs in the Public Sector Amazon Web Services
 
Trends und Anwendungsbeispiele im Life Science Bereich
Trends und Anwendungsbeispiele im Life Science BereichTrends und Anwendungsbeispiele im Life Science Bereich
Trends und Anwendungsbeispiele im Life Science BereichAWS Germany
 
AWS CWI Training Program
AWS CWI Training ProgramAWS CWI Training Program
AWS CWI Training ProgramPuneet Sharma
 
AWS Partner Techshift - Developing a Global Sales Channel with AWS Marketplac...
AWS Partner Techshift - Developing a Global Sales Channel with AWS Marketplac...AWS Partner Techshift - Developing a Global Sales Channel with AWS Marketplac...
AWS Partner Techshift - Developing a Global Sales Channel with AWS Marketplac...Amazon Web Services Korea
 
Overview of APN Program | AWS Public Sector Summit 2016
Overview of APN Program | AWS Public Sector Summit 2016Overview of APN Program | AWS Public Sector Summit 2016
Overview of APN Program | AWS Public Sector Summit 2016Amazon Web Services
 
AWS re:Invent 2016: Technical Tips for Helping SAP Customers Succeed on AWS (...
AWS re:Invent 2016: Technical Tips for Helping SAP Customers Succeed on AWS (...AWS re:Invent 2016: Technical Tips for Helping SAP Customers Succeed on AWS (...
AWS re:Invent 2016: Technical Tips for Helping SAP Customers Succeed on AWS (...Amazon Web Services
 
Building Your Data Warehouse with Amazon Redshift
Building Your Data Warehouse with Amazon RedshiftBuilding Your Data Warehouse with Amazon Redshift
Building Your Data Warehouse with Amazon RedshiftAmazon Web Services
 
ISARCAMP: ekaabo / Marco Ripanti - die kraft des social sharing und die macht...
ISARCAMP: ekaabo / Marco Ripanti - die kraft des social sharing und die macht...ISARCAMP: ekaabo / Marco Ripanti - die kraft des social sharing und die macht...
ISARCAMP: ekaabo / Marco Ripanti - die kraft des social sharing und die macht...ISARNETZ
 
Briefing Studieninfotag April 2013
Briefing Studieninfotag April 2013Briefing Studieninfotag April 2013
Briefing Studieninfotag April 2013mephisto_PR
 
10 DICAS - SAIBA COMO DEMITIR BEM
10 DICAS - SAIBA COMO DEMITIR BEM10 DICAS - SAIBA COMO DEMITIR BEM
10 DICAS - SAIBA COMO DEMITIR BEMSheila Papautsky
 
Administración de los recursos humanos 2
Administración de los recursos humanos 2Administración de los recursos humanos 2
Administración de los recursos humanos 2Andrea Osorno
 

Andere mochten auch (20)

Seccionaurea 1222274954186376-8
Seccionaurea 1222274954186376-8Seccionaurea 1222274954186376-8
Seccionaurea 1222274954186376-8
 
First for Cloud AWS partner webinar 1july2016
First for Cloud AWS partner webinar 1july2016First for Cloud AWS partner webinar 1july2016
First for Cloud AWS partner webinar 1july2016
 
Einführung in Amazon Machine Learning - AWS Machine Learning Web Day
Einführung in Amazon Machine Learning  - AWS Machine Learning Web DayEinführung in Amazon Machine Learning  - AWS Machine Learning Web Day
Einführung in Amazon Machine Learning - AWS Machine Learning Web Day
 
AWS Summit 2011 : How to become an AWS Solution Provider
AWS Summit 2011 : How to become an AWS Solution ProviderAWS Summit 2011 : How to become an AWS Solution Provider
AWS Summit 2011 : How to become an AWS Solution Provider
 
Overview of AWS Partner Programs in the Public Sector
Overview of AWS Partner Programs in the Public SectorOverview of AWS Partner Programs in the Public Sector
Overview of AWS Partner Programs in the Public Sector
 
Trends und Anwendungsbeispiele im Life Science Bereich
Trends und Anwendungsbeispiele im Life Science BereichTrends und Anwendungsbeispiele im Life Science Bereich
Trends und Anwendungsbeispiele im Life Science Bereich
 
AWS CWI Training Program
AWS CWI Training ProgramAWS CWI Training Program
AWS CWI Training Program
 
AWS Partner Techshift - Developing a Global Sales Channel with AWS Marketplac...
AWS Partner Techshift - Developing a Global Sales Channel with AWS Marketplac...AWS Partner Techshift - Developing a Global Sales Channel with AWS Marketplac...
AWS Partner Techshift - Developing a Global Sales Channel with AWS Marketplac...
 
Overview of APN Program | AWS Public Sector Summit 2016
Overview of APN Program | AWS Public Sector Summit 2016Overview of APN Program | AWS Public Sector Summit 2016
Overview of APN Program | AWS Public Sector Summit 2016
 
AWS re:Invent 2016: Technical Tips for Helping SAP Customers Succeed on AWS (...
AWS re:Invent 2016: Technical Tips for Helping SAP Customers Succeed on AWS (...AWS re:Invent 2016: Technical Tips for Helping SAP Customers Succeed on AWS (...
AWS re:Invent 2016: Technical Tips for Helping SAP Customers Succeed on AWS (...
 
Building Your Data Warehouse with Amazon Redshift
Building Your Data Warehouse with Amazon RedshiftBuilding Your Data Warehouse with Amazon Redshift
Building Your Data Warehouse with Amazon Redshift
 
impuestos
 impuestos  impuestos
impuestos
 
ISARCAMP: ekaabo / Marco Ripanti - die kraft des social sharing und die macht...
ISARCAMP: ekaabo / Marco Ripanti - die kraft des social sharing und die macht...ISARCAMP: ekaabo / Marco Ripanti - die kraft des social sharing und die macht...
ISARCAMP: ekaabo / Marco Ripanti - die kraft des social sharing und die macht...
 
Briefing Studieninfotag April 2013
Briefing Studieninfotag April 2013Briefing Studieninfotag April 2013
Briefing Studieninfotag April 2013
 
10 DICAS - SAIBA COMO DEMITIR BEM
10 DICAS - SAIBA COMO DEMITIR BEM10 DICAS - SAIBA COMO DEMITIR BEM
10 DICAS - SAIBA COMO DEMITIR BEM
 
Curtain-Wall Staubschutz Brochure 2012
Curtain-Wall Staubschutz Brochure 2012Curtain-Wall Staubschutz Brochure 2012
Curtain-Wall Staubschutz Brochure 2012
 
Aeren elmundoanteelcenit
Aeren elmundoanteelcenitAeren elmundoanteelcenit
Aeren elmundoanteelcenit
 
Hoy y no_maana
Hoy y no_maanaHoy y no_maana
Hoy y no_maana
 
Administración de los recursos humanos 2
Administración de los recursos humanos 2Administración de los recursos humanos 2
Administración de los recursos humanos 2
 
PVO México
PVO MéxicoPVO México
PVO México
 

Ähnlich wie Amazon Redshift

OOP 2014 SQL oder NoSQL - die Auswahl der richtigen Datenbankplattform für di...
OOP 2014 SQL oder NoSQL - die Auswahl der richtigen Datenbankplattform für di...OOP 2014 SQL oder NoSQL - die Auswahl der richtigen Datenbankplattform für di...
OOP 2014 SQL oder NoSQL - die Auswahl der richtigen Datenbankplattform für di...AWS Germany
 
Einführung in AWS - Übersicht über die wichtigsten Services
Einführung in AWS - Übersicht über die wichtigsten Services Einführung in AWS - Übersicht über die wichtigsten Services
Einführung in AWS - Übersicht über die wichtigsten Services AWS Germany
 
SQL oder NoSQL - Die Auswahl der richtigen Datenbankplattform für die Cloud
SQL oder NoSQL - Die Auswahl der richtigen Datenbankplattform für die CloudSQL oder NoSQL - Die Auswahl der richtigen Datenbankplattform für die Cloud
SQL oder NoSQL - Die Auswahl der richtigen Datenbankplattform für die CloudAWS Germany
 
Webinar Neues von der re:invent 2013 Teil 1: PostgreSQL RDS, CloudTrail, neue...
Webinar Neues von der re:invent 2013 Teil 1: PostgreSQL RDS, CloudTrail, neue...Webinar Neues von der re:invent 2013 Teil 1: PostgreSQL RDS, CloudTrail, neue...
Webinar Neues von der re:invent 2013 Teil 1: PostgreSQL RDS, CloudTrail, neue...AWS Germany
 
SimpleDB - Chancen einer Cloud Datenbank
SimpleDB - Chancen einer Cloud DatenbankSimpleDB - Chancen einer Cloud Datenbank
SimpleDB - Chancen einer Cloud DatenbankONE Schweiz
 
Meet Magento - High performance magento
Meet Magento - High performance magentoMeet Magento - High performance magento
Meet Magento - High performance magentoAOE
 
Webinar Neues von der re:invent 2013 Teil 2: Kinesis, AppStream, WorkSpaces
Webinar Neues von der re:invent 2013 Teil 2: Kinesis, AppStream, WorkSpacesWebinar Neues von der re:invent 2013 Teil 2: Kinesis, AppStream, WorkSpaces
Webinar Neues von der re:invent 2013 Teil 2: Kinesis, AppStream, WorkSpacesAWS Germany
 
Do´s and Dont´s mit Oracle RDS
Do´s and Dont´s mit Oracle RDS Do´s and Dont´s mit Oracle RDS
Do´s and Dont´s mit Oracle RDS esentri AG
 
papaya AWS Präsentation CeBIT 2010
papaya AWS Präsentation CeBIT 2010papaya AWS Präsentation CeBIT 2010
papaya AWS Präsentation CeBIT 2010papaya
 
Blueprints bei E-Commerce Workloads mit AWS
Blueprints bei E-Commerce Workloads mit AWSBlueprints bei E-Commerce Workloads mit AWS
Blueprints bei E-Commerce Workloads mit AWSroot360 GmbH
 
Big Data Webinar (Deutsch)
Big Data Webinar (Deutsch)Big Data Webinar (Deutsch)
Big Data Webinar (Deutsch)AWS Germany
 
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2MongoDB
 
Erweitern sie ihr Data Center mit Cloud Services
Erweitern sie ihr Data Center mit Cloud ServicesErweitern sie ihr Data Center mit Cloud Services
Erweitern sie ihr Data Center mit Cloud ServicesAWS Germany
 
Drupal 7 auf Amazon Web Services
Drupal 7 auf Amazon Web ServicesDrupal 7 auf Amazon Web Services
Drupal 7 auf Amazon Web ServicesSven Paulus
 
High Performance Multi-Server Magento in der Cloud
High Performance Multi-Server Magento in der CloudHigh Performance Multi-Server Magento in der Cloud
High Performance Multi-Server Magento in der CloudAOE
 
Azure SQL Database vs. Azure SQL Data Warehouse
Azure SQL Database vs. Azure SQL Data WarehouseAzure SQL Database vs. Azure SQL Data Warehouse
Azure SQL Database vs. Azure SQL Data WarehousepmOne Analytics GmbH
 
Blueprints bei E-Commerce Workloads mit AWS
Blueprints bei E-Commerce Workloads mit AWS Blueprints bei E-Commerce Workloads mit AWS
Blueprints bei E-Commerce Workloads mit AWS AWS Germany
 
Skalierung & Performance
Skalierung & PerformanceSkalierung & Performance
Skalierung & Performanceglembotzky
 
Best Practices SharePoint and SQL Installation
Best Practices SharePoint and SQL InstallationBest Practices SharePoint and SQL Installation
Best Practices SharePoint and SQL InstallationSamuel Zürcher
 
Data Is The New Oil
Data Is The New OilData Is The New Oil
Data Is The New OilParStream
 

Ähnlich wie Amazon Redshift (20)

OOP 2014 SQL oder NoSQL - die Auswahl der richtigen Datenbankplattform für di...
OOP 2014 SQL oder NoSQL - die Auswahl der richtigen Datenbankplattform für di...OOP 2014 SQL oder NoSQL - die Auswahl der richtigen Datenbankplattform für di...
OOP 2014 SQL oder NoSQL - die Auswahl der richtigen Datenbankplattform für di...
 
Einführung in AWS - Übersicht über die wichtigsten Services
Einführung in AWS - Übersicht über die wichtigsten Services Einführung in AWS - Übersicht über die wichtigsten Services
Einführung in AWS - Übersicht über die wichtigsten Services
 
SQL oder NoSQL - Die Auswahl der richtigen Datenbankplattform für die Cloud
SQL oder NoSQL - Die Auswahl der richtigen Datenbankplattform für die CloudSQL oder NoSQL - Die Auswahl der richtigen Datenbankplattform für die Cloud
SQL oder NoSQL - Die Auswahl der richtigen Datenbankplattform für die Cloud
 
Webinar Neues von der re:invent 2013 Teil 1: PostgreSQL RDS, CloudTrail, neue...
Webinar Neues von der re:invent 2013 Teil 1: PostgreSQL RDS, CloudTrail, neue...Webinar Neues von der re:invent 2013 Teil 1: PostgreSQL RDS, CloudTrail, neue...
Webinar Neues von der re:invent 2013 Teil 1: PostgreSQL RDS, CloudTrail, neue...
 
SimpleDB - Chancen einer Cloud Datenbank
SimpleDB - Chancen einer Cloud DatenbankSimpleDB - Chancen einer Cloud Datenbank
SimpleDB - Chancen einer Cloud Datenbank
 
Meet Magento - High performance magento
Meet Magento - High performance magentoMeet Magento - High performance magento
Meet Magento - High performance magento
 
Webinar Neues von der re:invent 2013 Teil 2: Kinesis, AppStream, WorkSpaces
Webinar Neues von der re:invent 2013 Teil 2: Kinesis, AppStream, WorkSpacesWebinar Neues von der re:invent 2013 Teil 2: Kinesis, AppStream, WorkSpaces
Webinar Neues von der re:invent 2013 Teil 2: Kinesis, AppStream, WorkSpaces
 
Do´s and Dont´s mit Oracle RDS
Do´s and Dont´s mit Oracle RDS Do´s and Dont´s mit Oracle RDS
Do´s and Dont´s mit Oracle RDS
 
papaya AWS Präsentation CeBIT 2010
papaya AWS Präsentation CeBIT 2010papaya AWS Präsentation CeBIT 2010
papaya AWS Präsentation CeBIT 2010
 
Blueprints bei E-Commerce Workloads mit AWS
Blueprints bei E-Commerce Workloads mit AWSBlueprints bei E-Commerce Workloads mit AWS
Blueprints bei E-Commerce Workloads mit AWS
 
Big Data Webinar (Deutsch)
Big Data Webinar (Deutsch)Big Data Webinar (Deutsch)
Big Data Webinar (Deutsch)
 
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2
MongoDB Atlas – der beste Weg, MongoDB in der Cloud zu betreiben 2
 
Erweitern sie ihr Data Center mit Cloud Services
Erweitern sie ihr Data Center mit Cloud ServicesErweitern sie ihr Data Center mit Cloud Services
Erweitern sie ihr Data Center mit Cloud Services
 
Drupal 7 auf Amazon Web Services
Drupal 7 auf Amazon Web ServicesDrupal 7 auf Amazon Web Services
Drupal 7 auf Amazon Web Services
 
High Performance Multi-Server Magento in der Cloud
High Performance Multi-Server Magento in der CloudHigh Performance Multi-Server Magento in der Cloud
High Performance Multi-Server Magento in der Cloud
 
Azure SQL Database vs. Azure SQL Data Warehouse
Azure SQL Database vs. Azure SQL Data WarehouseAzure SQL Database vs. Azure SQL Data Warehouse
Azure SQL Database vs. Azure SQL Data Warehouse
 
Blueprints bei E-Commerce Workloads mit AWS
Blueprints bei E-Commerce Workloads mit AWS Blueprints bei E-Commerce Workloads mit AWS
Blueprints bei E-Commerce Workloads mit AWS
 
Skalierung & Performance
Skalierung & PerformanceSkalierung & Performance
Skalierung & Performance
 
Best Practices SharePoint and SQL Installation
Best Practices SharePoint and SQL InstallationBest Practices SharePoint and SQL Installation
Best Practices SharePoint and SQL Installation
 
Data Is The New Oil
Data Is The New OilData Is The New Oil
Data Is The New Oil
 

Mehr von AWS Germany

Analytics Web Day | From Theory to Practice: Big Data Stories from the Field
Analytics Web Day | From Theory to Practice: Big Data Stories from the FieldAnalytics Web Day | From Theory to Practice: Big Data Stories from the Field
Analytics Web Day | From Theory to Practice: Big Data Stories from the FieldAWS Germany
 
Analytics Web Day | Query your Data in S3 with SQL and optimize for Cost and ...
Analytics Web Day | Query your Data in S3 with SQL and optimize for Cost and ...Analytics Web Day | Query your Data in S3 with SQL and optimize for Cost and ...
Analytics Web Day | Query your Data in S3 with SQL and optimize for Cost and ...AWS Germany
 
Modern Applications Web Day | Impress Your Friends with Your First Serverless...
Modern Applications Web Day | Impress Your Friends with Your First Serverless...Modern Applications Web Day | Impress Your Friends with Your First Serverless...
Modern Applications Web Day | Impress Your Friends with Your First Serverless...AWS Germany
 
Modern Applications Web Day | Manage Your Infrastructure and Configuration on...
Modern Applications Web Day | Manage Your Infrastructure and Configuration on...Modern Applications Web Day | Manage Your Infrastructure and Configuration on...
Modern Applications Web Day | Manage Your Infrastructure and Configuration on...AWS Germany
 
Modern Applications Web Day | Container Workloads on AWS
Modern Applications Web Day | Container Workloads on AWSModern Applications Web Day | Container Workloads on AWS
Modern Applications Web Day | Container Workloads on AWSAWS Germany
 
Modern Applications Web Day | Continuous Delivery to Amazon EKS with Spinnaker
Modern Applications Web Day | Continuous Delivery to Amazon EKS with SpinnakerModern Applications Web Day | Continuous Delivery to Amazon EKS with Spinnaker
Modern Applications Web Day | Continuous Delivery to Amazon EKS with SpinnakerAWS Germany
 
Building Smart Home skills for Alexa
Building Smart Home skills for AlexaBuilding Smart Home skills for Alexa
Building Smart Home skills for AlexaAWS Germany
 
Hotel or Taxi? "Sorting hat" for travel expenses with AWS ML infrastructure
Hotel or Taxi? "Sorting hat" for travel expenses with AWS ML infrastructureHotel or Taxi? "Sorting hat" for travel expenses with AWS ML infrastructure
Hotel or Taxi? "Sorting hat" for travel expenses with AWS ML infrastructureAWS Germany
 
Wild Rydes with Big Data/Kinesis focus: AWS Serverless Workshop
Wild Rydes with Big Data/Kinesis focus: AWS Serverless WorkshopWild Rydes with Big Data/Kinesis focus: AWS Serverless Workshop
Wild Rydes with Big Data/Kinesis focus: AWS Serverless WorkshopAWS Germany
 
Log Analytics with AWS
Log Analytics with AWSLog Analytics with AWS
Log Analytics with AWSAWS Germany
 
Deep Dive into Concepts and Tools for Analyzing Streaming Data on AWS
Deep Dive into Concepts and Tools for Analyzing Streaming Data on AWS Deep Dive into Concepts and Tools for Analyzing Streaming Data on AWS
Deep Dive into Concepts and Tools for Analyzing Streaming Data on AWS AWS Germany
 
AWS Programme für Nonprofits
AWS Programme für NonprofitsAWS Programme für Nonprofits
AWS Programme für NonprofitsAWS Germany
 
Microservices and Data Design
Microservices and Data DesignMicroservices and Data Design
Microservices and Data DesignAWS Germany
 
Serverless vs. Developers – the real crash
Serverless vs. Developers – the real crashServerless vs. Developers – the real crash
Serverless vs. Developers – the real crashAWS Germany
 
Query your data in S3 with SQL and optimize for cost and performance
Query your data in S3 with SQL and optimize for cost and performanceQuery your data in S3 with SQL and optimize for cost and performance
Query your data in S3 with SQL and optimize for cost and performanceAWS Germany
 
Secret Management with Hashicorp’s Vault
Secret Management with Hashicorp’s VaultSecret Management with Hashicorp’s Vault
Secret Management with Hashicorp’s VaultAWS Germany
 
Scale to Infinity with ECS
Scale to Infinity with ECSScale to Infinity with ECS
Scale to Infinity with ECSAWS Germany
 
Containers on AWS - State of the Union
Containers on AWS - State of the UnionContainers on AWS - State of the Union
Containers on AWS - State of the UnionAWS Germany
 
Deploying and Scaling Your First Cloud Application with Amazon Lightsail
Deploying and Scaling Your First Cloud Application with Amazon LightsailDeploying and Scaling Your First Cloud Application with Amazon Lightsail
Deploying and Scaling Your First Cloud Application with Amazon LightsailAWS Germany
 

Mehr von AWS Germany (20)

Analytics Web Day | From Theory to Practice: Big Data Stories from the Field
Analytics Web Day | From Theory to Practice: Big Data Stories from the FieldAnalytics Web Day | From Theory to Practice: Big Data Stories from the Field
Analytics Web Day | From Theory to Practice: Big Data Stories from the Field
 
Analytics Web Day | Query your Data in S3 with SQL and optimize for Cost and ...
Analytics Web Day | Query your Data in S3 with SQL and optimize for Cost and ...Analytics Web Day | Query your Data in S3 with SQL and optimize for Cost and ...
Analytics Web Day | Query your Data in S3 with SQL and optimize for Cost and ...
 
Modern Applications Web Day | Impress Your Friends with Your First Serverless...
Modern Applications Web Day | Impress Your Friends with Your First Serverless...Modern Applications Web Day | Impress Your Friends with Your First Serverless...
Modern Applications Web Day | Impress Your Friends with Your First Serverless...
 
Modern Applications Web Day | Manage Your Infrastructure and Configuration on...
Modern Applications Web Day | Manage Your Infrastructure and Configuration on...Modern Applications Web Day | Manage Your Infrastructure and Configuration on...
Modern Applications Web Day | Manage Your Infrastructure and Configuration on...
 
Modern Applications Web Day | Container Workloads on AWS
Modern Applications Web Day | Container Workloads on AWSModern Applications Web Day | Container Workloads on AWS
Modern Applications Web Day | Container Workloads on AWS
 
Modern Applications Web Day | Continuous Delivery to Amazon EKS with Spinnaker
Modern Applications Web Day | Continuous Delivery to Amazon EKS with SpinnakerModern Applications Web Day | Continuous Delivery to Amazon EKS with Spinnaker
Modern Applications Web Day | Continuous Delivery to Amazon EKS with Spinnaker
 
Building Smart Home skills for Alexa
Building Smart Home skills for AlexaBuilding Smart Home skills for Alexa
Building Smart Home skills for Alexa
 
Hotel or Taxi? "Sorting hat" for travel expenses with AWS ML infrastructure
Hotel or Taxi? "Sorting hat" for travel expenses with AWS ML infrastructureHotel or Taxi? "Sorting hat" for travel expenses with AWS ML infrastructure
Hotel or Taxi? "Sorting hat" for travel expenses with AWS ML infrastructure
 
Wild Rydes with Big Data/Kinesis focus: AWS Serverless Workshop
Wild Rydes with Big Data/Kinesis focus: AWS Serverless WorkshopWild Rydes with Big Data/Kinesis focus: AWS Serverless Workshop
Wild Rydes with Big Data/Kinesis focus: AWS Serverless Workshop
 
Log Analytics with AWS
Log Analytics with AWSLog Analytics with AWS
Log Analytics with AWS
 
Deep Dive into Concepts and Tools for Analyzing Streaming Data on AWS
Deep Dive into Concepts and Tools for Analyzing Streaming Data on AWS Deep Dive into Concepts and Tools for Analyzing Streaming Data on AWS
Deep Dive into Concepts and Tools for Analyzing Streaming Data on AWS
 
AWS Programme für Nonprofits
AWS Programme für NonprofitsAWS Programme für Nonprofits
AWS Programme für Nonprofits
 
Microservices and Data Design
Microservices and Data DesignMicroservices and Data Design
Microservices and Data Design
 
Serverless vs. Developers – the real crash
Serverless vs. Developers – the real crashServerless vs. Developers – the real crash
Serverless vs. Developers – the real crash
 
Query your data in S3 with SQL and optimize for cost and performance
Query your data in S3 with SQL and optimize for cost and performanceQuery your data in S3 with SQL and optimize for cost and performance
Query your data in S3 with SQL and optimize for cost and performance
 
Secret Management with Hashicorp’s Vault
Secret Management with Hashicorp’s VaultSecret Management with Hashicorp’s Vault
Secret Management with Hashicorp’s Vault
 
EKS Workshop
 EKS Workshop EKS Workshop
EKS Workshop
 
Scale to Infinity with ECS
Scale to Infinity with ECSScale to Infinity with ECS
Scale to Infinity with ECS
 
Containers on AWS - State of the Union
Containers on AWS - State of the UnionContainers on AWS - State of the Union
Containers on AWS - State of the Union
 
Deploying and Scaling Your First Cloud Application with Amazon Lightsail
Deploying and Scaling Your First Cloud Application with Amazon LightsailDeploying and Scaling Your First Cloud Application with Amazon Lightsail
Deploying and Scaling Your First Cloud Application with Amazon Lightsail
 

Amazon Redshift

  • 1. Amazon Redshift Data Warehouse als Cloud Service Steffen Krause Technology Evangelist @AWS_Aktuell skrause@amazon.de
  • 2. Teilen Sie mir mit: Was gut ist, was nicht Was Sie bei unseren Veranstaltungen sehen wollen Was Sie sich von AWS wünschen skrause@amazon.de Ihr Feedback ist wichtig
  • 3. Amazon DynamoDB Schneller, vorhersagbarer, hoch skalierparer NoSQL Data Store Amazon RDS Verwalteter relationaler Datenbankdienst für MySQL, Oracle und SQL Server Amazon ElastiCache In-Memory Caching Service Amazon Redshift Schneller, mächtiger, voll verwalteter, Petabyte skalierbarer Data Warehouse Dienst Compute Storage AWS Global Infrastructure Database Application Services Deployment & Administration Networking AWS Datenbankdienste Skalierbare, hochperformante Datenbanken in der Cloud
  • 4. Amazon DynamoDB Schneller, vorhersagbarer, hoch skalierparer NoSQL Data Store Amazon RDS Verwalteter relationaler Datenbankdienst für MySQL, Oracle und SQL Server Amazon ElastiCache In-Memory Caching Service Amazon Redshift Schneller, mächtiger, voll verwalteter, Petabyte skalierbarer Data Warehouse Dienst Compute Storage AWS Global Infrastructure Database Application Services Deployment & Administration Networking AWS Datenbankdienste Skalierbare, hochperformante Datenbanken in der Cloud
  • 5. Data Warehousing auf die AWS Art • Keine Investitionskosten, Bezahlung nach Nutzung • Sehr hohe Performance bei sehr niedrigem Preis • Offen und flexibel, von populären Tools unterstützt • Leicht zu nutzen, massiv skalierbar
  • 6. Was wir gebaut haben… Ein schnelles, mächtiges Data Warehouse, das bis in die Petabytes skaliert Viel schneller Viel billiger Viel einfacher Als verwalteter Dienst Amazon Redshift
  • 7. Dramatische I/O Reduktion ID Alter Ort 123 20 Berlin 345 25 Leipzig 678 40 Dresden Zeilen-Speicherung Spalten-Speicherung Scan- Richtung
  • 8. Amazon Redshift Architektur • Leader Node – SQL Endpoint – Speichert Metadaten – Koordiniert Abfrageausführung • Compute Nodes – Lokale spaltenbasierte Speicherung – Parallele Abfrageausführung – Load, Backup, Restore via Amazon S3 – Paralleles Laden aus Amazon DynamoDB • Einzel-Node-Version verfügbar 10 GigE (HPC) Laden Backup Restore JDBC/ODBC jdbc:postgresql://mycluster.c7lp0qs37f41.us-east-1.redshift.amazonaws.com:8192/mydb
  • 9. Optimierte Hardware HS1.8XL: 128 GB RAM, 16 Cores, 24 HDDs, 16 TB nutzbarer Platz, 2 GB/sec Scanrate HS1.XL: 16 GB RAM, 2 Cores, 3 HDDs, 2 TB nutzbarer Platz • Optimiert für I/O intensive Workloads • Hohe Festplattendichte • Läuft in HPC Netzwerk - schnell • HS1.8XL verfügbar auf Amazon EC2
  • 10. Klein anfangen, groß wachsen Extra Large Node (HS1.XL) 3 HDDs, 2 TB, 16 GB RAM, 2 Cores Single Node (2 TB) Cluster 2-32 Nodes (4 TB – 64 TB) Eight Extra Large Node (HS1.8XL) 24 HDDs, 16 TB, 128 GB RAM, 16 Cores, 10 GigE Cluster 2-100 Nodes (32 TB – 1.6 PB) Hinweis: Knoten nicht in selber Skala
  • 11. Parallelisierung Redshift parallelisiert und verteilt alles • Abfrage • Laden • Backup • Restore • Größenänderung 10 GigE (HPC) Laden Backup Restore JDBC/ODBC
  • 12. Günstige Preise Pro Stunde für HS1.XL Single Node Effektiver Stundenpreis pro TB Effektiver Jahrespreis pro TB On-Demand $ 0,850 $ 0,425 $ 3.723 1 Year reserviert $ 0,500 $ 0,250 $ 2.190 3 Year reserviert $ 0,228 $ 0,114 $ 999 Einfache Preise Anzahl Nodes x Kosten pro Stunde Keine Kosten für Leader Node Keine Investitionskosten Pay as you go
  • 14. Amazon Redshift verwendet SQL • Industriestandard SQL • ODBC und JDBC Treiber für Datenzugriff – verwendet Postgres 8.x Treiber – Die meisten PostgreSQL Features werden unterstützt – Siehe Dokumentation für Unterschiede • INSERT/UPDATE/DELETE werden unterstützt – Aber Daten laden aus S3 oder DynamoDB mit COPY-Befehl ist deutlich schneller – VACUUM-Befehl nach vielen DELETE oder UPDATE-Operationen empfohlen
  • 15. • Sort Key – Mehrere Spalten möglich – Definiert die Reihenfolge der Daten auf Platte – Ermöglicht das Überspringen von Blöcken bei Abfrage • wenn Sort Key in WHERE-Klausel – Wenn neue Daten häufig abgefragt werden: timestamp-Spalte als Sort Key • Distribution Key – Eine Spalte – Definiert Verteilung der Daten im Cluster – Sollte für gleichmäßige Verteilung der Daten sorgen • hohe, über die Zeit gleichmäßige Kardinalität – Sollte in Abfragen nicht als „ist gleich“ Filter vorkommen – Join-Key für häufige Joins ist guter Kandidat – Wird keiner angegeben werden die Daten gleichmäßig per Row ID verteilt Tabellendesign
  • 16. Daten laden aus S3 oder DynamoDB • Direktes Laden aus S3 oder DynamoDB unterstützt: copy customer from 's3://mybucket/customer.txt’ credentials 'aws_access_key_id=<your-access-key-id>; aws_secret_access_key=<your-secret-access-key>’ gzip delimiter '|’; • Paralleles Laden von Daten – Für paralleles Laden Daten in mehrere Dateien aufteilen – Dateinamen mit gemeinsamem Präfix: • customer.txt.1, customer.txt.2, … – Große Dateien mit gzip komprimieren • Nach Möglichkeit Daten in Sortierung des Sort Key laden
  • 17. Daten-Komprimierung • Komprimierung spart Platz und Disk I/O • COPY analysiert die Daten automatisch und wählt geeignete Komprimierung – Ausschnitt der Daten für Auswahl der Komprimierung verwendet – Unterstützt: byte dictionary, delta, mostly n, run length, text • Kundenerfahrungen: 4-8-fache Komprimierung mit Echtdaten – 20x und mehr bei geeigneten Daten möglich • ANALYZE COMPRESSION zur Anzeige des gewählten Algorithmus analyze compression listing; Table | Column | Encoding ---------+----------------+--------- - listing | listid | delta listing | sellerid | delta32k listing | eventid | delta32k listing | dateid | bytedict listing | numtickets | bytedict listing | priceperticket | delta32k listing | totalprice | mostly32 listing | listtime | raw
  • 18. Einfach zu benutzen • Provisionierung in Minuten • Abfrageperformance überwachen • Vergrößern und Verkleinern durch Klick • Eingebaute Sicherheit • Automatische Backups
  • 20. Cluster bleibt online (read only) • Neuer Zielcluster im Hintergrund erstellt • Bezahlung nur für Quellcluster
  • 21. Cluster bleibt online • Der Cluster bleibt bei Größenänderungen online • Komplett automatisch – Daten automatisch neu verteilt • Read Only Modus während Größenänderung • Paralleles Kopieren der Daten (Node to Node) • Automatische Endpoint-Wechsel per DNS • Nur ein Cluster wird bezahlt
  • 23. Eingebaute Sicherheit • SSL Verschlüsselung für Daten auf der Leitung • Optional Verschlüsselung für Daten auf Festplatte – AES-256, Hardware-beschleunigt – Alle Blöcke auf Platte und in Amazon S3 verschlüsselt • Kein direkter Zugriff auf Compute Nodes • Amazon VPC unterstützt 10 GigE (HPC) Laden Backup Restore Kunden-VPC Interner VPC JDBC/ODBC
  • 24. Datensicherung und Verfügbarkeit • Replikation innerhalb des Clusters und Backup nach S3 stellt mehrere Kopien der Daten zu jedem Zeitpunkt sicher • Backups nach Amazon S3 sind kontinuierlich, automatisch und inkrementell – Entworfen für 11 Neunen Dauerhaftigkeit • Kontinuierliche Überwachung und automatische Wiederherstellung im Fall von Festplatten- und Node-Fehlern • Wiederherstellung von Snapshots in beliebige Availability Zones innerhalb einer Region
  • 25. Datenquellen Amazon DynamoDB Amazon Elastic MapReduce Amazon Simple Storage Service (S3) Amazon Elastic Compute Cloud (EC2) AWS Storage Gateway Service Corporate Data Center Amazon Relational Database Service (RDS) Amazon Redshift Mehr bald… Integration mit verschiedenen Datenquellen
  • 26. Daten laden und entladen • Upload nach Amazon S3 • AWS Import/Export • AWS Direct Connect • Partner Data Integration Systems Integrators Mehr bald…
  • 28.
  • 30. Kundenbeispiel Everyone Needs Skilled People At Home At Work In Life Repeatedly SkillPages
  • 31.
  • 32. Data Architecture Data Analyst Raw Data Get Data Join via Facebook Add a Skill Page Invite Friends Web Servers Amazon S3 User Action Trace Events EMR Hive Scripts Process Content • Process log files with regular expressions to parse out the info we need. • Processes cookies into useful searchable data such as Session, UserId, API Security token. • Filters surplus info like internal varnish logging. Amazon S3 Aggregated Data Raw Events Internal Web Excel Tableau Amazon Redshift
  • 33. Amazon Redshift ist • Ein voll verwalteter Data Warehouse Service • Schnell • Kostengünstig • Flexibel • Abrechnung nach Nutzung • Kompatibel mit bestehenden ETL und BI Tools Zusammenfassung
  • 34. Ressourcen • Steffen Krause | skrause@amazon.de | @AWS_Aktuell • http://aws.amazon.com/de/redshift • Getting Started Guide: http://docs.aws.amazon.com/redshift/latest/gsg/welcome.html • Setting Up SQL Workbench/J: http://docs.aws.amazon.com/redshift/latest/mgmt/connecting-using-workbench.html • SQL Reference: http://docs.aws.amazon.com/redshift/latest/dg/cm_chap_SQLCommandRef.html • Client Tools: • https://aws.amazon.com/marketplace/redshift/ • https://www.jaspersoft.com/webinar-AWS-Agile-Reporting-and-Analytics-in-the-Cloud
  • 35. • http://aws.amazon.com/de • Getting started with Free Tier: http://aws.amazon.com/de/free/ • 25 US$ credits für neue Kunden: http://aws.amazon.com/de/campaigns/account/ • Twitter: @AWS_Aktuell • Facebook: http://www.facebook.com/awsaktuell • Webinare: http://aws.amazon.com/de/about-aws/events/ • Slides: http://de.slideshare.net/AWSAktuell Ressourcen
  • 36. 1. Was ist Amazon Web Services und wofür kann ich AWS nutzen 2. Erste Schritte mit Amazon Web Services – von der Anmeldung bis zur ersten Instanz 3. Amazon Web Services 1*1 – welche Dienste gibt es wofür? 4. Server in der Cloud – die AWS Compute-Dienste 5. Daten speichern in der Cloud – die AWS Storage-Dienste 6. Datenbanken in der Cloud – SQL und NoSQL 7. Amazon Web Services für eCommerce Aufzeichnungen http://aws.amazon.com/de/recorded-webinar/ Bisherige Webinare
  • 37. • Big Data – 15.07.2013, 16 Uhr • Wie kann man ein Unternehmens-Rechenzentrum um Cloud-Ressourcen erweitern? Netzwerke, Sicherheit, Ressource – 23.07.2013, 16 Uhr • Die erste Woche mit AWS – 07.08.2013, 16 Uhr • 8 Tipps für eine Cloud-Strategie – wie Unternehmen heute die Cloud einsetzen – 14.08.2013, 16 Uhr • Optimieren Sie Ihre AWS Nutzung um Kosten zu sparen – 21.08.2013, 16 Uhr • http://aws.amazon.com/de/about-aws/events/ Kommende Webinare