SlideShare ist ein Scribd-Unternehmen logo
1 von 39
Romain Chaumais
Le Cloud au service du Digital	
  
Directeur du développement
Qui sommes-nous ?
Agence conseil en technologie digitale
Nos métiers : Marketing digital, CRM,
eCommerce, Cloud Computing,
Business Intelligence & Big Data
Bienvenue dans un monde
ultra digital
Retour vers le futur
2004
 Ouverture de la 3G en France
2006
 Ouverture de Facebook au
grand public 
2007
 Lancement de l’iPhone et de la
révolution des Smartdevices
Retour vers le futur
Le déploiement de la 3G en France et dans le monde
• 75% de la population française couverte en 3G en 2009
• 98% de la population française couverte en 3G en 2012
• 60% de la population française couverte en 4G en 2019
• 1,6 milliard de forfaits mobiles haut débit en 2012 dans le monde
2004
 Ouverture de la 3G en France
Retour vers le futur
2006
 Ouverture de Facebook au
grand public
Retour vers le futur
2007
 Lancement de l’iPhone et de la
révolution des Smartdevices
Retour vers le futur … en moins de 10 ans !
Smart Device
Réseaux sociaux
Haut débit sans fil
L’impact de toute innovation technologique
est souvent surestimé à court terme et
sous-estimé à long terme
Retour vers le futur
La digitalisation des interactions
Initie une recherche en boutique, va en magasin, consulte ses amis et
concrétise sur sa tablette.
Digital Physique Digital
Exemple de digitalisation des interactions
Products
Centrics
Hier
Multi canal
Aujourd’hui
Customers
Centrics
Omnicanal
L’impact de la digitalisation des interactions
Big Data
Pages vues, clics, produits
détenus, inscriptions, centre
d’intérêts, 
Connaissance CLIENTS
Anatomie d’une plate-forme digitale
Interactions marque/utilisateurs
Pilotage & Mesure de la performance
La bonne pub
Le bon contenu
La bonne offre
Le bon message
À la bonne personne
sur le bon support
Métiers, Outils & Partenaires
Le Cloud au service du Digital
Big Data
 Métiers, Outils & Partenaires
€
Interactions marque/utilisateurs
Pilotage & Mesure de la performance
Infrastructures
ApplicationsBig Data
Combiner les bénéfices du Cloud
Nos offres Cloud
Exemple de plateformes digitales dans AWS
Exemple de plateformes digitales dans AWS
Merci
Romain Chaumais
Maxime Mézin
Photobox RedShift
Data Foundation Manager
•  Leader Européen du tirage et du livre photo
•  25 millions de clients
•  17 pays et dernière ouverture il y a 6 mois en Australie
•  Stockage de milliards de photos
Problématique
•  Des traitements de rafraichissement du datawarehouse trop longs
–  8h en temps normal
–  Jusqu’à 12h en période de Noel
•  Une limitation en terme de stockage
–  5 To actuellement avec uniquement les données de vente du site
–  Nécessité de remplacer le Hardware
•  Acquisition d’un environnement de développement à un prix élevé
•  Nécessite un contrat administration distante (DBA externe)
•  Problème de modèle de licence pour connecter notre outils de reporting
En continuant comme ca…
•  Remplacement du hardware
–  100 k€
•  Achat de nouvelles licences
–  100 k€
–  Implique l’augmentation du coût de support
•  Toujours pas de flexibilité
•  Augmentation des coûts en CAPEX et OPEX
•  Pour une une performance équivalente…
•  Croiser l’ensemble des sources de
données de l’entreprise afin
d’améliorer :
–  La satisfaction client
–  Le ciblage CRM
–  Le reporting
–  Analyser les données au niveau le
plus fin : la photo
Les besoins pour le futur
Le Big Data
•  Face aux contraintes actuelles et besoins futurs nous nous sommes lancés
dans les technologies Big Data open source :
–  Création d’un cluster Hadoop sur EC2 avec whirr et mesos
–  Développement en Clojure / Cascalog pour le traitement des données
–  Utilisation de Hive + Hbase
•  Après 6 mois nous n’avions toujours pas de résultats probants et une
problématique de persistance des données complexe à résoudre
–  Beaucoup de temps passé à paramétrer le cluster et peu de temps disponible pour
travailler sur les données.
–  Temps d’apprentissage conséquent et ressources rares
Proof Of Concept Redshift
•  Premier point fort : Le prix
•  Deuxième point fort : La promesse d’une performance « Big Data » en SQL
•  L’objectif était de tester les points suivants :
–  Temps de chargement des données
–  Evaluation du nombre de nœuds nécessaires
–  Flexibilité : temps de passage de 1 à N nœuds
–  Performance sur une simulation d’alimentation quotidienne
–  Fonctions d’agrégation disponibles
Résultat du POC
•  Chargement :
–  4 jours pour extraire les données côté Photobox
–  Entre 50 minutes et 5 minutes pour charger les données dans Redshift
•  Performances :
–  Count(*) impossible à lancer sur la table photos sur le slave Mysql
–  3 secondes sur Redshift
•  Fonctions :
–  Quasiment équivalente (ex: manque le pivot/unpivot)
•  Flexibilité :
–  Passage de 1 à 8 nœuds en 6h
–  Création d’un environnement de dev en quelques minutes
Déploiement de Redshift avec 1 ETP
•  Annonce de Redshift le
28/11/2012
•  Demande d’accès le
10/12/2012
•  Premier accès fin décembre
•  Fin de la Beta 15 février
•  Passage en prod mi-mars
•  Achat de 8 instances
réservées pour 3 ans en Mai
Architecture Actuelle
Intégration d’EMR dans le Workflow
•  Elastic Map Reduce est utilisé comme un ETL via
•  Le process est donc le suivant :
–  Lancement d’EMR
–  Installation de Sqoop
–  Chargement des données de la base Mysql sur hdfs
–  Copie des données de HDFS vers S3
–  Chargement des données de S3 vers Redshift
•  Paramètres :
–  Nb d’instances
–  Degré de parallélisme
–  La clef de partitionnement
•  L’alimentation quotidienne du datawarehouse se fait en 2 étapes
–  Récupération des données sur une base slave du site
–  Calcul des agrégats
Avant EMR / Redshift
Chargement : 1h30 Chargement : 1h (limitation DB slave)
Agrégation : 6h Agrégation : 40 min (9 x plus rapide)
Performance Avant / Après
Performance
•  Temps de traitement observé en fonction du nombre de nœuds
•  5 To avant (données + index), 500 Go sur Redshift !
0	
  
20	
  
40	
  
60	
  
80	
  
100	
  
120	
  
2	
   4	
   8	
  
Perf	
  (min)	
  
Perf	
  (min)	
  
Coût avant / après
•  Avant
–  Opex : 70 k€
•  Support Licence : 30 k€
•  External DBA : 40 k€
–  Capex : 20 k€ / an (amorti)
–  Total : 90 k€
•  Redshift
–  Opex : Redshift + EMR = 17 k$ = 13 k€ => 7 x moins cher
–  Pourquoi la région US East ?
•  Initialement le service n’était pas disponible dans les autres régions
•  Pas de contrainte de latence (90 ms US East vs 30 ms EU)
Sécurité
•  VPN / VPC et ou Firewall
•  SSH
•  Cryptage
•  Légal : Safe Harbor Act
–  la Sphère de sécurité (Safe Harbor) permet à une entreprise américaine de certifier
qu'elle respecte la législation de l'Espace économique européen (EEE) afin d'obtenir
l'autorisation de transférer des données personnelles de l'EEE vers les Etats-Unis.
Fail over
•  Unload hebdomadaire de Redshift US => S3
•  Réplication S3 inter region S3 US => S3 EU
Conclusion
•  Plus de fiabilité
•  Un budget divisé par 7
•  Des performances à minima 10 fois meilleures
•  Une capacité de stockage multipliée par 32
•  Une scalabilité simplifiée
Questions ?
Merci

Weitere ähnliche Inhalte

Was ist angesagt?

Construire des Applications Web Performantes - Rule Book Webinar
Construire des Applications Web Performantes - Rule Book WebinarConstruire des Applications Web Performantes - Rule Book Webinar
Construire des Applications Web Performantes - Rule Book WebinarAmazon Web Services
 
Un Voyage dans le Cloud: Qu'est-ce que AWS?
Un Voyage dans le Cloud: Qu'est-ce que AWS?Un Voyage dans le Cloud: Qu'est-ce que AWS?
Un Voyage dans le Cloud: Qu'est-ce que AWS?Amazon Web Services
 
AWS Paris Summit 2014 - T3 - Architecturer avec AWS pour des millions d'util...
AWS Paris Summit 2014 - T3 -  Architecturer avec AWS pour des millions d'util...AWS Paris Summit 2014 - T3 -  Architecturer avec AWS pour des millions d'util...
AWS Paris Summit 2014 - T3 - Architecturer avec AWS pour des millions d'util...Amazon Web Services
 
Un Voyage dans le Cloud - Dev & Test
Un Voyage dans le Cloud - Dev & Test Un Voyage dans le Cloud - Dev & Test
Un Voyage dans le Cloud - Dev & Test Amazon Web Services
 
AWS Paris Summit 2014 - T1 - Introduction à Amazon EC2
AWS Paris Summit 2014 - T1 - Introduction à Amazon EC2AWS Paris Summit 2014 - T1 - Introduction à Amazon EC2
AWS Paris Summit 2014 - T1 - Introduction à Amazon EC2Amazon Web Services
 
AWS Paris Summit 2014 - T3 - Evolution des architectures VPC
AWS Paris Summit 2014 - T3 - Evolution des architectures VPCAWS Paris Summit 2014 - T3 - Evolution des architectures VPC
AWS Paris Summit 2014 - T3 - Evolution des architectures VPCAmazon Web Services
 
Présentation d'Amazon Web Services - Human Talks Grenoble
Présentation d'Amazon Web Services - Human Talks GrenoblePrésentation d'Amazon Web Services - Human Talks Grenoble
Présentation d'Amazon Web Services - Human Talks GrenobleBastien Libersa
 
4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...
4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...
4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...Nathalie Richomme
 
AWS Paris Summit 2014 - T2 - Déployer des environnements entreprises hybrides
AWS Paris Summit 2014 - T2 - Déployer des environnements entreprises hybridesAWS Paris Summit 2014 - T2 - Déployer des environnements entreprises hybrides
AWS Paris Summit 2014 - T2 - Déployer des environnements entreprises hybridesAmazon Web Services
 
Gibtalk aws
Gibtalk awsGibtalk aws
Gibtalk awsmeliphen
 
AWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévu
AWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévuAWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévu
AWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévuAmazon Web Services
 
6 stratégies pour migrer vos données dans AWS
6 stratégies pour migrer vos données dans AWS6 stratégies pour migrer vos données dans AWS
6 stratégies pour migrer vos données dans AWSJulien SIMON
 
AWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWS
AWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWSAWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWS
AWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWSAmazon Web Services
 
AWS Paris Summit 2014 - T3 - Du temps réel au data warehouse : capturez et an...
AWS Paris Summit 2014 - T3 - Du temps réel au data warehouse : capturez et an...AWS Paris Summit 2014 - T3 - Du temps réel au data warehouse : capturez et an...
AWS Paris Summit 2014 - T3 - Du temps réel au data warehouse : capturez et an...Amazon Web Services
 
Présentation des services AWS
Présentation des services AWSPrésentation des services AWS
Présentation des services AWSJulien SIMON
 
AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...
AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...
AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...Amazon Web Services
 
Track 2- Atelier 4 - Architecturez pour de la haute disponibilité
Track 2- Atelier 4 - Architecturez pour de la haute disponibilitéTrack 2- Atelier 4 - Architecturez pour de la haute disponibilité
Track 2- Atelier 4 - Architecturez pour de la haute disponibilitéAmazon Web Services
 
Deep Dive AWS CloudTrail
Deep Dive AWS CloudTrailDeep Dive AWS CloudTrail
Deep Dive AWS CloudTrailJulien SIMON
 
Deep Dive: Virtual Private Cloud
Deep Dive: Virtual Private CloudDeep Dive: Virtual Private Cloud
Deep Dive: Virtual Private CloudJulien SIMON
 
AWS Summit Paris - Track 4 - Session 1 - Faites grandir votre business de ser...
AWS Summit Paris - Track 4 - Session 1 - Faites grandir votre business de ser...AWS Summit Paris - Track 4 - Session 1 - Faites grandir votre business de ser...
AWS Summit Paris - Track 4 - Session 1 - Faites grandir votre business de ser...Amazon Web Services
 

Was ist angesagt? (20)

Construire des Applications Web Performantes - Rule Book Webinar
Construire des Applications Web Performantes - Rule Book WebinarConstruire des Applications Web Performantes - Rule Book Webinar
Construire des Applications Web Performantes - Rule Book Webinar
 
Un Voyage dans le Cloud: Qu'est-ce que AWS?
Un Voyage dans le Cloud: Qu'est-ce que AWS?Un Voyage dans le Cloud: Qu'est-ce que AWS?
Un Voyage dans le Cloud: Qu'est-ce que AWS?
 
AWS Paris Summit 2014 - T3 - Architecturer avec AWS pour des millions d'util...
AWS Paris Summit 2014 - T3 -  Architecturer avec AWS pour des millions d'util...AWS Paris Summit 2014 - T3 -  Architecturer avec AWS pour des millions d'util...
AWS Paris Summit 2014 - T3 - Architecturer avec AWS pour des millions d'util...
 
Un Voyage dans le Cloud - Dev & Test
Un Voyage dans le Cloud - Dev & Test Un Voyage dans le Cloud - Dev & Test
Un Voyage dans le Cloud - Dev & Test
 
AWS Paris Summit 2014 - T1 - Introduction à Amazon EC2
AWS Paris Summit 2014 - T1 - Introduction à Amazon EC2AWS Paris Summit 2014 - T1 - Introduction à Amazon EC2
AWS Paris Summit 2014 - T1 - Introduction à Amazon EC2
 
AWS Paris Summit 2014 - T3 - Evolution des architectures VPC
AWS Paris Summit 2014 - T3 - Evolution des architectures VPCAWS Paris Summit 2014 - T3 - Evolution des architectures VPC
AWS Paris Summit 2014 - T3 - Evolution des architectures VPC
 
Présentation d'Amazon Web Services - Human Talks Grenoble
Présentation d'Amazon Web Services - Human Talks GrenoblePrésentation d'Amazon Web Services - Human Talks Grenoble
Présentation d'Amazon Web Services - Human Talks Grenoble
 
4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...
4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...
4D Summit Europe 2016 - Conférence d'A&C Consulting : "Stocker des données su...
 
AWS Paris Summit 2014 - T2 - Déployer des environnements entreprises hybrides
AWS Paris Summit 2014 - T2 - Déployer des environnements entreprises hybridesAWS Paris Summit 2014 - T2 - Déployer des environnements entreprises hybrides
AWS Paris Summit 2014 - T2 - Déployer des environnements entreprises hybrides
 
Gibtalk aws
Gibtalk awsGibtalk aws
Gibtalk aws
 
AWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévu
AWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévuAWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévu
AWS Summit Paris - Track 2 - Session 2 - Préparez-vous à l'imprévu
 
6 stratégies pour migrer vos données dans AWS
6 stratégies pour migrer vos données dans AWS6 stratégies pour migrer vos données dans AWS
6 stratégies pour migrer vos données dans AWS
 
AWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWS
AWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWSAWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWS
AWS Summit Paris - Track 4 - Session 3 - Créez votre SaaS avec AWS
 
AWS Paris Summit 2014 - T3 - Du temps réel au data warehouse : capturez et an...
AWS Paris Summit 2014 - T3 - Du temps réel au data warehouse : capturez et an...AWS Paris Summit 2014 - T3 - Du temps réel au data warehouse : capturez et an...
AWS Paris Summit 2014 - T3 - Du temps réel au data warehouse : capturez et an...
 
Présentation des services AWS
Présentation des services AWSPrésentation des services AWS
Présentation des services AWS
 
AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...
AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...
AWS Summit Paris - Track 4 - Session 2 - Migration Cloud, modernisation des a...
 
Track 2- Atelier 4 - Architecturez pour de la haute disponibilité
Track 2- Atelier 4 - Architecturez pour de la haute disponibilitéTrack 2- Atelier 4 - Architecturez pour de la haute disponibilité
Track 2- Atelier 4 - Architecturez pour de la haute disponibilité
 
Deep Dive AWS CloudTrail
Deep Dive AWS CloudTrailDeep Dive AWS CloudTrail
Deep Dive AWS CloudTrail
 
Deep Dive: Virtual Private Cloud
Deep Dive: Virtual Private CloudDeep Dive: Virtual Private Cloud
Deep Dive: Virtual Private Cloud
 
AWS Summit Paris - Track 4 - Session 1 - Faites grandir votre business de ser...
AWS Summit Paris - Track 4 - Session 1 - Faites grandir votre business de ser...AWS Summit Paris - Track 4 - Session 1 - Faites grandir votre business de ser...
AWS Summit Paris - Track 4 - Session 1 - Faites grandir votre business de ser...
 

Andere mochten auch

Автоматизация работы с клиентами с помощью CRM-системы
Автоматизация работы с клиентами с помощью CRM-системыАвтоматизация работы с клиентами с помощью CRM-системы
Автоматизация работы с клиентами с помощью CRM-системыSergey Emelyanov
 
The Impact of Healthcare Reform on Urban & Safety Net Hospitals - Mark Chasta...
The Impact of Healthcare Reform on Urban & Safety Net Hospitals - Mark Chasta...The Impact of Healthcare Reform on Urban & Safety Net Hospitals - Mark Chasta...
The Impact of Healthcare Reform on Urban & Safety Net Hospitals - Mark Chasta...marcus evans Network
 
Ppt reunio pares 5 anys2n trim
Ppt reunio pares 5 anys2n trimPpt reunio pares 5 anys2n trim
Ppt reunio pares 5 anys2n trimbegoturro
 
Resumen para el examen final con arreglos de profer
Resumen para el examen final con arreglos de proferResumen para el examen final con arreglos de profer
Resumen para el examen final con arreglos de proferMi rincón de Medicina
 
Boi fair 2011
Boi fair 2011Boi fair 2011
Boi fair 2011ballondor
 
Los rasgos deseables del maestro
Los rasgos deseables del maestroLos rasgos deseables del maestro
Los rasgos deseables del maestroMarinetteBB
 
Storytelling reflection copy
Storytelling reflection copyStorytelling reflection copy
Storytelling reflection copygrade4biss
 
Tugsukh potokd zoriulj web d tavikh
Tugsukh potokd zoriulj web d tavikhTugsukh potokd zoriulj web d tavikh
Tugsukh potokd zoriulj web d tavikhEtugen
 
What's up?! 12 september 2013 - Sander Hoeken - big data & de beta marketeer
What's up?! 12 september 2013 - Sander Hoeken - big data & de beta marketeerWhat's up?! 12 september 2013 - Sander Hoeken - big data & de beta marketeer
What's up?! 12 september 2013 - Sander Hoeken - big data & de beta marketeerUnited
 
preCalculus 803 Law of Cosines!
preCalculus 803 Law of Cosines!preCalculus 803 Law of Cosines!
preCalculus 803 Law of Cosines!A Jorge Garcia
 
Tema 12 antigua roma (1º eso)
Tema 12 antigua roma (1º eso)Tema 12 antigua roma (1º eso)
Tema 12 antigua roma (1º eso)Geohistoria23
 
Imperio Romano
Imperio RomanoImperio Romano
Imperio Romanoledno 2
 
Zeit ist Geld - Übersetzungsportale im Aufwind - Linnemann/Roos
Zeit ist Geld - Übersetzungsportale im Aufwind - Linnemann/RoosZeit ist Geld - Übersetzungsportale im Aufwind - Linnemann/Roos
Zeit ist Geld - Übersetzungsportale im Aufwind - Linnemann/Roostecom
 

Andere mochten auch (19)

Автоматизация работы с клиентами с помощью CRM-системы
Автоматизация работы с клиентами с помощью CRM-системыАвтоматизация работы с клиентами с помощью CRM-системы
Автоматизация работы с клиентами с помощью CRM-системы
 
The Impact of Healthcare Reform on Urban & Safety Net Hospitals - Mark Chasta...
The Impact of Healthcare Reform on Urban & Safety Net Hospitals - Mark Chasta...The Impact of Healthcare Reform on Urban & Safety Net Hospitals - Mark Chasta...
The Impact of Healthcare Reform on Urban & Safety Net Hospitals - Mark Chasta...
 
064 argumentari cast
064 argumentari cast064 argumentari cast
064 argumentari cast
 
Ppt reunio pares 5 anys2n trim
Ppt reunio pares 5 anys2n trimPpt reunio pares 5 anys2n trim
Ppt reunio pares 5 anys2n trim
 
Juha Metso
Juha MetsoJuha Metso
Juha Metso
 
Newsletter2012
Newsletter2012Newsletter2012
Newsletter2012
 
Resumen para el examen final con arreglos de profer
Resumen para el examen final con arreglos de proferResumen para el examen final con arreglos de profer
Resumen para el examen final con arreglos de profer
 
Boi fair 2011
Boi fair 2011Boi fair 2011
Boi fair 2011
 
2011 AHS EXCELLENCE
2011 AHS EXCELLENCE2011 AHS EXCELLENCE
2011 AHS EXCELLENCE
 
Los rasgos deseables del maestro
Los rasgos deseables del maestroLos rasgos deseables del maestro
Los rasgos deseables del maestro
 
Watercolours
WatercoloursWatercolours
Watercolours
 
Storytelling reflection copy
Storytelling reflection copyStorytelling reflection copy
Storytelling reflection copy
 
Tugsukh potokd zoriulj web d tavikh
Tugsukh potokd zoriulj web d tavikhTugsukh potokd zoriulj web d tavikh
Tugsukh potokd zoriulj web d tavikh
 
What's up?! 12 september 2013 - Sander Hoeken - big data & de beta marketeer
What's up?! 12 september 2013 - Sander Hoeken - big data & de beta marketeerWhat's up?! 12 september 2013 - Sander Hoeken - big data & de beta marketeer
What's up?! 12 september 2013 - Sander Hoeken - big data & de beta marketeer
 
preCalculus 803 Law of Cosines!
preCalculus 803 Law of Cosines!preCalculus 803 Law of Cosines!
preCalculus 803 Law of Cosines!
 
Tema 12 antigua roma (1º eso)
Tema 12 antigua roma (1º eso)Tema 12 antigua roma (1º eso)
Tema 12 antigua roma (1º eso)
 
Imperio Romano
Imperio RomanoImperio Romano
Imperio Romano
 
Metro + Metro Like
Metro + Metro LikeMetro + Metro Like
Metro + Metro Like
 
Zeit ist Geld - Übersetzungsportale im Aufwind - Linnemann/Roos
Zeit ist Geld - Übersetzungsportale im Aufwind - Linnemann/RoosZeit ist Geld - Übersetzungsportale im Aufwind - Linnemann/Roos
Zeit ist Geld - Übersetzungsportale im Aufwind - Linnemann/Roos
 

Ähnlich wie Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec le témoignage Big Data de Photobox ?

Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delàAzure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delàMicrosoft
 
Meetup Google Cloud
Meetup Google CloudMeetup Google Cloud
Meetup Google CloudPierre Coste
 
Le Cloud, une réponse à nos besoins - Apéro Digital avril 2019 - Pascal Martin
Le Cloud, une réponse à nos besoins - Apéro Digital avril 2019 - Pascal MartinLe Cloud, une réponse à nos besoins - Apéro Digital avril 2019 - Pascal Martin
Le Cloud, une réponse à nos besoins - Apéro Digital avril 2019 - Pascal MartinPascal MARTIN
 
Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1Microsoft
 
Comment passer d'un POC en prod @ plusieurs milliards de rêquetes
Comment passer d'un POC en prod @ plusieurs milliards de rêquetesComment passer d'un POC en prod @ plusieurs milliards de rêquetes
Comment passer d'un POC en prod @ plusieurs milliards de rêquetesCarles Sistare
 
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...David Caramelo
 
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle Rome
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle RomeIBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle Rome
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle RomeIBM Switzerland
 
Présentation BigQuery et comparatif avec RedShift
Présentation BigQuery et comparatif avec RedShiftPrésentation BigQuery et comparatif avec RedShift
Présentation BigQuery et comparatif avec RedShiftPierre Coste
 
Meetup Google Cloud
Meetup Google CloudMeetup Google Cloud
Meetup Google CloudPierre Coste
 
BIG DATA - Cloud Computing
BIG DATA - Cloud ComputingBIG DATA - Cloud Computing
BIG DATA - Cloud Computingsenejug
 
Nouvelles opportunités pour les données fortement interconnectées : La base d...
Nouvelles opportunités pour les données fortement interconnectées : La base d...Nouvelles opportunités pour les données fortement interconnectées : La base d...
Nouvelles opportunités pour les données fortement interconnectées : La base d...Cédric Fauvet
 
Talend Integration Cloud spring 16 launch
Talend Integration Cloud spring 16 launch Talend Integration Cloud spring 16 launch
Talend Integration Cloud spring 16 launch Jean-Michel Franco
 
Joe Mobile sur le Cloud - DevoxxFR 2013
Joe Mobile sur le Cloud - DevoxxFR 2013Joe Mobile sur le Cloud - DevoxxFR 2013
Joe Mobile sur le Cloud - DevoxxFR 2013Cyrille Le Clerc
 
Au coeur du framework .net 4.5.1
Au coeur du framework .net 4.5.1Au coeur du framework .net 4.5.1
Au coeur du framework .net 4.5.1Cellenza
 
Meetup Devops Geneve 06/17- EBU Feedbacks
Meetup Devops Geneve 06/17- EBU Feedbacks Meetup Devops Geneve 06/17- EBU Feedbacks
Meetup Devops Geneve 06/17- EBU Feedbacks Hidora
 
Morning with MongoDB Paris 2012 - Cas d'usages courant en entreprise. Présent...
Morning with MongoDB Paris 2012 - Cas d'usages courant en entreprise. Présent...Morning with MongoDB Paris 2012 - Cas d'usages courant en entreprise. Présent...
Morning with MongoDB Paris 2012 - Cas d'usages courant en entreprise. Présent...MongoDB
 
Web perf Silicon Comte
Web perf Silicon ComteWeb perf Silicon Comte
Web perf Silicon ComteSilicon Comté
 
Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6Jean-Michel Franco
 
Revendeurs : repensez votre modèle économique avec le Cloud
Revendeurs : repensez votre modèle économique avec le CloudRevendeurs : repensez votre modèle économique avec le Cloud
Revendeurs : repensez votre modèle économique avec le CloudZyxel France
 

Ähnlich wie Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec le témoignage Big Data de Photobox ? (20)

Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delàAzure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
Azure: que puis-je faire pour 0€, 1€, 1000€, un million d’€ et au-delà
 
Meetup Google Cloud
Meetup Google CloudMeetup Google Cloud
Meetup Google Cloud
 
Le Cloud, une réponse à nos besoins - Apéro Digital avril 2019 - Pascal Martin
Le Cloud, une réponse à nos besoins - Apéro Digital avril 2019 - Pascal MartinLe Cloud, une réponse à nos besoins - Apéro Digital avril 2019 - Pascal Martin
Le Cloud, une réponse à nos besoins - Apéro Digital avril 2019 - Pascal Martin
 
Propostion un Iaas
Propostion un IaasPropostion un Iaas
Propostion un Iaas
 
Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1Au cœur du Framework .NET 4.5.1
Au cœur du Framework .NET 4.5.1
 
Comment passer d'un POC en prod @ plusieurs milliards de rêquetes
Comment passer d'un POC en prod @ plusieurs milliards de rêquetesComment passer d'un POC en prod @ plusieurs milliards de rêquetes
Comment passer d'un POC en prod @ plusieurs milliards de rêquetes
 
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
Optimisations et Performances d'un POC en prod @ plusieurs milliards de requê...
 
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle Rome
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle RomeIBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle Rome
IBM Technology Day 2013 IBM Smarter Computing Y. de Visme Salle Rome
 
Présentation BigQuery et comparatif avec RedShift
Présentation BigQuery et comparatif avec RedShiftPrésentation BigQuery et comparatif avec RedShift
Présentation BigQuery et comparatif avec RedShift
 
Meetup Google Cloud
Meetup Google CloudMeetup Google Cloud
Meetup Google Cloud
 
BIG DATA - Cloud Computing
BIG DATA - Cloud ComputingBIG DATA - Cloud Computing
BIG DATA - Cloud Computing
 
Nouvelles opportunités pour les données fortement interconnectées : La base d...
Nouvelles opportunités pour les données fortement interconnectées : La base d...Nouvelles opportunités pour les données fortement interconnectées : La base d...
Nouvelles opportunités pour les données fortement interconnectées : La base d...
 
Talend Integration Cloud spring 16 launch
Talend Integration Cloud spring 16 launch Talend Integration Cloud spring 16 launch
Talend Integration Cloud spring 16 launch
 
Joe Mobile sur le Cloud - DevoxxFR 2013
Joe Mobile sur le Cloud - DevoxxFR 2013Joe Mobile sur le Cloud - DevoxxFR 2013
Joe Mobile sur le Cloud - DevoxxFR 2013
 
Au coeur du framework .net 4.5.1
Au coeur du framework .net 4.5.1Au coeur du framework .net 4.5.1
Au coeur du framework .net 4.5.1
 
Meetup Devops Geneve 06/17- EBU Feedbacks
Meetup Devops Geneve 06/17- EBU Feedbacks Meetup Devops Geneve 06/17- EBU Feedbacks
Meetup Devops Geneve 06/17- EBU Feedbacks
 
Morning with MongoDB Paris 2012 - Cas d'usages courant en entreprise. Présent...
Morning with MongoDB Paris 2012 - Cas d'usages courant en entreprise. Présent...Morning with MongoDB Paris 2012 - Cas d'usages courant en entreprise. Présent...
Morning with MongoDB Paris 2012 - Cas d'usages courant en entreprise. Présent...
 
Web perf Silicon Comte
Web perf Silicon ComteWeb perf Silicon Comte
Web perf Silicon Comte
 
Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6
 
Revendeurs : repensez votre modèle économique avec le Cloud
Revendeurs : repensez votre modèle économique avec le CloudRevendeurs : repensez votre modèle économique avec le Cloud
Revendeurs : repensez votre modèle économique avec le Cloud
 

Mehr von Amazon Web Services

Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...Amazon Web Services
 
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...Amazon Web Services
 
Esegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS FargateEsegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS FargateAmazon Web Services
 
Costruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWSCostruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWSAmazon Web Services
 
Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot Amazon Web Services
 
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...Amazon Web Services
 
OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...Amazon Web Services
 
Microsoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows WorkloadsMicrosoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows WorkloadsAmazon Web Services
 
Database Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatareDatabase Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatareAmazon Web Services
 
Crea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJSCrea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJSAmazon Web Services
 
API moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e webAPI moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e webAmazon Web Services
 
Database Oracle e VMware Cloud™ on AWS: i miti da sfatare
Database Oracle e VMware Cloud™ on AWS: i miti da sfatareDatabase Oracle e VMware Cloud™ on AWS: i miti da sfatare
Database Oracle e VMware Cloud™ on AWS: i miti da sfatareAmazon Web Services
 
Tools for building your MVP on AWS
Tools for building your MVP on AWSTools for building your MVP on AWS
Tools for building your MVP on AWSAmazon Web Services
 
How to Build a Winning Pitch Deck
How to Build a Winning Pitch DeckHow to Build a Winning Pitch Deck
How to Build a Winning Pitch DeckAmazon Web Services
 
Building a web application without servers
Building a web application without serversBuilding a web application without servers
Building a web application without serversAmazon Web Services
 
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...Amazon Web Services
 
Introduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container ServiceIntroduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container ServiceAmazon Web Services
 

Mehr von Amazon Web Services (20)

Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
Come costruire servizi di Forecasting sfruttando algoritmi di ML e deep learn...
 
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
Big Data per le Startup: come creare applicazioni Big Data in modalità Server...
 
Esegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS FargateEsegui pod serverless con Amazon EKS e AWS Fargate
Esegui pod serverless con Amazon EKS e AWS Fargate
 
Costruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWSCostruire Applicazioni Moderne con AWS
Costruire Applicazioni Moderne con AWS
 
Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot Come spendere fino al 90% in meno con i container e le istanze spot
Come spendere fino al 90% in meno con i container e le istanze spot
 
Open banking as a service
Open banking as a serviceOpen banking as a service
Open banking as a service
 
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
Rendi unica l’offerta della tua startup sul mercato con i servizi Machine Lea...
 
OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...OpsWorks Configuration Management: automatizza la gestione e i deployment del...
OpsWorks Configuration Management: automatizza la gestione e i deployment del...
 
Microsoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows WorkloadsMicrosoft Active Directory su AWS per supportare i tuoi Windows Workloads
Microsoft Active Directory su AWS per supportare i tuoi Windows Workloads
 
Computer Vision con AWS
Computer Vision con AWSComputer Vision con AWS
Computer Vision con AWS
 
Database Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatareDatabase Oracle e VMware Cloud on AWS i miti da sfatare
Database Oracle e VMware Cloud on AWS i miti da sfatare
 
Crea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJSCrea la tua prima serverless ledger-based app con QLDB e NodeJS
Crea la tua prima serverless ledger-based app con QLDB e NodeJS
 
API moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e webAPI moderne real-time per applicazioni mobili e web
API moderne real-time per applicazioni mobili e web
 
Database Oracle e VMware Cloud™ on AWS: i miti da sfatare
Database Oracle e VMware Cloud™ on AWS: i miti da sfatareDatabase Oracle e VMware Cloud™ on AWS: i miti da sfatare
Database Oracle e VMware Cloud™ on AWS: i miti da sfatare
 
Tools for building your MVP on AWS
Tools for building your MVP on AWSTools for building your MVP on AWS
Tools for building your MVP on AWS
 
How to Build a Winning Pitch Deck
How to Build a Winning Pitch DeckHow to Build a Winning Pitch Deck
How to Build a Winning Pitch Deck
 
Building a web application without servers
Building a web application without serversBuilding a web application without servers
Building a web application without servers
 
Fundraising Essentials
Fundraising EssentialsFundraising Essentials
Fundraising Essentials
 
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
AWS_HK_StartupDay_Building Interactive websites while automating for efficien...
 
Introduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container ServiceIntroduzione a Amazon Elastic Container Service
Introduzione a Amazon Elastic Container Service
 

Track 2 - Atelier 3 - Comment Ysance met le cloud au service du digital avec le témoignage Big Data de Photobox ?

  • 1. Romain Chaumais Le Cloud au service du Digital   Directeur du développement
  • 2. Qui sommes-nous ? Agence conseil en technologie digitale Nos métiers : Marketing digital, CRM, eCommerce, Cloud Computing, Business Intelligence & Big Data
  • 3. Bienvenue dans un monde ultra digital
  • 4. Retour vers le futur 2004 Ouverture de la 3G en France 2006 Ouverture de Facebook au grand public 2007 Lancement de l’iPhone et de la révolution des Smartdevices
  • 5. Retour vers le futur Le déploiement de la 3G en France et dans le monde • 75% de la population française couverte en 3G en 2009 • 98% de la population française couverte en 3G en 2012 • 60% de la population française couverte en 4G en 2019 • 1,6 milliard de forfaits mobiles haut débit en 2012 dans le monde 2004 Ouverture de la 3G en France
  • 6. Retour vers le futur 2006 Ouverture de Facebook au grand public
  • 7. Retour vers le futur 2007 Lancement de l’iPhone et de la révolution des Smartdevices
  • 8. Retour vers le futur … en moins de 10 ans ! Smart Device Réseaux sociaux Haut débit sans fil
  • 9. L’impact de toute innovation technologique est souvent surestimé à court terme et sous-estimé à long terme
  • 10. Retour vers le futur
  • 11. La digitalisation des interactions
  • 12. Initie une recherche en boutique, va en magasin, consulte ses amis et concrétise sur sa tablette. Digital Physique Digital Exemple de digitalisation des interactions
  • 14. Big Data Pages vues, clics, produits détenus, inscriptions, centre d’intérêts, Connaissance CLIENTS Anatomie d’une plate-forme digitale Interactions marque/utilisateurs Pilotage & Mesure de la performance La bonne pub Le bon contenu La bonne offre Le bon message À la bonne personne sur le bon support Métiers, Outils & Partenaires
  • 15. Le Cloud au service du Digital Big Data Métiers, Outils & Partenaires € Interactions marque/utilisateurs Pilotage & Mesure de la performance Infrastructures ApplicationsBig Data
  • 18. Exemple de plateformes digitales dans AWS
  • 19. Exemple de plateformes digitales dans AWS
  • 20.
  • 23. •  Leader Européen du tirage et du livre photo •  25 millions de clients •  17 pays et dernière ouverture il y a 6 mois en Australie •  Stockage de milliards de photos
  • 24. Problématique •  Des traitements de rafraichissement du datawarehouse trop longs –  8h en temps normal –  Jusqu’à 12h en période de Noel •  Une limitation en terme de stockage –  5 To actuellement avec uniquement les données de vente du site –  Nécessité de remplacer le Hardware •  Acquisition d’un environnement de développement à un prix élevé •  Nécessite un contrat administration distante (DBA externe) •  Problème de modèle de licence pour connecter notre outils de reporting
  • 25. En continuant comme ca… •  Remplacement du hardware –  100 k€ •  Achat de nouvelles licences –  100 k€ –  Implique l’augmentation du coût de support •  Toujours pas de flexibilité •  Augmentation des coûts en CAPEX et OPEX •  Pour une une performance équivalente…
  • 26. •  Croiser l’ensemble des sources de données de l’entreprise afin d’améliorer : –  La satisfaction client –  Le ciblage CRM –  Le reporting –  Analyser les données au niveau le plus fin : la photo Les besoins pour le futur
  • 27. Le Big Data •  Face aux contraintes actuelles et besoins futurs nous nous sommes lancés dans les technologies Big Data open source : –  Création d’un cluster Hadoop sur EC2 avec whirr et mesos –  Développement en Clojure / Cascalog pour le traitement des données –  Utilisation de Hive + Hbase •  Après 6 mois nous n’avions toujours pas de résultats probants et une problématique de persistance des données complexe à résoudre –  Beaucoup de temps passé à paramétrer le cluster et peu de temps disponible pour travailler sur les données. –  Temps d’apprentissage conséquent et ressources rares
  • 28. Proof Of Concept Redshift •  Premier point fort : Le prix •  Deuxième point fort : La promesse d’une performance « Big Data » en SQL •  L’objectif était de tester les points suivants : –  Temps de chargement des données –  Evaluation du nombre de nœuds nécessaires –  Flexibilité : temps de passage de 1 à N nœuds –  Performance sur une simulation d’alimentation quotidienne –  Fonctions d’agrégation disponibles
  • 29. Résultat du POC •  Chargement : –  4 jours pour extraire les données côté Photobox –  Entre 50 minutes et 5 minutes pour charger les données dans Redshift •  Performances : –  Count(*) impossible à lancer sur la table photos sur le slave Mysql –  3 secondes sur Redshift •  Fonctions : –  Quasiment équivalente (ex: manque le pivot/unpivot) •  Flexibilité : –  Passage de 1 à 8 nœuds en 6h –  Création d’un environnement de dev en quelques minutes
  • 30. Déploiement de Redshift avec 1 ETP •  Annonce de Redshift le 28/11/2012 •  Demande d’accès le 10/12/2012 •  Premier accès fin décembre •  Fin de la Beta 15 février •  Passage en prod mi-mars •  Achat de 8 instances réservées pour 3 ans en Mai
  • 32. Intégration d’EMR dans le Workflow •  Elastic Map Reduce est utilisé comme un ETL via •  Le process est donc le suivant : –  Lancement d’EMR –  Installation de Sqoop –  Chargement des données de la base Mysql sur hdfs –  Copie des données de HDFS vers S3 –  Chargement des données de S3 vers Redshift •  Paramètres : –  Nb d’instances –  Degré de parallélisme –  La clef de partitionnement
  • 33. •  L’alimentation quotidienne du datawarehouse se fait en 2 étapes –  Récupération des données sur une base slave du site –  Calcul des agrégats Avant EMR / Redshift Chargement : 1h30 Chargement : 1h (limitation DB slave) Agrégation : 6h Agrégation : 40 min (9 x plus rapide) Performance Avant / Après
  • 34. Performance •  Temps de traitement observé en fonction du nombre de nœuds •  5 To avant (données + index), 500 Go sur Redshift ! 0   20   40   60   80   100   120   2   4   8   Perf  (min)   Perf  (min)  
  • 35. Coût avant / après •  Avant –  Opex : 70 k€ •  Support Licence : 30 k€ •  External DBA : 40 k€ –  Capex : 20 k€ / an (amorti) –  Total : 90 k€ •  Redshift –  Opex : Redshift + EMR = 17 k$ = 13 k€ => 7 x moins cher –  Pourquoi la région US East ? •  Initialement le service n’était pas disponible dans les autres régions •  Pas de contrainte de latence (90 ms US East vs 30 ms EU)
  • 36. Sécurité •  VPN / VPC et ou Firewall •  SSH •  Cryptage •  Légal : Safe Harbor Act –  la Sphère de sécurité (Safe Harbor) permet à une entreprise américaine de certifier qu'elle respecte la législation de l'Espace économique européen (EEE) afin d'obtenir l'autorisation de transférer des données personnelles de l'EEE vers les Etats-Unis.
  • 37. Fail over •  Unload hebdomadaire de Redshift US => S3 •  Réplication S3 inter region S3 US => S3 EU
  • 38. Conclusion •  Plus de fiabilité •  Un budget divisé par 7 •  Des performances à minima 10 fois meilleures •  Une capacité de stockage multipliée par 32 •  Une scalabilité simplifiée