SlideShare ist ein Scribd-Unternehmen logo
1 von 16
Downloaden Sie, um offline zu lesen
Fares & Ali
Plan
- Big Data?
- Statistiques
- Les 3V de Big Data
- Enjeux à venir
- Comment exploiter ces Big Data?
- Hadoop & ses alternatives
- Exemple d’utilisation
Big Data, Qu'est-ce que c'est ?
Big Data = 7 lettres …
Il s'agit d'une problématique engendrée par la
grande quantité de données publiées sur Internet :
des profils, ebooks, videos, musique, conversations
en ligne, des flux de sites d'actualités…
Aujourd’hui, Internet est fait de tous les types de
données.
Qu'est-ce que c'est maintenant ?
Autrement que les 7 lettres, Big Data est la
combinaison de l'infrastructure, les algorithmes et
les méthodes de visualisations utilisées pour
donner un sens sur l'utilisateur et les données
générées d’une machine ou un système.
D'où les Big Data proviennent-elles?
Social data : Tweets, upload de vidéos sur Youtube
et images sur Flickr..
Transactional data : paiement en ligne, factures,
enregistrements de livraison …
Machine data : données recueillies à partir des
équipements industriel (journalisation et
surveillance) …
Les formes de Big Data?
- Générée par l’utilisateur
- Générée par une machine ou une application
- Structurée (XML/ JSON/ Tabulations ….)
- Non structuré (texte brute)
Stats
1971 : le premier email est envoyé ‘QUERTYUIO’
en 10 octets.
1972 : Internet est présenté au grand public.
2010 : près de 1000 milliards Go sur Internet.
2015 : Estimation de 8 Zo, ~ 8000 milliards Go, ~
250 milliards de DVD.
Les 3V de Big Data
Que peuvent les Big Data engendrer ?
- Dans un réseau, on peut surveiller et voir le trafic
mais aussi qui veut attaquer notre SI...
- Qui ont acheté un tel produit d’un e-Shop, mais
aussi des stats sur leurs profils ()...
- Les erreurs d’une application, mais aussi les
vraies causes (qui/ pourquoi/ quand)? ..
- Les effets d’un utilisateur dans une application…
Quels enjeux à venir ?
Comment exploiter au mieux cet immense potentiel
?
>>>> Créer des outils pour analyser, trier puis
exploiter ces données au quotidien.
Et ce en temps réel du futur d'Internet.
C'est probablement l'un des plus grands défis
informatiques des prochaines années.
Comment exploiter ces Big Data?
La notion de Big Data est intimement lié à la
capacité de traitement de gros volume.
C’est pourquoi Google a inventé l’algorithme de
MapReduce en 2004 afin de distribuer des
traitements sur un ensemble de machines et faire
face aux problèmes d’exploitation de Big Data.
Hadoop : Naissance
Les leader du Web Facebook, Twitter et Yahoo ont
confronté le même problème que Google. Ils ont
choisi alors de contribuer au développement de
MapReduce, d’où le framework Hadoop vient d’être
crée, sous la gouvernance de la fondation Apache
en 2008.
Hadoop : Concept
HDFS(Hadoop Distributed File
System) un système de fichiers
virtuel sous forme de noeuds de
données.

MapReduce (map tasks then
reduction by grouping)
un modèle de programmation
parallèle permettant de traiter de
grands volumes de données.
Les alternatives de Hadoop
LINQ/Dryad de Microsoft utilisé par Bing
Pig de Yahoo
HBase de Facebook
Azkaban LinkedIn
Cassandra
Big Data : Exemple d’application
- Ford analyse les données d’interaction au cours
de la conduite pour plus de confort.
- Konami utilise des Zeta de Go requis par internet
pour analyser et améliorer la réalité du jeux.
- Walmart utilise les données des clients (achats et
profile) pour améliorer les campagnes de marketing
et le ciblage produit-client.
Big Data : Exemple d’application
- Facebook utilisent les Social Data pour la
recomendation et la categorisation des ads.
- Google de même utilise les données collectées
des machines via les Cookies du navigateur pour
améliorer le ciblage ads/user.
- Obama a réussi sa campagne électorale 2012 à l’
aide d’une équipe spécialisée en Big Data.

Weitere ähnliche Inhalte

Was ist angesagt?

Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013ADBS
 
les 4 clés pour saisir les opportunités du big data
les 4 clés pour saisir les opportunités du big datales 4 clés pour saisir les opportunités du big data
les 4 clés pour saisir les opportunités du big dataJuvénal CHOKOGOUE
 
1-2-Economie-Georgios Fradelos Big Data et évolution des Big Data-3
1-2-Economie-Georgios Fradelos Big Data et évolution des Big Data-31-2-Economie-Georgios Fradelos Big Data et évolution des Big Data-3
1-2-Economie-Georgios Fradelos Big Data et évolution des Big Data-3Georgios Fradelos
 
Point de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataPoint de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataNicolas Peene
 
Baina bigdata introduction 2016
Baina bigdata introduction 2016Baina bigdata introduction 2016
Baina bigdata introduction 2016Karim Baïna
 
OpenData - BigData - OpenSource : l'inévitable convergence
OpenData - BigData - OpenSource : l'inévitable convergenceOpenData - BigData - OpenSource : l'inévitable convergence
OpenData - BigData - OpenSource : l'inévitable convergenceExcelerate Systems
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applicationsAffinity Engine
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Philippe METAYER
 
Présentation Big Data DFCG
Présentation Big Data DFCGPrésentation Big Data DFCG
Présentation Big Data DFCGMicropole Group
 
Le Big Data transforme en profondeur le monde de la Banque et de l’Assurance
Le Big Data transforme en profondeur le monde de la Banque et de l’AssuranceLe Big Data transforme en profondeur le monde de la Banque et de l’Assurance
Le Big Data transforme en profondeur le monde de la Banque et de l’AssuranceAbdessatar Hammedi
 
Big Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache HadoopBig Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache Hadoophajlaoui jaleleddine
 
Intro au Big Data & Machine Learning
Intro au Big Data & Machine LearningIntro au Big Data & Machine Learning
Intro au Big Data & Machine LearningEric Daoud
 
Livre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBGLivre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBGMargarita Zlatkova
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1Amal Abid
 
Qu'est ce que le big data - Présentation AIMM 30 octobre
Qu'est ce que le big data - Présentation AIMM 30 octobreQu'est ce que le big data - Présentation AIMM 30 octobre
Qu'est ce que le big data - Présentation AIMM 30 octobreSimon Boucher
 
2017 : l'année de la "data territoriale" ?
2017 : l'année de la "data territoriale" ?2017 : l'année de la "data territoriale" ?
2017 : l'année de la "data territoriale" ?Jacques PRIOL
 

Was ist angesagt? (20)

Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013
 
les 4 clés pour saisir les opportunités du big data
les 4 clés pour saisir les opportunités du big datales 4 clés pour saisir les opportunités du big data
les 4 clés pour saisir les opportunités du big data
 
1-2-Economie-Georgios Fradelos Big Data et évolution des Big Data-3
1-2-Economie-Georgios Fradelos Big Data et évolution des Big Data-31-2-Economie-Georgios Fradelos Big Data et évolution des Big Data-3
1-2-Economie-Georgios Fradelos Big Data et évolution des Big Data-3
 
Point de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataPoint de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big Data
 
Baina bigdata introduction 2016
Baina bigdata introduction 2016Baina bigdata introduction 2016
Baina bigdata introduction 2016
 
Big data : défis & technologies
Big data : défis & technologiesBig data : défis & technologies
Big data : défis & technologies
 
OpenData - BigData - OpenSource : l'inévitable convergence
OpenData - BigData - OpenSource : l'inévitable convergenceOpenData - BigData - OpenSource : l'inévitable convergence
OpenData - BigData - OpenSource : l'inévitable convergence
 
Analyse spatiale en Big data
Analyse spatiale en Big dataAnalyse spatiale en Big data
Analyse spatiale en Big data
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applications
 
Parcours Big Data @ Cetic (6 mai 2014)
Parcours Big Data @ Cetic (6 mai 2014)Parcours Big Data @ Cetic (6 mai 2014)
Parcours Big Data @ Cetic (6 mai 2014)
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
 
Présentation Big Data DFCG
Présentation Big Data DFCGPrésentation Big Data DFCG
Présentation Big Data DFCG
 
Le Big Data transforme en profondeur le monde de la Banque et de l’Assurance
Le Big Data transforme en profondeur le monde de la Banque et de l’AssuranceLe Big Data transforme en profondeur le monde de la Banque et de l’Assurance
Le Big Data transforme en profondeur le monde de la Banque et de l’Assurance
 
Big Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache HadoopBig Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache Hadoop
 
Intro au Big Data & Machine Learning
Intro au Big Data & Machine LearningIntro au Big Data & Machine Learning
Intro au Big Data & Machine Learning
 
Livre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBGLivre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBG
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Qu'est ce que le big data - Présentation AIMM 30 octobre
Qu'est ce que le big data - Présentation AIMM 30 octobreQu'est ce que le big data - Présentation AIMM 30 octobre
Qu'est ce que le big data - Présentation AIMM 30 octobre
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
2017 : l'année de la "data territoriale" ?
2017 : l'année de la "data territoriale" ?2017 : l'année de la "data territoriale" ?
2017 : l'année de la "data territoriale" ?
 

Andere mochten auch

Big Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesBig Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesJean-Michel Franco
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataLilia Sfaxi
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessVincent de Stoecklin
 
Mandala2008 5 Básico
Mandala2008 5 BásicoMandala2008 5 Básico
Mandala2008 5 Básiconvigorenar
 
Hablemos sobre requisitos - Jordi Borja - Visures Solutions
Hablemos sobre requisitos - Jordi Borja - Visures SolutionsHablemos sobre requisitos - Jordi Borja - Visures Solutions
Hablemos sobre requisitos - Jordi Borja - Visures SolutionsVisure Solutions
 
Exercice de sécurité
Exercice de sécuritéExercice de sécurité
Exercice de sécuritéPhiloup369
 
Las mujeres que_nunca_sonrien
Las mujeres que_nunca_sonrienLas mujeres que_nunca_sonrien
Las mujeres que_nunca_sonrienLUZ M.
 
Webassadors - Mixology #11 - Actu' Web de la semaine du 15.09.14
Webassadors - Mixology #11 - Actu' Web de la semaine du 15.09.14Webassadors - Mixology #11 - Actu' Web de la semaine du 15.09.14
Webassadors - Mixology #11 - Actu' Web de la semaine du 15.09.14Webassadors
 
Presentacionmajuana
PresentacionmajuanaPresentacionmajuana
Presentacionmajuanamajucp
 
Paca observation steinfo_05_04_2012_sc
Paca observation steinfo_05_04_2012_scPaca observation steinfo_05_04_2012_sc
Paca observation steinfo_05_04_2012_scJezabel Roullee
 
Hollande a la_bastille_le_6_mai_2012
Hollande a la_bastille_le_6_mai_2012Hollande a la_bastille_le_6_mai_2012
Hollande a la_bastille_le_6_mai_2012JPV94470
 
Valorisation des hébergements et stratégie régionale
Valorisation des hébergements et stratégie régionaleValorisation des hébergements et stratégie régionale
Valorisation des hébergements et stratégie régionaleOffice de Tourisme
 
Presentació Bcn Nord
Presentació Bcn NordPresentació Bcn Nord
Presentació Bcn Nordbcntalks
 
De l'Afrique à l'Alaska - Chapitres 1 & 2
De l'Afrique à l'Alaska - Chapitres 1 & 2De l'Afrique à l'Alaska - Chapitres 1 & 2
De l'Afrique à l'Alaska - Chapitres 1 & 2InfosCollège
 
La mujerenlaeduacionenchile
La mujerenlaeduacionenchileLa mujerenlaeduacionenchile
La mujerenlaeduacionenchileJessica Leal
 

Andere mochten auch (20)

BigData et Hadoop
BigData et HadoopBigData et Hadoop
BigData et Hadoop
 
Big Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesBig Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendances
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
 
Mandala2008 5 Básico
Mandala2008 5 BásicoMandala2008 5 Básico
Mandala2008 5 Básico
 
Hablemos sobre requisitos - Jordi Borja - Visures Solutions
Hablemos sobre requisitos - Jordi Borja - Visures SolutionsHablemos sobre requisitos - Jordi Borja - Visures Solutions
Hablemos sobre requisitos - Jordi Borja - Visures Solutions
 
Exercice de sécurité
Exercice de sécuritéExercice de sécurité
Exercice de sécurité
 
Las mujeres que_nunca_sonrien
Las mujeres que_nunca_sonrienLas mujeres que_nunca_sonrien
Las mujeres que_nunca_sonrien
 
avances
avancesavances
avances
 
Webassadors - Mixology #11 - Actu' Web de la semaine du 15.09.14
Webassadors - Mixology #11 - Actu' Web de la semaine du 15.09.14Webassadors - Mixology #11 - Actu' Web de la semaine du 15.09.14
Webassadors - Mixology #11 - Actu' Web de la semaine du 15.09.14
 
Ppt registro
Ppt   registroPpt   registro
Ppt registro
 
Presentacionmajuana
PresentacionmajuanaPresentacionmajuana
Presentacionmajuana
 
Paca observation steinfo_05_04_2012_sc
Paca observation steinfo_05_04_2012_scPaca observation steinfo_05_04_2012_sc
Paca observation steinfo_05_04_2012_sc
 
memoire
memoire memoire
memoire
 
Hollande a la_bastille_le_6_mai_2012
Hollande a la_bastille_le_6_mai_2012Hollande a la_bastille_le_6_mai_2012
Hollande a la_bastille_le_6_mai_2012
 
Valorisation des hébergements et stratégie régionale
Valorisation des hébergements et stratégie régionaleValorisation des hébergements et stratégie régionale
Valorisation des hébergements et stratégie régionale
 
Presentació Bcn Nord
Presentació Bcn NordPresentació Bcn Nord
Presentació Bcn Nord
 
De l'Afrique à l'Alaska - Chapitres 1 & 2
De l'Afrique à l'Alaska - Chapitres 1 & 2De l'Afrique à l'Alaska - Chapitres 1 & 2
De l'Afrique à l'Alaska - Chapitres 1 & 2
 
Misiónyvison
MisiónyvisonMisiónyvison
Misiónyvison
 
La mujerenlaeduacionenchile
La mujerenlaeduacionenchileLa mujerenlaeduacionenchile
La mujerenlaeduacionenchile
 

Ähnlich wie Big Data

Introduction au BigData.pdf
Introduction au BigData.pdfIntroduction au BigData.pdf
Introduction au BigData.pdfZkSadrati
 
Introduction au BigData.pdf
Introduction au BigData.pdfIntroduction au BigData.pdf
Introduction au BigData.pdfZkSadrati
 
Mémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociauxMémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociauxChloé Marty
 
EuraTech Trends : Big Data
EuraTech Trends : Big DataEuraTech Trends : Big Data
EuraTech Trends : Big DataEuraTechnologies
 
BigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceBigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceExcelerate Systems
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel businessMouhsine LAKHDISSI
 
Big data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesBig data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesKezhan SHI
 
Les technologies big data avec speech commentaries
Les technologies big data avec speech commentariesLes technologies big data avec speech commentaries
Les technologies big data avec speech commentariesRima Jamli Faidi
 
Spad big data - sfds - 2016
Spad   big data - sfds - 2016Spad   big data - sfds - 2016
Spad big data - sfds - 2016Julien BLAIZE
 
Intelligence Artificielle : quelles conséquences pour l'imprimerie et le web-...
Intelligence Artificielle : quelles conséquences pour l'imprimerie et le web-...Intelligence Artificielle : quelles conséquences pour l'imprimerie et le web-...
Intelligence Artificielle : quelles conséquences pour l'imprimerie et le web-...Ludovic Martin
 
Tech connaissance 2012
Tech connaissance 2012Tech connaissance 2012
Tech connaissance 2012VeilleMag
 
La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)Nicolae Sfetcu
 
Big data et machine Learning
Big data et machine Learning Big data et machine Learning
Big data et machine Learning ichrafkhalfaoui
 
Matinée 01 Big Data
Matinée 01 Big DataMatinée 01 Big Data
Matinée 01 Big DataEvenements01
 

Ähnlich wie Big Data (20)

Introduction au BigData.pdf
Introduction au BigData.pdfIntroduction au BigData.pdf
Introduction au BigData.pdf
 
Introduction au BigData.pdf
Introduction au BigData.pdfIntroduction au BigData.pdf
Introduction au BigData.pdf
 
Mémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociauxMémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociaux
 
EuraTech Trends : Big Data
EuraTech Trends : Big DataEuraTech Trends : Big Data
EuraTech Trends : Big Data
 
BigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceBigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems France
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node
 
Big data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesBig data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuaires
 
Les technologies big data avec speech commentaries
Les technologies big data avec speech commentariesLes technologies big data avec speech commentaries
Les technologies big data avec speech commentaries
 
Big data
Big dataBig data
Big data
 
Technologies pour le Big Data
Technologies pour le Big DataTechnologies pour le Big Data
Technologies pour le Big Data
 
Tech connaissance 2012
Tech connaissance 2012Tech connaissance 2012
Tech connaissance 2012
 
Spad big data - sfds - 2016
Spad   big data - sfds - 2016Spad   big data - sfds - 2016
Spad big data - sfds - 2016
 
Intelligence Artificielle : quelles conséquences pour l'imprimerie et le web-...
Intelligence Artificielle : quelles conséquences pour l'imprimerie et le web-...Intelligence Artificielle : quelles conséquences pour l'imprimerie et le web-...
Intelligence Artificielle : quelles conséquences pour l'imprimerie et le web-...
 
Hadoop et le big data
Hadoop et le big dataHadoop et le big data
Hadoop et le big data
 
Tech connaissance 2012
Tech connaissance 2012Tech connaissance 2012
Tech connaissance 2012
 
La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)
 
Big data et machine Learning
Big data et machine Learning Big data et machine Learning
Big data et machine Learning
 
Big data
Big dataBig data
Big data
 
Matinée 01 Big Data
Matinée 01 Big DataMatinée 01 Big Data
Matinée 01 Big Data
 

Mehr von Ali Ben Messaoud

Event Based Network Monitoring System with FloodLight SDN Controller and Open...
Event Based Network Monitoring System with FloodLight SDN Controller and Open...Event Based Network Monitoring System with FloodLight SDN Controller and Open...
Event Based Network Monitoring System with FloodLight SDN Controller and Open...Ali Ben Messaoud
 
Olympex : projet de centre sportif
Olympex : projet de centre sportifOlympex : projet de centre sportif
Olympex : projet de centre sportifAli Ben Messaoud
 
Outils de gestions de versions
Outils de gestions de versionsOutils de gestions de versions
Outils de gestions de versionsAli Ben Messaoud
 

Mehr von Ali Ben Messaoud (7)

Event Based Network Monitoring System with FloodLight SDN Controller and Open...
Event Based Network Monitoring System with FloodLight SDN Controller and Open...Event Based Network Monitoring System with FloodLight SDN Controller and Open...
Event Based Network Monitoring System with FloodLight SDN Controller and Open...
 
Olympex : projet de centre sportif
Olympex : projet de centre sportifOlympex : projet de centre sportif
Olympex : projet de centre sportif
 
Cloud Vision
Cloud Vision Cloud Vision
Cloud Vision
 
Cloud computing
Cloud computingCloud computing
Cloud computing
 
Outils de gestions de versions
Outils de gestions de versionsOutils de gestions de versions
Outils de gestions de versions
 
SSH : Secure Shell
SSH : Secure ShellSSH : Secure Shell
SSH : Secure Shell
 
Eclipse Impress
Eclipse ImpressEclipse Impress
Eclipse Impress
 

Big Data

  • 2. Plan - Big Data? - Statistiques - Les 3V de Big Data - Enjeux à venir - Comment exploiter ces Big Data? - Hadoop & ses alternatives - Exemple d’utilisation
  • 3. Big Data, Qu'est-ce que c'est ? Big Data = 7 lettres … Il s'agit d'une problématique engendrée par la grande quantité de données publiées sur Internet : des profils, ebooks, videos, musique, conversations en ligne, des flux de sites d'actualités… Aujourd’hui, Internet est fait de tous les types de données.
  • 4. Qu'est-ce que c'est maintenant ? Autrement que les 7 lettres, Big Data est la combinaison de l'infrastructure, les algorithmes et les méthodes de visualisations utilisées pour donner un sens sur l'utilisateur et les données générées d’une machine ou un système.
  • 5. D'où les Big Data proviennent-elles? Social data : Tweets, upload de vidéos sur Youtube et images sur Flickr.. Transactional data : paiement en ligne, factures, enregistrements de livraison … Machine data : données recueillies à partir des équipements industriel (journalisation et surveillance) …
  • 6. Les formes de Big Data? - Générée par l’utilisateur - Générée par une machine ou une application - Structurée (XML/ JSON/ Tabulations ….) - Non structuré (texte brute)
  • 7. Stats 1971 : le premier email est envoyé ‘QUERTYUIO’ en 10 octets. 1972 : Internet est présenté au grand public. 2010 : près de 1000 milliards Go sur Internet. 2015 : Estimation de 8 Zo, ~ 8000 milliards Go, ~ 250 milliards de DVD.
  • 8. Les 3V de Big Data
  • 9. Que peuvent les Big Data engendrer ? - Dans un réseau, on peut surveiller et voir le trafic mais aussi qui veut attaquer notre SI... - Qui ont acheté un tel produit d’un e-Shop, mais aussi des stats sur leurs profils ()... - Les erreurs d’une application, mais aussi les vraies causes (qui/ pourquoi/ quand)? .. - Les effets d’un utilisateur dans une application…
  • 10. Quels enjeux à venir ? Comment exploiter au mieux cet immense potentiel ? >>>> Créer des outils pour analyser, trier puis exploiter ces données au quotidien. Et ce en temps réel du futur d'Internet. C'est probablement l'un des plus grands défis informatiques des prochaines années.
  • 11. Comment exploiter ces Big Data? La notion de Big Data est intimement lié à la capacité de traitement de gros volume. C’est pourquoi Google a inventé l’algorithme de MapReduce en 2004 afin de distribuer des traitements sur un ensemble de machines et faire face aux problèmes d’exploitation de Big Data.
  • 12. Hadoop : Naissance Les leader du Web Facebook, Twitter et Yahoo ont confronté le même problème que Google. Ils ont choisi alors de contribuer au développement de MapReduce, d’où le framework Hadoop vient d’être crée, sous la gouvernance de la fondation Apache en 2008.
  • 13. Hadoop : Concept HDFS(Hadoop Distributed File System) un système de fichiers virtuel sous forme de noeuds de données. MapReduce (map tasks then reduction by grouping) un modèle de programmation parallèle permettant de traiter de grands volumes de données.
  • 14. Les alternatives de Hadoop LINQ/Dryad de Microsoft utilisé par Bing Pig de Yahoo HBase de Facebook Azkaban LinkedIn Cassandra
  • 15. Big Data : Exemple d’application - Ford analyse les données d’interaction au cours de la conduite pour plus de confort. - Konami utilise des Zeta de Go requis par internet pour analyser et améliorer la réalité du jeux. - Walmart utilise les données des clients (achats et profile) pour améliorer les campagnes de marketing et le ciblage produit-client.
  • 16. Big Data : Exemple d’application - Facebook utilisent les Social Data pour la recomendation et la categorisation des ads. - Google de même utilise les données collectées des machines via les Cookies du navigateur pour améliorer le ciblage ads/user. - Obama a réussi sa campagne électorale 2012 à l’ aide d’une équipe spécialisée en Big Data.