SlideShare ist ein Scribd-Unternehmen logo
1 von 1
Downloaden Sie, um offline zu lesen
EC option Introduction à la Data Science (15HCM+15hTD)
Programme : Etre capable de mettre en œuvre des méthodes d’analyses statistiques
appliquées aux grosses volumétries de données. Comprendre les outils nécessaires, les
méthodologies usuelles, les concepts de parallélisation des calculs, prédictions temps réelles,
auto apprentissage, ...
1. Introduction à la data science : Contexte et histoire, Environnement technologique, Profil
du data scientists, Exemple d’application
2. Processus et fondamentaux : Les processus efficaces . Qu’est ce que la Big Data (Hadoop,
HDFS, Hive, …). Catégorisation des algorithmes (supervisés / non supervisés / relation /
recommandation)
3. SQL vs. NoSQL : Les bases de données relationnelles. Les bases de données orientées
colonnes. Les bases de données orientées graph. Comparaison des langages de requêtes
4. Intégration des données (ETL) : Qualité des données. Nettoyage, enrichissement.
Transformation, Factorisation. Automatisation (batch, temps réel) et processus de contrôle.
5. Analyse des données : Analyse exploratoire des données. Corrélation vs. Causalit. Les
modèles traditionnels (regression, …) et application dans l’environnement Big Data
6. Parallélisation et problématique associée : Que peut-on paralléliser ? Les nouveaux
modèles Big Data : Moteur de recommandation. Les nouveaux modèles Big Data : Look alike.
Les nouveaux modèles Big Data : Bandit Manchot.
7. Data visualisation : Qu’est ce que la Data visualisation ? Processus de mise en place de
visualisatio. Bénéfices
Logiciels d’appuis : R, Python, Neo4J

Weitere ähnliche Inhalte

Ähnlich wie Programme Mathématiques Appliquées et Modélisation Option Big Data-Polytech Lyon

Big data: NoSQL comme solution
Big data: NoSQL comme solutionBig data: NoSQL comme solution
Big data: NoSQL comme solution
JEMLI Fathi
 

Ähnlich wie Programme Mathématiques Appliquées et Modélisation Option Big Data-Polytech Lyon (20)

IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data Science
 
Introduction au Machine Learning
Introduction au Machine Learning Introduction au Machine Learning
Introduction au Machine Learning
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
 
introNoSQL.pdf
introNoSQL.pdfintroNoSQL.pdf
introNoSQL.pdf
 
AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoire
 
Social Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data TechnologySocial Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data Technology
 
Introduction au Big data
Introduction au Big data Introduction au Big data
Introduction au Big data
 
Base de donnees Avancees et Intro à NoSQL.ppt
Base de donnees Avancees et Intro à  NoSQL.pptBase de donnees Avancees et Intro à  NoSQL.ppt
Base de donnees Avancees et Intro à NoSQL.ppt
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
 
Big data
Big dataBig data
Big data
 
Intro_modul_et_SI_chapt0.ppt
Intro_modul_et_SI_chapt0.pptIntro_modul_et_SI_chapt0.ppt
Intro_modul_et_SI_chapt0.ppt
 
Morning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyMorning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide Academy
 
Presentation Dess Ebi
Presentation Dess EbiPresentation Dess Ebi
Presentation Dess Ebi
 
La "Data science" au service des entreprises
La "Data science" au service des entreprisesLa "Data science" au service des entreprises
La "Data science" au service des entreprises
 
Ch 01 poo
Ch 01 pooCh 01 poo
Ch 01 poo
 
Comprendre les Services du savoir
Comprendre les Services du savoirComprendre les Services du savoir
Comprendre les Services du savoir
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data Mining
 
Du Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processusDu Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processus
 
Big data: NoSQL comme solution
Big data: NoSQL comme solutionBig data: NoSQL comme solution
Big data: NoSQL comme solution
 
Introduction aux systèmes de recommandation part 3.pptx
Introduction aux systèmes  de recommandation part 3.pptxIntroduction aux systèmes  de recommandation part 3.pptx
Introduction aux systèmes de recommandation part 3.pptx
 

Programme Mathématiques Appliquées et Modélisation Option Big Data-Polytech Lyon

  • 1. EC option Introduction à la Data Science (15HCM+15hTD) Programme : Etre capable de mettre en œuvre des méthodes d’analyses statistiques appliquées aux grosses volumétries de données. Comprendre les outils nécessaires, les méthodologies usuelles, les concepts de parallélisation des calculs, prédictions temps réelles, auto apprentissage, ... 1. Introduction à la data science : Contexte et histoire, Environnement technologique, Profil du data scientists, Exemple d’application 2. Processus et fondamentaux : Les processus efficaces . Qu’est ce que la Big Data (Hadoop, HDFS, Hive, …). Catégorisation des algorithmes (supervisés / non supervisés / relation / recommandation) 3. SQL vs. NoSQL : Les bases de données relationnelles. Les bases de données orientées colonnes. Les bases de données orientées graph. Comparaison des langages de requêtes 4. Intégration des données (ETL) : Qualité des données. Nettoyage, enrichissement. Transformation, Factorisation. Automatisation (batch, temps réel) et processus de contrôle. 5. Analyse des données : Analyse exploratoire des données. Corrélation vs. Causalit. Les modèles traditionnels (regression, …) et application dans l’environnement Big Data 6. Parallélisation et problématique associée : Que peut-on paralléliser ? Les nouveaux modèles Big Data : Moteur de recommandation. Les nouveaux modèles Big Data : Look alike. Les nouveaux modèles Big Data : Bandit Manchot. 7. Data visualisation : Qu’est ce que la Data visualisation ? Processus de mise en place de visualisatio. Bénéfices Logiciels d’appuis : R, Python, Neo4J