SlideShare ist ein Scribd-Unternehmen logo
1 von 17
Les journées
SQL Server 2014
Un événement organisé par GUSS
Les journées
SQL Server 2014
Un événement organisé par GUSS
Data mining
Avec SSAS et Azure ML
Patrice Harel
Merci à nos sponsors
4
5
Objectifs
Architecture
Data mining
Avec SSAS
Avec Azure ML
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
5
6
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
De ce dont nous allons discuter
– Concepts généraux du data mining
– La mise en place avec AS (basique)
– La mise en place avec Azur ML (basique)
Ce que nous n’aborderons pas en détail
– Comment choisir son(ses) algorithme(s)
– Le processus itératif
– Le reporting
– Les performances
Avec un cadre, un format différent
7
Accident de la route (2006-2011), data.gouv.fr
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Catégorie de
route
Luminosité
Type
d’agglomération
Organisme
gouvernemental
Conditions
atmosphériques
Type de collision
Informations
géographiques
(commune, …)
Situation de
l’accident
Régime de
circulation
Nombre de
voies de
circulation
Catégorie du
véhicule
Nombre de
morts
Nombre de
blessés
Nombre
d’hospitalisés
…
8
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Pour les besoins de la session
Fichiers
plats
SSIS SQL SSAS
Mining
SSAS DM
AML
9
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Data mining Machine Learning
Appliquer des algorithmes de recherche de
modèles (patterns) sur d’importants volume
de données
Se réfère à la partie algorithme du data
mining
Trouver des relations supplémentaires, faire
de la prédiction, intelligible pour un humain
« Désigne les ajustements d’un système par
lui-même dans le sens ou ce système pourra
effectuer une même tâche une seconde fois
mais de manière plus efficace »
Né des besoins sur les bases de données Né des besoins en intelligence artificielle
Exploitent des données
10
Se poser les bonnes questions, définir ses objectifs
– Quels facteurs de risques sont les plus importants?
– En fonction des paramètres, déterminer si il y aura des
morts/blessés
– Définir la variable à expliquer, les variables explicatives
– Définir la population cible
Par rapport à la BI
- Vient en complément
- Mettre à disposition des données utiles
- Utiliser les statistiques descriptives
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
11
Scinder la source de données en deux
– Un échantillon de travail
– Un échantillon de validation
Analyses descriptives, analyses prédictives
– Clustering, Séquence
– Analyse discriminante, régression logistique/linéaire
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
12
Cycle de développement
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Choix du sujet,
définition des
objectifs
Inventaire des
données
disponibles
Extraire,
transformer,
corriger et
rassembler les
données
Statistiques
descriptives Choix de
l’algorithme
Validation du
modèle,
déploiement
Fiabilité (aberration)
Disponibilité/Quantité
Pondération
Pertinence
Corrélation (trop ou
trop peu)
Par itérations
En fonction des
objectifs
Quelle cible?
Quels informations
pour expliquer?
Sur quelle période?
13
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
La problématique : Puis-je prédire, en fonction des
caractéristiques d’un accident si il y aura ou non
des morts/hospitalisés?
Création d’une nouvelle variable : EstGrave
14
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Objets SSAS DM
Structure
Model
Case / Nested
Other Content Type
Key
Data Source
Inputs / Outputs
Algorithm
15
Objets AML
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Experiment
Des trucs
Data Set
Encore des trucs
Model
16
ON CONCLUSION CONCLUSION CONCLUSION CONCLUSION CONCLUSION CONCLUSION CON
SSAS AML
Intégration à une chaîne décisionnelle classique
Interface de développement
Ouverture, souplesse
Performances
Avenir (pour Microsoft)
Avenir (pour la cause)
#JSS2014

Weitere ähnliche Inhalte

Andere mochten auch

Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing
 

Andere mochten auch (15)

Valtech - Réalité virtuelle : analyses, perspectives, démonstrations
Valtech - Réalité virtuelle : analyses, perspectives, démonstrationsValtech - Réalité virtuelle : analyses, perspectives, démonstrations
Valtech - Réalité virtuelle : analyses, perspectives, démonstrations
 
Valtech - Décollage d’une plateforme digitale vers le Cloud Azure
Valtech - Décollage d’une plateforme digitale vers le Cloud AzureValtech - Décollage d’une plateforme digitale vers le Cloud Azure
Valtech - Décollage d’une plateforme digitale vers le Cloud Azure
 
Valtech - DOs and DON'Ts of Social Analytics
Valtech - DOs and DON'Ts of Social AnalyticsValtech - DOs and DON'Ts of Social Analytics
Valtech - DOs and DON'Ts of Social Analytics
 
Valtech - La Fidélisation à l’ère du digital, quel potentiel pour le prépayé !
Valtech - La Fidélisation à l’ère du digital, quel potentiel pour le prépayé !Valtech - La Fidélisation à l’ère du digital, quel potentiel pour le prépayé !
Valtech - La Fidélisation à l’ère du digital, quel potentiel pour le prépayé !
 
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entreprise
 
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
 
20141023 social media & e government infosession
20141023 social media & e government   infosession20141023 social media & e government   infosession
20141023 social media & e government infosession
 
UX at York: starting small and scaling up (#nclxux)
UX at York: starting small and scaling up (#nclxux)UX at York: starting small and scaling up (#nclxux)
UX at York: starting small and scaling up (#nclxux)
 
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMP
 
Tendances digitales et créatives // Cannes Lions 2015
Tendances digitales et créatives // Cannes Lions 2015Tendances digitales et créatives // Cannes Lions 2015
Tendances digitales et créatives // Cannes Lions 2015
 
Valtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raisonValtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raison
 
CES 2016 - Décryptage et revue des tendances
CES 2016 - Décryptage et revue des tendancesCES 2016 - Décryptage et revue des tendances
CES 2016 - Décryptage et revue des tendances
 
1ère Présentation Atelier Vision par ordinateur
1ère Présentation Atelier Vision par ordinateur1ère Présentation Atelier Vision par ordinateur
1ère Présentation Atelier Vision par ordinateur
 
UX, ethnography and possibilities: for Libraries, Museums and Archives
UX, ethnography and possibilities: for Libraries, Museums and ArchivesUX, ethnography and possibilities: for Libraries, Museums and Archives
UX, ethnography and possibilities: for Libraries, Museums and Archives
 
Visual Design with Data
Visual Design with DataVisual Design with Data
Visual Design with Data
 

Ähnlich wie JSS2014 – Azure ML et Data Mining SSAS

Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouse
Alexandre Equoy
 
B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...
B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...
B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...
CERTyou Formation
 
B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...
B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...
B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...
CERTyou Formation
 
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
OCTO Technology
 
0 a032g formation-modeles-predictifs-avec-ibm-spss-modeler
0 a032g formation-modeles-predictifs-avec-ibm-spss-modeler0 a032g formation-modeles-predictifs-avec-ibm-spss-modeler
0 a032g formation-modeles-predictifs-avec-ibm-spss-modeler
CERTyou Formation
 

Ähnlich wie JSS2014 – Azure ML et Data Mining SSAS (20)

IBM Information Management - Pas de décision de qualité sans informations de ...
IBM Information Management - Pas de décision de qualité sans informations de ...IBM Information Management - Pas de décision de qualité sans informations de ...
IBM Information Management - Pas de décision de qualité sans informations de ...
 
Business Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouseBusiness Intelligence : introduction to datawarehouse
Business Intelligence : introduction to datawarehouse
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
ASG - Maitriser ses donnees dans le cadre reglementaire - Data forum MICROPO...
ASG -  Maitriser ses donnees dans le cadre reglementaire - Data forum MICROPO...ASG -  Maitriser ses donnees dans le cadre reglementaire - Data forum MICROPO...
ASG - Maitriser ses donnees dans le cadre reglementaire - Data forum MICROPO...
 
Apprentissage automatique avec RapidMiner
Apprentissage automatique avec RapidMinerApprentissage automatique avec RapidMiner
Apprentissage automatique avec RapidMiner
 
Ritme data solutions : Plateforme Data Science COsMO
Ritme data solutions : Plateforme Data Science COsMORitme data solutions : Plateforme Data Science COsMO
Ritme data solutions : Plateforme Data Science COsMO
 
Livre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakes
 
B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...
B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...
B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...
 
B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...
B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...
B5252 g formation-ibm-cognos-framework-manager-concevoir-des-modeles-de-metad...
 
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...
 
SQL Saturday Paris 2015 - Polybase
SQL Saturday Paris 2015 - PolybaseSQL Saturday Paris 2015 - Polybase
SQL Saturday Paris 2015 - Polybase
 
EXL Group - Offre Data Science
EXL Group - Offre Data ScienceEXL Group - Offre Data Science
EXL Group - Offre Data Science
 
Pj hug 07_04_2016
Pj hug 07_04_2016Pj hug 07_04_2016
Pj hug 07_04_2016
 
cours-intro-base-donnees.pdf
cours-intro-base-donnees.pdfcours-intro-base-donnees.pdf
cours-intro-base-donnees.pdf
 
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
 
No Sql - Olivier Mallassi - September 2010
No Sql - Olivier Mallassi - September 2010No Sql - Olivier Mallassi - September 2010
No Sql - Olivier Mallassi - September 2010
 
Cloud et BI, quelle architecture pour 2014 ?
Cloud et BI, quelle architecture pour 2014 ?Cloud et BI, quelle architecture pour 2014 ?
Cloud et BI, quelle architecture pour 2014 ?
 
0 a032g formation-modeles-predictifs-avec-ibm-spss-modeler
0 a032g formation-modeles-predictifs-avec-ibm-spss-modeler0 a032g formation-modeles-predictifs-avec-ibm-spss-modeler
0 a032g formation-modeles-predictifs-avec-ibm-spss-modeler
 
Francois Paulus Semsoft Big Data & analyse
Francois Paulus Semsoft Big Data & analyseFrancois Paulus Semsoft Big Data & analyse
Francois Paulus Semsoft Big Data & analyse
 
JSS2014 – Cloud et BI, quelle architecture pour 2014 ?
JSS2014 – Cloud et BI, quelle architecture pour 2014 ?JSS2014 – Cloud et BI, quelle architecture pour 2014 ?
JSS2014 – Cloud et BI, quelle architecture pour 2014 ?
 

Mehr von GUSS

Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)
Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)
Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)
GUSS
 

Mehr von GUSS (20)

GUSS - Les IO dans SQL Server (en partenariat avec DataCore)
GUSS - Les IO dans SQL Server (en partenariat avec DataCore)GUSS - Les IO dans SQL Server (en partenariat avec DataCore)
GUSS - Les IO dans SQL Server (en partenariat avec DataCore)
 
Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)
Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)
Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)
 
JSS2015 - Machine Learning like a boss
JSS2015 - Machine Learning like a bossJSS2015 - Machine Learning like a boss
JSS2015 - Machine Learning like a boss
 
GUSS - CRITEO Meetup Scale SQL for the Web
GUSS - CRITEO Meetup Scale SQL for the WebGUSS - CRITEO Meetup Scale SQL for the Web
GUSS - CRITEO Meetup Scale SQL for the Web
 
JSS2015 - Keynote jour 2
JSS2015 - Keynote jour 2JSS2015 - Keynote jour 2
JSS2015 - Keynote jour 2
 
JSS2015 - Keynote jour 1
JSS2015 - Keynote jour 1JSS2015 - Keynote jour 1
JSS2015 - Keynote jour 1
 
[JSS2015] Azure SQL Data Warehouse - Azure Data Lake
[JSS2015] Azure SQL Data Warehouse - Azure Data Lake[JSS2015] Azure SQL Data Warehouse - Azure Data Lake
[JSS2015] Azure SQL Data Warehouse - Azure Data Lake
 
[JSS2015] Power BI Dev
[JSS2015] Power BI Dev[JSS2015] Power BI Dev
[JSS2015] Power BI Dev
 
[JSS2015] Nouveautés SQL Server 2016:Sécurité,Temporal & Stretch Tables
[JSS2015] Nouveautés SQL Server 2016:Sécurité,Temporal & Stretch Tables[JSS2015] Nouveautés SQL Server 2016:Sécurité,Temporal & Stretch Tables
[JSS2015] Nouveautés SQL Server 2016:Sécurité,Temporal & Stretch Tables
 
[JSS2015] Query Store
[JSS2015] Query Store[JSS2015] Query Store
[JSS2015] Query Store
 
[JSS2015] 3 DMV's pour evaluer les indexs
[JSS2015] 3 DMV's pour evaluer les indexs[JSS2015] 3 DMV's pour evaluer les indexs
[JSS2015] 3 DMV's pour evaluer les indexs
 
[JSS2015] Power BI: Nouveautés archi et hybrides
[JSS2015] Power BI: Nouveautés archi et hybrides[JSS2015] Power BI: Nouveautés archi et hybrides
[JSS2015] Power BI: Nouveautés archi et hybrides
 
[JSS2015] Infra bi#4 - le scale out
[JSS2015] Infra bi#4 - le scale out[JSS2015] Infra bi#4 - le scale out
[JSS2015] Infra bi#4 - le scale out
 
[JSS2015] In memory and operational analytics
[JSS2015] In memory and operational analytics[JSS2015] In memory and operational analytics
[JSS2015] In memory and operational analytics
 
[JSS2015] Eradiction des deadlocks
[JSS2015] Eradiction des deadlocks[JSS2015] Eradiction des deadlocks
[JSS2015] Eradiction des deadlocks
 
[JSS2015] Architectures Lambda avec Azure Stream Analytics
[JSS2015] Architectures Lambda avec Azure Stream Analytics [JSS2015] Architectures Lambda avec Azure Stream Analytics
[JSS2015] Architectures Lambda avec Azure Stream Analytics
 
[JSS2015] - Azure automation
[JSS2015] - Azure automation[JSS2015] - Azure automation
[JSS2015] - Azure automation
 
[JSS2015] AlwaysOn 2016
[JSS2015] AlwaysOn 2016[JSS2015] AlwaysOn 2016
[JSS2015] AlwaysOn 2016
 
[JSS2015] - Document db et nosql
[JSS2015] - Document db et nosql[JSS2015] - Document db et nosql
[JSS2015] - Document db et nosql
 
[JSS2015] x events
[JSS2015] x events[JSS2015] x events
[JSS2015] x events
 

JSS2014 – Azure ML et Data Mining SSAS

  • 1. Les journées SQL Server 2014 Un événement organisé par GUSS
  • 2. Les journées SQL Server 2014 Un événement organisé par GUSS Data mining Avec SSAS et Azure ML Patrice Harel
  • 3. Merci à nos sponsors
  • 4. 4
  • 5. 5 Objectifs Architecture Data mining Avec SSAS Avec Azure ML POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML 5
  • 6. 6 POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML De ce dont nous allons discuter – Concepts généraux du data mining – La mise en place avec AS (basique) – La mise en place avec Azur ML (basique) Ce que nous n’aborderons pas en détail – Comment choisir son(ses) algorithme(s) – Le processus itératif – Le reporting – Les performances Avec un cadre, un format différent
  • 7. 7 Accident de la route (2006-2011), data.gouv.fr POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Catégorie de route Luminosité Type d’agglomération Organisme gouvernemental Conditions atmosphériques Type de collision Informations géographiques (commune, …) Situation de l’accident Régime de circulation Nombre de voies de circulation Catégorie du véhicule Nombre de morts Nombre de blessés Nombre d’hospitalisés …
  • 8. 8 POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Pour les besoins de la session Fichiers plats SSIS SQL SSAS Mining SSAS DM AML
  • 9. 9 POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Data mining Machine Learning Appliquer des algorithmes de recherche de modèles (patterns) sur d’importants volume de données Se réfère à la partie algorithme du data mining Trouver des relations supplémentaires, faire de la prédiction, intelligible pour un humain « Désigne les ajustements d’un système par lui-même dans le sens ou ce système pourra effectuer une même tâche une seconde fois mais de manière plus efficace » Né des besoins sur les bases de données Né des besoins en intelligence artificielle Exploitent des données
  • 10. 10 Se poser les bonnes questions, définir ses objectifs – Quels facteurs de risques sont les plus importants? – En fonction des paramètres, déterminer si il y aura des morts/blessés – Définir la variable à expliquer, les variables explicatives – Définir la population cible Par rapport à la BI - Vient en complément - Mettre à disposition des données utiles - Utiliser les statistiques descriptives POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
  • 11. 11 Scinder la source de données en deux – Un échantillon de travail – Un échantillon de validation Analyses descriptives, analyses prédictives – Clustering, Séquence – Analyse discriminante, régression logistique/linéaire POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
  • 12. 12 Cycle de développement POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Choix du sujet, définition des objectifs Inventaire des données disponibles Extraire, transformer, corriger et rassembler les données Statistiques descriptives Choix de l’algorithme Validation du modèle, déploiement Fiabilité (aberration) Disponibilité/Quantité Pondération Pertinence Corrélation (trop ou trop peu) Par itérations En fonction des objectifs Quelle cible? Quels informations pour expliquer? Sur quelle période?
  • 13. 13 POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML La problématique : Puis-je prédire, en fonction des caractéristiques d’un accident si il y aura ou non des morts/hospitalisés? Création d’une nouvelle variable : EstGrave
  • 14. 14 POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Objets SSAS DM Structure Model Case / Nested Other Content Type Key Data Source Inputs / Outputs Algorithm
  • 15. 15 Objets AML POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML Experiment Des trucs Data Set Encore des trucs Model
  • 16. 16 ON CONCLUSION CONCLUSION CONCLUSION CONCLUSION CONCLUSION CONCLUSION CON SSAS AML Intégration à une chaîne décisionnelle classique Interface de développement Ouverture, souplesse Performances Avenir (pour Microsoft) Avenir (pour la cause)