Session des Journées SQL Server 2014 - Patrice Harel
---
L’objectif sera de comparer les comportements entre les résultats des modèles AML et ceux de SSAS.
6. 6
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
De ce dont nous allons discuter
– Concepts généraux du data mining
– La mise en place avec AS (basique)
– La mise en place avec Azur ML (basique)
Ce que nous n’aborderons pas en détail
– Comment choisir son(ses) algorithme(s)
– Le processus itératif
– Le reporting
– Les performances
Avec un cadre, un format différent
7. 7
Accident de la route (2006-2011), data.gouv.fr
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Catégorie de
route
Luminosité
Type
d’agglomération
Organisme
gouvernemental
Conditions
atmosphériques
Type de collision
Informations
géographiques
(commune, …)
Situation de
l’accident
Régime de
circulation
Nombre de
voies de
circulation
Catégorie du
véhicule
Nombre de
morts
Nombre de
blessés
Nombre
d’hospitalisés
…
9. 9
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Data mining Machine Learning
Appliquer des algorithmes de recherche de
modèles (patterns) sur d’importants volume
de données
Se réfère à la partie algorithme du data
mining
Trouver des relations supplémentaires, faire
de la prédiction, intelligible pour un humain
« Désigne les ajustements d’un système par
lui-même dans le sens ou ce système pourra
effectuer une même tâche une seconde fois
mais de manière plus efficace »
Né des besoins sur les bases de données Né des besoins en intelligence artificielle
Exploitent des données
10. 10
Se poser les bonnes questions, définir ses objectifs
– Quels facteurs de risques sont les plus importants?
– En fonction des paramètres, déterminer si il y aura des
morts/blessés
– Définir la variable à expliquer, les variables explicatives
– Définir la population cible
Par rapport à la BI
- Vient en complément
- Mettre à disposition des données utiles
- Utiliser les statistiques descriptives
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
11. 11
Scinder la source de données en deux
– Un échantillon de travail
– Un échantillon de validation
Analyses descriptives, analyses prédictives
– Clustering, Séquence
– Analyse discriminante, régression logistique/linéaire
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
12. 12
Cycle de développement
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Choix du sujet,
définition des
objectifs
Inventaire des
données
disponibles
Extraire,
transformer,
corriger et
rassembler les
données
Statistiques
descriptives Choix de
l’algorithme
Validation du
modèle,
déploiement
Fiabilité (aberration)
Disponibilité/Quantité
Pondération
Pertinence
Corrélation (trop ou
trop peu)
Par itérations
En fonction des
objectifs
Quelle cible?
Quels informations
pour expliquer?
Sur quelle période?
13. 13
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
La problématique : Puis-je prédire, en fonction des
caractéristiques d’un accident si il y aura ou non
des morts/hospitalisés?
Création d’une nouvelle variable : EstGrave
14. 14
POINTSABORDÉS OBJECTIFS ARCHITECTURE DATAMINING SSAS AML
Objets SSAS DM
Structure
Model
Case / Nested
Other Content Type
Key
Data Source
Inputs / Outputs
Algorithm
16. 16
ON CONCLUSION CONCLUSION CONCLUSION CONCLUSION CONCLUSION CONCLUSION CON
SSAS AML
Intégration à une chaîne décisionnelle classique
Interface de développement
Ouverture, souplesse
Performances
Avenir (pour Microsoft)
Avenir (pour la cause)