JSS2014 – Ma première analyse Machine Learning avec Azure ML

#JSS2014
Les journées
SQL Server 2014
Un événement organisé par GUSS

#JSS2014
Les journées
SQL Server 2014
Un événement organisé par GUSS
Ma première analyse
Machine Learning avec
Azure ML
Florian Eiden – Déc. 2014

#JSS2014
Merci à nos sponsors

#JSS2014
> 100
billets de
blog / an
> 30
articles
de presse /
an
8 MVP
7 MCT
4 P-Sellers
> 12j / an
/pers. de
formation
Cabinet de conseil IT
et centre de formation
spécialisé dans les
technologies Microsoft
et méthodes Agiles.
Cloud &
Integration
Collaboration &
Content
Data & Analytics
Application
Development
ALM & Agilité

#JSS2014
En BI : coincé à la connaissance

#JSS2014
Construire des systèmes capables
d’apprendre de leurs expériences
Machine Learning
coursera.org/course/ml

#JSS2014
Intéressant mais risqué…
drewconway.com
Business
Intelligence

#JSS2014
Pro de la BI
Machine
Learning

#JSS2014
Vendre mon appartement à Paris
• Mon appart
– Paris
– 2 pièces
– 55m2

#JSS2014
• Je veux vendre mon appartement, comment
déterminer le prix en fonction de sa superficie?
Superficie (m2)
Prix (€)
Mon appart
Ma question

#JSS2014
Identifier un pattern!
• Des données existantes on peut identifier un motif qui
appliqué à mon cas me permettrait de trouver le prix du
marché
Superficie (m2)
Prix (€)
Mon appart
Prix du marché

#JSS2014
Identifier un pattern!
• Des données existantes on peut identifier un motif qui
appliqué à mon cas me permettrait de trouver le prix du
marché
Superficie (m2)
Prix (€)
Mon appart
Prix du marché
Boum, Machine
Learning!

#JSS2014
En pratique: Le dataset

#JSS2014
En pratique : La modélisation
Superficie (m2)
Prix (€)
Mon appart
Prix du marché
On devine une mesure connue
(prix) à partir d’un exemple :
Apprentissage supervisé
De valeurs discrètes (PAP) on
obtient un ensemble continue
(la courbe verte) : Régression
On est niveau chaton :
Régression Linéaire à 1 feature
(superficie)
y = ax + b
y : prix
x : superficie

#JSS2014
Ce qu’on m’a vendu!
Ma superficie
Une prédiction de bon
prix de vente pour
mon appart
La magie
du ML!

#JSS2014
x y
y = ax + b
1. Configuration
Superficie (m2)
Prix (€)
Mon appart

#JSS2014
x y
y = ax + b
2. Test
Superficie (m2)
Prix (€)
Mon appart

#JSS2014
x y
y = ax + b
Superficie (m2)
Prix (€)
Mon appart
Ma superficie
Une prédiction de bon
prix de vente pour
mon appart
3. Utilisation

#JSS2014
x y
y = ax + b
Superficie (m2)
Prix (€)
Mon appart
3. Utilisation
h
l’hypothèse
Input : x
Ma superficie
Output : y
Prédiction de
prix du marché
y = h(x)

#JSS2014
y = h(x)
h(x) = hθ(x) = θ0 + θ1x
x
y = h(x)
θ0
y = θ1x + θ0
h
l’hypothèse
Input : x
Ma superficie
Output : y
Prédiction de
prix du marché

#JSS2014
Savoirs s’ils sont bons ou pas? Pour choisir les
meilleurs?
Comment noter les paramètres?
x
y = h(x)
θ0
y = θ1x + θ0
Fonction-coût / Cost Function

#JSS2014
Savoirs s’ils sont bons ou pas? Pour choisir les
meilleurs?
Comment noter les paramètres?
x
y = h(x)
θ0
y = θ1x + θ0
J(θi)
Fonction-coût / Cost Function
Calcule la distance totale entre
mon modèle et tous les
exemples du training set

#JSS2014
2 exemples, même training set
x
y
x
y
θ0
Modèle 1
θ0 = 1
θ1 = 0
y = θ1x + θ0
Modèle 2
θ0 = 1
θ1 = 0,25

#JSS2014
2 exemples, même training set
x
y
x
y
θ0
Modèle 1
θ0 = 1
θ1 = 0
y = θ1x + θ0
Modèle 2
θ0 = 1
θ1 = 0,25
Prix du
marché
Prix du
marché

#JSS2014
Cost Function : J(θ0 ,θ1)
x
y
x
y
θ0
Modèle 1
θ0 = 1
θ1 = 0
Modèle 2
θ0 = 0,25
θ1 = 1
J(θ0 ,θ1) = 25 J(θ0 ,θ1) = 5

#JSS2014
• Une méthode parmi d’autres
• Sa formule:
Cost function – Squarred Error

#JSS2014
On a les données training set
On a un modèle type h(x) = θ0 + θ1x
On sait le noter J(θ0 ,θ1)
La dernière pièce du puzzle

#JSS2014
On a les données training set
On a un modèle type h(x) = θ0 + θ1x
On sait le noter J(θ0 ,θ1)
Méthode d’optimisation Gradient Descent
La dernière pièce du puzzle

#JSS2014
Gradient Descent
1 – On essaye des premières
valeurs au hasard
2 – On fait varier les
paramètres simultanément
d’un delta basé sur leur
dérivée partielle de J
2.1 - Si J est meilleur on
continue
2.2 – Sinon on peut
s’arrêter
NB : oui GD ne trouve que les
minimums locaux, mais la LR est
convexe (pas d’optimum locaux)

#JSS2014
x y
y = ax + b
Superficie (m2)
Prix (€)
Mon appart
Vue globale
Input : x
Ma superficie
Output : y
Prédiction de
prix du marché
y = h(x)
Fonction-coût
Méthode d’optimisation
h
l’hypothèse

#JSS2014
Azure ML http://studio.azureml.net
Azure ML Excel Addin http://azuremlexcel.codeplex.com

#JSS2014
Attention!
Underfit
High bias
Overfit
High variance

#JSS2014
1. Plus de données!
2. Meilleures features
Régression polynomiale
3. Tester d’autres algorithmes
Aller plus loin?

#JSS2014
• Apprentissage supervisé
Je veux deviner la bonne réponse à partir d’exemples
– De valeurs discrètes à continue : Régression
– Ex : Prix des appartements
– De valeurs discrètes à une classe : Classification
– Ex : Aide au diagnostique médical (malade ou pas)
• Apprentissage non supervisé
Je veux trouver un pattern dans une donnée non classée
– Clustering / Segmentation
– Ex : Regrouper mes clients en sous-populations pour optimiser
mes e-mailings
Un pas de recul

#JSS2014
Conclusion
Maintenant que ça n’est plus un problème d’outil
Il est temps d’apprendre la théorie…

JSS2014 – Ma première analyse Machine Learning avec Azure ML

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Andere mochten auch

Andere mochten auch (20)

Ähnlich wie JSS2014 – Ma première analyse Machine Learning avec Azure ML

Ähnlich wie JSS2014 – Ma première analyse Machine Learning avec Azure ML (6)

Mehr von GUSS

Mehr von GUSS (20)

JSS2014 – Ma première analyse Machine Learning avec Azure ML

Hinweis der Redaktion