Présentation 19 janvier 2016
Mise en boîte de la Complexité
Chaire ESSEC Edgar Morin
Les mégadonnées, ou Big Data, constituent un nouvel outil à la disposition des entreprises et des chercheurs. Pour qu’elles soient utilisables de manière effective pour la prévision, il est essentiel de prendre du recul et de comprendre leur spécificité. Deux éléments les caractérisent : (i) ces données mesurent une activité d’origine humaine (ii) elles ne sont pas, pour la plupart, issues d’expériences contrôlées et reproductibles, mais au contraire, ont été enregistrées au fil de l’activité et constituent donc une référence historique.
Lors de leur analyse et de la modélisation de leur pouvoir prédictif. Nous devons par conséquent répondre à trois questions : quels sont les comportements reproductibles ? Quels sont ceux qui ressortissent à des circonstances spécifiques ? Quels sont ceux qui sont actionnables ? Dans cette «mise en boîte» de la complexité, je montrerai l’apport de la méthodologie développée au cours d’un demi-siècle d’analyses économétriques en sciences économiques et sociales afin d’appréhender de manière constructive le foisonnement actuel du Big Data et proposer des pistes en Business Analytics.
1. Big Data: alchimie ou science ?
Janvier 2015 - GUILLAUME CHEVILLON
Professeur of Statistics & Econometrics, ESSEC Business School
CoDirecteur ESSEC-CentraleSupélec MSc Data Sciences & Business Analytics
PierreBismuth
2. BIG DATA: QUELLES DONNEES ?
PREVOIR
APPORT DES SCIENCES
SOCIALES
UNE SCIENCE ?
3. Big Data is not about the Data!
Gary King
Harvard University (2015)
The End of Theory: The Data Deluge Makes the
Scientific Method Obsolete
Chris Anderson
Wired (2008)
7. ANALYTICS
DECRIRE ET CLASSER PAR
MESURES ET VISUALISATION
PREVOIR PAR ANALOGIE
PRESCRIRE PAR CRITERES DE
DECISION
Dirk Skreber
OUTILS
PROBABILITES
STATISTIQUES
CODING
ALGORITHMIQUE
OPTIMISATION …
Jules de Balincourt
8. Big Data, are we making a big mistake ?
Tim Harford
Financial Times
April 2014
14. QUELLES DONNÉES ?
NON STRUCTURÉES,
HAUTE FREQUENCE
RESEAUX
non pas N mais NK x T
voire NN! x T
Andreas Gursky
15. QUELLES DONNÉES ?
NON STRUCTURÉES,
HAUTE FREQUENCE
RESEAUX
non pas N mais NK x T
voire NN! x T
DONNÉES NON EXPERIMENTALES
LE MODÈLE DEFINIT L’ERREUR
Andreas Gursky
16. QUELLES DONNÉES ?
NON STRUCTURÉES,
HAUTE FREQUENCE
RESEAUX
non pas N mais NK x T
voire NN! x T
DONNÉES NON EXPERIMENTALES
LE MODÈLE DEFINIT L’ERREUR
NON-STATIONNAIRES/ÉVOLUTION
Andreas Gursky
17. QUELLES DONNÉES ?
NON STRUCTURÉES,
HAUTE FREQUENCE
RESEAUX
non pas N mais NK x T
voire NN! x T
DONNÉES NON EXPERIMENTALES
LE MODÈLE DEFINIT L’ERREUR
NON-STATIONNAIRES/ÉVOLUTION
ORIGINE: ACTIVITÉ HUMAINEAndreas Gursky
18. EXPERT BUSINESS ANALYTICS N’EST PAS QU’UN DATA SCIENTIST
- HUMAINS VS MACHINES INPUT/OUTPUT,
ACTIONS DEPENDENT DE
1/ passé et présent observable
2/ croyances, espoirs, anticipations,
3/ réseau (infini?) d’interactions
Andreas Gursky
Julien Prévieux
19. EXPERT BUSINESS ANALYTICS N’EST PAS QU’UN DATA SCIENTIST
- HUMAINS VS MACHINES INPUT/OUTPUT,
ACTIONS DEPENDENT DE
1/ passé et présent observable
2/ croyances, espoirs, anticipations,
3/ réseau (infini?) d’interactions
- FEEDBACK
Andreas Gursky
ANTICIPATIONS
AVENIR &
ACTIONS DES
AUTRES
ACTIONS
LE PRESENT
OBSERVE
Julien Prévieux
20. EXPERT BUSINESS ANALYTICS N’EST PAS QU’UN DATA SCIENTIST
- HUMAINS VS MACHINES INPUT/OUTPUT,
ACTIONS DEPENDENT DE
1/ passé et présent observable
2/ croyances, espoirs, anticipations,
3/ réseau (infini?) d’interactions
- FEEDBACK
- SEULES LES ACTIONS SONT OBSERVABLES
A “l’équilibre” les croyances et actions sont alignées
Analyste observe et comprend les “lois de
comportement”
- MALHEUREUSEMENT
L’équilibre n’existe pas réellement et fluctue
Les actions passées ne sont pas suffisantes pour prévoir
le comportement
Andreas Gursky
Julien Prévieux
21. MACROECONOMISTES : EXPERIENCE ET REPONSES
EXPERIENCE “BIG DATA” HISTORIQUE
KEYNES puis Hicks
Après WW2: US Cowles Commission (L.
Klein)
- données deviennent disponibles
- mettre l’économie en équations
- bonnes prévisions à court terme
TsangKin-Wah
Olafur Eliasson
22. MACROECONOMISTES : EXPERIENCE ET REPONSES
EXPERIENCE “BIG DATA” HISTORIQUE
KEYNES puis Hicks
Après WW2: US Cowles Commission (L.
Klein)
- données deviennent disponibles
- mettre l’économie en équations
- bonnes prévisions à court terme
1950s Courbe de Phillips
- rôle pour le gouvernement ?
TsangKin-Wah
Olafur Eliasson
23. MACROECONOMISTES : EXPERIENCE ET REPONSES
EXPERIENCE “BIG DATA” HISTORIQUE
KEYNES puis Hicks
Après WW2: US Cowles Commission (L.
Klein)
- données deviennent disponibles
- mettre l’économie en équations
- bonnes prévisions à court terme
1950s Courbe de Phillips
- rôle pour le gouvernement ?
1970s modèles de Klein et Phillips s'écroulent
- stagflation
TsangKin-Wah
Olafur Eliasson
24. EXPERIENCE “BIG DATA” HISTORIQUE
UNE REPONSE
exemple: modèle Cobweb
formation des anticipations ?
dynamique ?
loi perçue vs loi effective
TsangKin-Wah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSES
25. EXPERIENCE “BIG DATA” HISTORIQUE
UNE REPONSE
exemple: modèle Cobweb
formation des anticipations ?
dynamique ?
loi perçue vs loi effective
Muth (1960) puis Lucas: Anticipations rationnelles
- lien entre croyances individuelles et
comportement agrégé
- évite les hypothèses arbitraires (erreurs
systématiques)
- Une manière de comprendre le rôle des
interventions: la critique de Lucas (1976)
TsangKin-Wah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSES
26. EXPERIENCE “BIG DATA” HISTORIQUE
UNE REPONSE
exemple: modèle Cobweb
formation des anticipations ?
dynamique ?
loi perçue vs loi effective
Muth (1960) puis Lucas: Anticipations rationnelles
- lien entre croyances individuelles et
comportement agrégé
- évite les hypothèses arbitraires (erreurs
systématiques)
- Une manière de comprendre le rôle des
interventions: la critique de Lucas (1976)
Concept limité mais généralisable
TsangKin-Wah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSES
27. EXPERIENCE “BIG DATA” HISTORIQUE
UNE REPONSE
MODELES ECONOMETRIQUES
- Eviter les boîtes noires
préférer les petits modèles
interprétables
(structurels?)
équilibre partiel vs général
TsangKin-Wah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSES
28. EXPERIENCE “BIG DATA” HISTORIQUE
UNE REPONSE
MODELES ECONOMETRIQUES
- Eviter les boîtes noires
préférer les petits modèles
interprétables
(structurels?)
équilibre partiel vs général
- prévisions
stabilité
robustesse
TsangKin-Wah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSES
29. EXPERIENCE “BIG DATA” HISTORIQUE
UNE REPONSE
MODELES ECONOMETRIQUES
DIFFICULTES STATISTIQUES
- coordination des anticipations
prévoir les prévisions d'autrui
hétérogénéité
TsangKin-Wah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSES
30. EXPERIENCE “BIG DATA” HISTORIQUE
UNE REPONSE
MODELES ECONOMETRIQUES
DIFFICULTES STATISTIQUES
- coordination des anticipations
prévoir les prévisions d'autrui
hétérogénéité
- inférence impossible ?
simulations, validation reposent sur des
hypothèses
lois fractales
ex: apprentissage
ou si N −>∞
TsangKin-Wah
Olafur Eliasson
MACROECONOMISTES : EXPERIENCE ET REPONSES
31. How can the current disquiet of our time be properly
grasped, made comprehensible, examined, and
articulated?
Over the course of the last two centuries the radical
changes […] have made fascinating subject matter for
artists
The principal question the exhibition will pose is this:
How can artists, thinkers […] make sense of the current
upheaval?
Okwui Enwezor,
Curator of “All the World’s Futures”
2015 Venice Biennale
32. PREVOIR EN PRESENCE DE DISRUPTION
DES QUESTIONS (BIG DATA) COMMUNES EN SCIENCES, SCIENCES SOCIALES, ARTS...
COMPRENDRE
comprendre les croyances (esprit)
besoin d'une vue exhaustive des futurs possibles
éviter l'auto-censure
Muybridge
33. PREVOIR EN PRESENCE DE DISRUPTION
DES QUESTIONS (BIG DATA) COMMUNES EN SCIENCES, SCIENCES SOCIALES, ARTS...
COMPRENDRE
comprendre les croyances (esprit)
besoin d'une vue exhaustive des futurs possibles
éviter l'auto-censure
COMPARER
prendre en compte les croyances des autres
quelle est la mesure pour décider de la similarité et de la proximité ?
pour le classement ?
Muybridge
34. PREVOIR EN PRESENCE DE DISRUPTION
DES QUESTIONS (BIG DATA) COMMUNES EN SCIENCES, SCIENCES SOCIALES, ARTS...
COMPRENDRE
comprendre les croyances (esprit)
besoin d'une vue exhaustive des futurs possibles
éviter l'auto-censure
COMPARER
prendre en compte les croyances des autres
quelle est la mesure pour décider de la similarité et de la proximité ?
pour le classement ?
EVALUER
quel est le code (angage) pour enregistrer et décrire ?
qu'est ce qu'une description précise, exacte ?
comment évaluer les prévisions ?
Muybridge