SlideShare ist ein Scribd-Unternehmen logo
1 von 24
Downloaden Sie, um offline zu lesen
APPORT DES TECHNIQUES
D’INTELLIGENCE ARTIFICIELLE
POUR LE TRANSPORT
17 avril 2019
Vincent Guigue
Introduction Applications Conclusion
Short resume
98-2001 Ingénieur en mécanique (INSA de Rouen)
2005 PhD : Traitement du signal & SVM
S. Canu & A. Rakotomamonjy
2006 Maître de conférences
LIP6, Sorbonne Université (ex UPMC)
Equipe MLIA, Patrick Gallinari
Centres d’intérêt:
Données textuelles
Apprentissage de profils divers
en particulier, les personnes et les textes
Systèmes de transport intelligent
Interface Cerveau-Machine (BCI)
Transport et IA 2/12
Introduction Applications Conclusion
Données spatio-temporelles
Capter des positions = différentes sources
Différentes caractéristiques
± bruit / manque de précision
± coupures de signaux
± informations de contexte (activité, intention, ...)
Données billétiques (parisiennes)
Uniquement les entrées
Données manquantes
(fraude / pb de capteurs)
Imprécisions (réseau bus)
Transport et IA 3/12
Introduction Applications Conclusion
Données billétiques
Traces spatio-temporelles
triplets: temps, station, usager
Ile de France Mobilités
13 semaines
80M de logs, 600k usagers, 20k
stations (300 de métro)
week00
week01
week02
week03
week04
week05
week06
week07
week08
week09
week10
week11
week12
week13
Différentes problématiques, différentes échelles
Politiques de développement [Black et al., 2002, Golias, 2002]
Prédiction du trafic [Ceapa et al., 2012, Louail et al., 2014]
Détection d’anomalies [Tonnelier et al., 2017]
Analyse des comportements d’usagers [Poussevin et al., 2014]
Prédiction de log [Song et al., 2010, Foell et al., 2013]
Transport et IA 4/12
Introduction Applications Conclusion
Des statistiques au machine-learning
Au niveau statistique: sondage (EGT) ⇒ analyse de log
Cette période correspond à la fois aux plus faibles volumes de validation et aux comportements les
moins reproductibles (sorties ponctuelles, lieux variables, ...). Ces deux facteurs vont dans le même
sens : il faut un échantillonnage très serré pour décrire de manière robuste les phénomènes rare. Les
données billétiques sont plus à même de proposer une description efficace de ce qui se passe sur cette
période.
07h-09h 09h-16h30 16h30-19h30 19h30-07h
EGT - 2014 0.80117917 0.56945029 0.73599937 1.07044505
EGT - 2015 0.75419758 0.52067299 0.68501185 1.0038716
2014 - 2015 0.01930336 0.02018346 0.01791501 0.026127
TABLE 1 – Divergence KL entre les sources de données (agrégation des différentes origines). Les
principaux écarts sont en rouge, les plus faibles en vert.
Comparaison spatiale Nous proposons ensuite d’étudier les divergences du point de vue spatial
en figure 8. Concernant les écarts entre données billétiques et EGT, la projection spatiale est
malheureusement difficile à interpréter : les écarts sont biaisés par les volumes. La conclusion
générale serait : plus il y a de volume à partir d’une origine, plus il y a d’écart entre les mesures 5
.
Nous nous attendions à des écarts sensibles autour des gares ouvertes du réseau partant de St
Lazare 6
, mais il n’y a aucun phénomène statistique marquant.
En ce qui concerne les écarts entre données billétiques 2014 et 2015 (figure 8, droite), deux
conclusions s’imposent : d’une part, les écarts sont faibles (au moins 25 fois plus faibles que les écarts
entre EGT et données billétiques) et d’autre part ces écarts sont concentrés sur le réseau issu de la
gare du nord et la zone entourant la forêt de Sénart (Vigneux-sur-seine).
Analyses temporelles, spatiales, modales, ...
Enjeux:
Dépasser les statistiques pour comprendre les usages, prédire les flux
Transport et IA 5/12
Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
5 usagers (aléatoires)
données agrégées sur 24h
0 5 10 15 20
0 5 10 15 20
0 5 10 15 20
0 5 10 15 20
0 5 10 15 20
⇒
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
0 5 10 15 20
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
0 5 10 15 20 25
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0.18
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
0 5 10 15 20 25
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0.18
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
0 5 10 15 20 25
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0.18
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
0 5 10 15 20 25
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0.18
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
0 5 10 15 20 25
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0.18
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
0 5 10 15 20
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
Catégorisation de la population
Distinction des activités
[Poussevin et al., 2014]
Distinction des heures de
réalisation des activités
[Tonnelier et al., 2016]
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
Introduction Applications Conclusion
Projection spatiale des comportements
gare de lyon
marcadet poissonniers
montgallet
ranelagh
villejuif louis aragon
aubervilliers pantin
porte de la chapelle
campo formio
billancourt
chardon lagache
pyramides
couronnes
danube
volontaires
saint maur
telegraphe
kleber
monceau
gare de l'est
lourmel
reaumur sebastopol
ternes
maraichers
creteil pointe du lac
charonne
porte de bagnolet
commerce
tuileries
villiersrome
saint fargeau
vaugirard
ecole militaire
buzenval
chateau landon
bir hakeim
trinite d'estienne d'orves
olympiades
bel air
gaite
bolivar
pyrenees
pont marie
rambuteau
sevres lecourbe
pont de levallois becon
jacques bonsergent
botzaris
porte de vincennes
montparnasse
belleville
franklin roosevelt
pigalle
reuilly diderot
felix faure
convention
picpus
nationale
pont de sevres
victor hugo
plaisance
jaures
pont de neuilly
blanche
jules joffrin
les agnettes
ourcq
palais royaltrocadero
madeleine
colonel fabien
le kremlin bicetre
richelieu drouot
la chapelle
europe
charenton ecoles
porte doree
saint michel
duroc
bourse
varenne
mairie de montreuil
vaneau
creteil universite
filles du calvaire
odeon
temple
wagram
8 mai 1945
porte de charenton
sevres babylone
george v
pelleport
concorde
malakoff rue etienne dolet
creteil prefecture
rennes
porte de pantin
dupleix
michel bizot
charles de gaulle etoile
bastille
mirabeau
corentin cariou
chaussee d'antin
chateau rouge
chevaleret
brochant
miromesnil
crimee
alexandre dumas
avenue emile zola
opera
saint philippe du roule
menilmontant
place des fetes
edgar quinet
chateau d'eau
saint sulpice
la defense
mairie de clichy
gare du nordcourcelles
glaciere
creteil l'echat
porte de vanves
poissonniere
pont neuf
notre dame de lorette
gabriel peri
quai de la rapeejavel
saint marcel
corvisart
charles michels
maisons alfort stade
louis blanc
basilique de saint denis
assemblee nationale
michel ange auteuil
les sablons
cambronne
malesherbes
goncourtstrasbourg saint denis
maisons alfort les juilliottes
porte des lilas
les gobelins
pierre et marie curie
hoche
porte de la villette
place monge
argentine
saint sebastien froissart
pere lachaise
boulogne pont de saint cloud
eglise d'auteuil
gallieni
bibliotheque francois mitterrand
place d'italie
bobigny pantin
jourdain
laumiere
etienne marcel
buttes chaumont
place de clichy
bonne nouvelle
villejuif leo lagrange
corentin celton
louise michel
rue des boulets
falguiere
riquet
mairie de saint ouen
iena
louvre rivoli
la motte picquet grenelle
sully morland
bobigny pablo picasso
berault
avron
sentier
austerlitz
la muette
stalingrad
carrefour pleyel
maubert mutualite
exelmans
quatre septembre
boissiere
maison blanche
bercy
rue de la pompe
grands boulevards
porte de clignancourt
michel ange molitor
fort d'aubervilliers
les halles
segur
saint jacques
ecole veterinaire de maisons alfort
villejuif paul vaillant couturier
saint francois xavier
porte de montreuil
porte de versailles
quai de la gare
champs elysees clemenceau
saint germain des pres
mairie des lilas
alma marceau
pre saint gervais
saint lazare
pereire
porte d'orleans
chatillon montrouge
anatole france
lamarck caulaincourt
pasteur
raspail
pernety
alesia
marcel sembat
cardinal lemoine
denfert rochereau
republique
mouton duvernet
le peletier
eglise de pantin
les courtilles asnieres gennevilliers
mabillon
croix de chavaux
saint ambroise
porte de saint ouen
notre dame des champs
breguet sabin
saint mande
porte de clichy
invalides
boucicaut
havre caumartin
marx dormoy
porte de choisy
liege
porte de saint cloud
vavin
liberte
cour saint emilion
saint placide
porte d'ivry
mairie d'issy
porte maillot
la tour maubourg
censier daubenton
cadet
jasmin
barbes rochechouart
jussieu
porte dauphine
richard lenoir
ledru rollin
arts et metiers
porte d'italie
saint georges
esplanade de la defense
saint denis universite
mairie d'ivry
oberkampf
faidherbe chaligny
balard
saint paul
malakoff plateau de vanves
simplon
daumesnil
chateau de vincennes
saint augustin
guy moquet
robespierre
voltaire
porte de champerret
garibaldi
hotel de ville
gambetta
citerue du bac
saint denis porte de paris
parmentier
solferino chatelet
porte d'auteuil
tolbiac
dugommier
anvers
nation
abbesses
boulogne jean jaures
passy chemin vert
la fourche
philippe auguste
c01
c02
c03
c04
c05
Transport et IA 7/12
Introduction Applications Conclusion
Projection spatiale des comportements
Analyse différentiée des comportements
gare de lyon
marcadet poissonniers
montgallet
ranelagh
villejuif louis aragon
aubervilliers pantin
porte de la chapelle
campo formio
billancourt
chardon lagache
pyramides
couronnes
danube
volontaires
saint maur
telegraphe
kleber
monceau
gare de l'est
lourmel
reaumur sebastopol
ternes
maraichers
creteil pointe du lac
charonne
porte de bagnolet
commerce
tuileries
villiersrome
saint fargeau
vaugirard
ecole militaire
buzenval
chateau landon
bir hakeim
trinite d'estienne d'orves
olympiades
bel air
gaite
bolivar
pyrenees
pont marie
rambuteau
sevres lecourbe
pont de levallois becon
jacques bonsergent
botzaris
porte de vincennes
montparnasse
belleville
franklin roosevelt
pigalle
reuilly diderot
felix faure
convention
picpus
nationale
pont de sevres
victor hugo
plaisance
jaures
pont de neuilly
blanche
jules joffrin
les agnettes
ourcq
palais royaltrocadero
madeleine
colonel fabien
le kremlin bicetre
richelieu drouot
la chapelle
europe
charenton ecoles
porte doree
saint michel
duroc
bourse
varenne
mairie de montreuil
vaneau
creteil universite
filles du calvaire
odeon
temple
wagram
8 mai 1945
porte de charenton
sevres babylone
george v
pelleport
concorde
malakoff rue etienne dolet
creteil prefecture
rennes
porte de pantin
dupleix
michel bizot
charles de gaulle etoile
bastille
mirabeau
corentin cariou
chaussee d'antin
chateau rouge
chevaleret
brochant
miromesnil
crimee
alexandre dumas
avenue emile zola
opera
saint philippe du roule
menilmontant
place des fetes
edgar quinet
chateau d'eau
saint sulpice
la defense
mairie de clichy
gare du nordcourcelles
glaciere
creteil l'echat
porte de vanves
poissonniere
pont neuf
notre dame de lorette
gabriel peri
quai de la rapeejavel
saint marcel
corvisart
charles michels
maisons alfort stade
louis blanc
basilique de saint denis
assemblee nationale
michel ange auteuil
les sablons
cambronne
malesherbes
goncourtstrasbourg saint denis
maisons alfort les juilliottes
porte des lilas
les gobelins
pierre et marie curie
hoche
porte de la villette
place monge
argentine
saint sebastien froissart
pere lachaise
boulogne pont de saint cloud
eglise d'auteuil
gallieni
bibliotheque francois mitterrand
place d'italie
bobigny pantin
jourdain
laumiere
etienne marcel
buttes chaumont
place de clichy
bonne nouvelle
villejuif leo lagrange
corentin celton
louise michel
rue des boulets
falguiere
riquet
mairie de saint ouen
iena
louvre rivoli
la motte picquet grenelle
sully morland
bobigny pablo picasso
berault
avron
sentier
austerlitz
la muette
stalingrad
carrefour pleyel
maubert mutualite
exelmans
quatre septembre
boissiere
maison blanche
bercy
rue de la pompe
grands boulevards
porte de clignancourt
michel ange molitor
fort d'aubervilliers
les halles
segur
saint jacques
ecole veterinaire de maisons alfort
villejuif paul vaillant couturier
saint francois xavier
porte de montreuil
porte de versailles
quai de la gare
champs elysees clemenceau
saint germain des pres
mairie des lilas
alma marceau
pre saint gervais
saint lazare
pereire
porte d'orleans
chatillon montrouge
anatole france
lamarck caulaincourt
pasteur
raspail
pernety
alesia
marcel sembat
cardinal lemoine
denfert rochereau
republique
mouton duvernet
le peletier
eglise de pantin
les courtilles asnieres gennevilliers
mabillon
croix de chavaux
saint ambroise
porte de saint ouen
notre dame des champs
breguet sabin
saint mande
porte de clichy
invalides
boucicaut
havre caumartin
marx dormoy
porte de choisy
liege
porte de saint cloud
vavin
liberte
cour saint emilion
saint placide
porte d'ivry
mairie d'issy
porte maillot
la tour maubourg
censier daubenton
cadet
jasmin
barbes rochechouart
jussieu
porte dauphine
richard lenoir
ledru rollin
arts et metiers
porte d'italie
saint georges
esplanade de la defense
saint denis universite
mairie d'ivry
oberkampf
faidherbe chaligny
balard
saint paul
malakoff plateau de vanves
simplon
daumesnil
chateau de vincennes
saint augustin
guy moquet
robespierre
voltaire
porte de champerret
garibaldi
hotel de ville
gambetta
citerue du bac
saint denis porte de paris
parmentier
solferino chatelet
porte d'auteuil
tolbiac
dugommier
anvers
nation
abbesses
boulogne jean jaures
passy chemin vert
la fourche
philippe auguste
c01
c02
c03
c04
c05
high day high week medium day medium week low day low week
Transport et IA 7/12
Introduction Applications Conclusion
Prédiction de flux
Signaux stationnaires
Modèle de référence = moyenne du passé (jour, station)
Idée: exploiter des réseaux à mémoire [Gers et al., 1999]
− de monde le matin ⇒ − de monde le soir
Impossible avec les modèles makoviens
Difficile avec les modèles AR / ARIMA
Un modèle par station
We propose three recurrent architectures, introducing three different ways of dealing with spatial
context. Two of them model it implicitly while the third one explicitly learns it. Each architecture
is composed of a recurrent encoder E transforming the observations into hidden latent states. These
states are then decoded into predictions using a linear layer D. Each of the models can then be
completed with temporal context.
Univariate RNN First of all, we consider each station separately. That is, we explicitly train S
distinct RNNs over as many matrices of samples Xs
2 RN⇥T
. In this case the input dimension of
each RNN is 1, i.e. we compute p(xs
t+1|xs
t , ..., xs
0). The underlying assumption is that every station
has a different dynamics and therefore requires a singular RNN.
At time step t, for a station s the observation xs
t 2 R and hidden state hs
t 2 Rh
are encoded via
a singular encoder Es
into a hidden state representing only this station, then decoded into a single-
valued prediction ˆxs
t+1. The process is described in Equation 1 and Figure 1.
8(s, t) 2 {1, .., S} ⇥ {1, .., T 1}, ˆxs
t+1 = Ds
(hs
t+1) = Ds
(Es
(xs
t , hs
t )) (1)
Observation Prediction
Linear decoder Ds
Encoder Es 
S distinct
decoders 
S distinct
encoders 
Figure 1: Computing one station’s s predictions using the univariate architecture. Vector xs
of
observations is processed by a dedicated recurrent encoder Es
which computes a hidden state hs
t+1
for each t which is decoded into the prediction by Ds
.Transport et IA 8/12
Introduction Applications Conclusion
Prédiction de flux
Signaux stationnaires
Modèle de référence = moyenne du passé (jour, station)
Idée: exploiter des réseaux à mémoire [Gers et al., 1999]
− de monde le matin ⇒ − de monde le soir
Impossible avec les modèles makoviens
Difficile avec les modèles AR / ARIMA
Un modèle unique pour le réseau
Under review as a conference paper at ICLR 2019
Observations Predictions
Linear decoder DRecurrent encoder E 
Figure 2: Computing predictions using the multivariate architecture. Vector x of observations is
processed by a recurrent encoder which computes a hidden state ht+1 for each t. This state, which
Transport et IA 8/12
Introduction Applications Conclusion
Prédiction de flux
Signaux stationnaires
Modèle de référence = moyenne du passé (jour, station)
Idée: exploiter des réseaux à mémoire [Gers et al., 1999]
− de monde le matin ⇒ − de monde le soir
Impossible avec les modèles makoviens
Difficile avec les modèles AR / ARIMA
Un modèle contextuel
(modèle unique, représentation du contexte fournie)
Multivariate RNN - that allows to take into account the correlations between the statio
y reduces the number of weights.
ime, spatial context is explicitly learned in the form of a matrix of spatial embe
RS⇥ s
, hence the name Spatial RNN. For each station s, the corresponding emb
oncatenated to the observation as in Equation 3 where c is the concatenation operation
e step t, for a station s, the observation xs
t 2 R is concatenated to the embedding zs
2
sulting vector and hidden state hs
t 2 Rh
are encoded via the common encoder E into a
epresenting only this station. This state is then decoded into a single-valued prediction
gure 3 for an illustration.
8(s, t) 2 {1, .., S} ⇥ {1, .., T 1}, ˆxs
t+1 = D(hs
t+1) = D(E(c(xs
t , zs
), hs
t ))
Observation Prediction
Linear decoder DRecurrent encoder E 
3: Computing one station’s s predictions using the spatial architecture. ObservationTransport et IA 8/12
Introduction Applications Conclusion
Prédiction de flux : résultats
Evolution de l’erreur
en fonction de
l’horizon de
prédiction
Prédiction sur un
jour particulier
non appris
t+1 t+2 t+3 t+4 t+5 t+6 t+7 t+8 t+9 t+10
25
30
35
40
45
50
55
Increase in RMSE with the number of steps to predict
Baseline
Multivariate GRU
Day&Time Multivariate GRU
Spatial GRU
Day&Time Spatial GRU
Univariate GRU
Day&Time Univariate GRU
04:00
05:00
06:00
07:00
08:00
09:00
10:00
11:00
12:00
13:00
14:00
15:00
16:00
17:00
18:00
19:00
20:00
21:00
22:00
23:00
00:00
01:00
02:00
03:00
0
200
400
600
800
Logs
Wed - 2015-11-04 PONT DE LEVALLOIS-BECON
Ground truth
Baseline - RMSE = 108.60
Multivariate GRU - RMSE = 34.93
Univariate GRU - RMSE = 19.01
Spatial GRU - RMSE = 16.35
Transport et IA 9/12
Introduction Applications Conclusion
Prédiction/caractérisation des anomalies
Modèle
Usager
Histo
Logs
Modèle
Station
Nouveaux
Logs
Ecarts
Anomalies
Ecarts
Différents modèles
Variations de flux sur une station :
données brutes vs données analysées
Variations des comportements des usagers : spatial / temporel
Agrégation [résistance au bruit]
Prédiction / caractérisation des anomalies
Problème de supervision / évaluation [Tonnelier et al., 2017]
Transport et IA 10/12
Introduction Applications Conclusion
Prédiction/caractérisation des anomalies
Modèle
Usager
Histo
Logs
Modèle
Station
Nouveaux
Logs
Ecarts
Anomalies
Ecarts
Différents modèles
Variations de flux sur une station :
données brutes vs données analysées
Variations des comportements des usagers : spatial / temporel
Agrégation [résistance au bruit]
Prédiction / caractérisation des anomalies
Problème de supervision / évaluation [Tonnelier et al., 2017]
Transport et IA 10/12
Introduction Applications Conclusion
Conclusions et perspectives
Nombreuses opportunités :
Comportements d’usagers, de conducteurs, de réseaux, ...
Peu de travaux en machine learning sur les données billétique
Perspectives:
Dépendances spatiales & temporelles dans les anomalies
Applications connexes:
Maintenance prédictive, prédictions
climatiques, réseaux de capteurs
⇒ des séries spatio-temporelles multivariées
RGPD : quelles données demain?
Transport et IA 11/12
Introduction Applications Conclusion
Bibliography
Black, J. A., Paez, A., and Suthanaya,
P. A. (2002).
Sustainable urban transportation:
performance indicators and some analytical
approaches.
Journal of urban planning and development,
128(4):184–209.
Ceapa, I., Smith, C., and Capra, L. (2012).
Avoiding the crowds: understanding tube
station congestion patterns from trip data.
In ACM SIGKDD 2012, pages 134–141.
ACM.
Foell, S., Kortuem, G., Rawassizadeh, R.,
Phithakkitnukoon, S., Veloso, M., and
Bento, C. (2013).
Mining temporal patterns of transport
behaviour for predicting future transport
usage.
In UbiComp 13, pages 1239–1248. ACM.
Gers, F. A., Schmidhuber, J., and
Cummins, F. (1999).
Learning to forget: Continual prediction
with lstm.
Golias, J. C. (2002).
Analysis of traffic corridor impacts from the
introduction of the new athens metro
system.
Louail, T., Lenormand, M., Cantú, O. G.,
Picornell, M., Herranz, R., Frias-Martinez,
E., Ramasco, J. J., and Barthelemy, M.
(2014).
From mobile phone data to the spatial
structure of cities.
arXiv:1401.4540.
Poussevin, M., Baskiotis, N., Guigue, V.,
and Gallinari, P. (2014).
Mining ticketing logs for usage
characterization with nonnegative matrix
factorization.
In ECML, Workshop SenseML.
Song, C., Qu, Z., Blumm, N., and
Barabási, A.-L. (2010).
Limits of predictability in human mobility.
Science, 327(5968):1018–1021.
Tonnelier, E., Baskiotis, N., Guigue, V.,
and Gallinari, P. (2016).
Smart card in public transportation:
designing a analysis system at the human
scale.
In ITSC.
Tonnelier, E., Baskiotis, N., Guigue, V.,
and Gallinari, P. (2017).
Anomaly detection and characterization in
smart card logs using nmf and tweets.
Transport et IA 12/12

Weitere ähnliche Inhalte

Ähnlich wie Prez labo paris_6_meetup_open_transport_paris_17042019

Fascicule mémoiresienac09 ihm11
Fascicule mémoiresienac09 ihm11Fascicule mémoiresienac09 ihm11
Fascicule mémoiresienac09 ihm11uvohucyz
 
Contexte et processus de normalisation
 Contexte et processus de normalisation Contexte et processus de normalisation
Contexte et processus de normalisationChristophe Duquesne
 
Ouvrir les données météorologiques pour la recherche - OpenMeteoData - confér...
Ouvrir les données météorologiques pour la recherche - OpenMeteoData - confér...Ouvrir les données météorologiques pour la recherche - OpenMeteoData - confér...
Ouvrir les données météorologiques pour la recherche - OpenMeteoData - confér...Nicolas Baldeck
 
01 jus 20101123_intro
01 jus 20101123_intro01 jus 20101123_intro
01 jus 20101123_introOpenCascade
 
Marc LEMINH, Coordinateur innovation et Nouveaux Business – CLS (Collecte Loc...
Marc LEMINH, Coordinateur innovation et Nouveaux Business – CLS (Collecte Loc...Marc LEMINH, Coordinateur innovation et Nouveaux Business – CLS (Collecte Loc...
Marc LEMINH, Coordinateur innovation et Nouveaux Business – CLS (Collecte Loc...ATECITSFRANCE
 
Cartographie des réseaux de distribution électrique
Cartographie des réseaux de distribution électriqueCartographie des réseaux de distribution électrique
Cartographie des réseaux de distribution électriqueFrançois Lacombe
 
CAPEB : Conjoncture et Prévisions 4ème trimestre 2015
CAPEB : Conjoncture et Prévisions 4ème trimestre 2015CAPEB : Conjoncture et Prévisions 4ème trimestre 2015
CAPEB : Conjoncture et Prévisions 4ème trimestre 2015Monimmeuble.com
 
SunRise "Démonstrateur de la ville intelligente et Durable" : Etat d'avanceme...
SunRise "Démonstrateur de la ville intelligente et Durable" : Etat d'avanceme...SunRise "Démonstrateur de la ville intelligente et Durable" : Etat d'avanceme...
SunRise "Démonstrateur de la ville intelligente et Durable" : Etat d'avanceme...Isam Shahrour
 
Dreif Francilbois 15 Juin 2010
Dreif Francilbois 15 Juin 2010Dreif Francilbois 15 Juin 2010
Dreif Francilbois 15 Juin 2010Francîlbois
 
Revue de presse Telecom Valley, Eté 2016
Revue de presse Telecom Valley, Eté 2016Revue de presse Telecom Valley, Eté 2016
Revue de presse Telecom Valley, Eté 2016Laurence Briffa
 
Des capteurs pour surveiller la pollution atmosphérique : un enjeu de santé p...
Des capteurs pour surveiller la pollution atmosphérique : un enjeu de santé p...Des capteurs pour surveiller la pollution atmosphérique : un enjeu de santé p...
Des capteurs pour surveiller la pollution atmosphérique : un enjeu de santé p...LIEGE CREATIVE
 
OpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranée
OpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranéeOpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranée
OpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranéeFing
 
Modélisation de la qualité de l'air
Modélisation de la qualité de l'airModélisation de la qualité de l'air
Modélisation de la qualité de l'airPEXE
 
Monitoring spatio-temporel de l'ADN urbain
Monitoring spatio-temporel de l'ADN urbainMonitoring spatio-temporel de l'ADN urbain
Monitoring spatio-temporel de l'ADN urbainNicolas Lachance-Bernard
 
Wireless sensor network
Wireless sensor networkWireless sensor network
Wireless sensor networkAnis Bedhiafi
 
Cartographie des infrastructures sur OpenStreetMap - FrNOG 33
Cartographie des infrastructures sur OpenStreetMap - FrNOG 33Cartographie des infrastructures sur OpenStreetMap - FrNOG 33
Cartographie des infrastructures sur OpenStreetMap - FrNOG 33François Lacombe
 

Ähnlich wie Prez labo paris_6_meetup_open_transport_paris_17042019 (20)

Fascicule mémoiresienac09 ihm11
Fascicule mémoiresienac09 ihm11Fascicule mémoiresienac09 ihm11
Fascicule mémoiresienac09 ihm11
 
Contexte et processus de normalisation
 Contexte et processus de normalisation Contexte et processus de normalisation
Contexte et processus de normalisation
 
Ouvrir les données météorologiques pour la recherche - OpenMeteoData - confér...
Ouvrir les données météorologiques pour la recherche - OpenMeteoData - confér...Ouvrir les données météorologiques pour la recherche - OpenMeteoData - confér...
Ouvrir les données météorologiques pour la recherche - OpenMeteoData - confér...
 
01 jus 20101123_intro
01 jus 20101123_intro01 jus 20101123_intro
01 jus 20101123_intro
 
Marc LEMINH, Coordinateur innovation et Nouveaux Business – CLS (Collecte Loc...
Marc LEMINH, Coordinateur innovation et Nouveaux Business – CLS (Collecte Loc...Marc LEMINH, Coordinateur innovation et Nouveaux Business – CLS (Collecte Loc...
Marc LEMINH, Coordinateur innovation et Nouveaux Business – CLS (Collecte Loc...
 
Cartographie des réseaux de distribution électrique
Cartographie des réseaux de distribution électriqueCartographie des réseaux de distribution électrique
Cartographie des réseaux de distribution électrique
 
PréSentation Ciao 2
PréSentation Ciao 2PréSentation Ciao 2
PréSentation Ciao 2
 
CAPEB : Conjoncture et Prévisions 4ème trimestre 2015
CAPEB : Conjoncture et Prévisions 4ème trimestre 2015CAPEB : Conjoncture et Prévisions 4ème trimestre 2015
CAPEB : Conjoncture et Prévisions 4ème trimestre 2015
 
Trajectoire le magazine n°5 - Avril 2013
Trajectoire le magazine n°5 - Avril 2013Trajectoire le magazine n°5 - Avril 2013
Trajectoire le magazine n°5 - Avril 2013
 
SunRise "Démonstrateur de la ville intelligente et Durable" : Etat d'avanceme...
SunRise "Démonstrateur de la ville intelligente et Durable" : Etat d'avanceme...SunRise "Démonstrateur de la ville intelligente et Durable" : Etat d'avanceme...
SunRise "Démonstrateur de la ville intelligente et Durable" : Etat d'avanceme...
 
Trajectoire le magazine n°9 - avril 2015
Trajectoire le magazine n°9 - avril 2015Trajectoire le magazine n°9 - avril 2015
Trajectoire le magazine n°9 - avril 2015
 
Dreif Francilbois 15 Juin 2010
Dreif Francilbois 15 Juin 2010Dreif Francilbois 15 Juin 2010
Dreif Francilbois 15 Juin 2010
 
Revue de presse Telecom Valley, Eté 2016
Revue de presse Telecom Valley, Eté 2016Revue de presse Telecom Valley, Eté 2016
Revue de presse Telecom Valley, Eté 2016
 
Des capteurs pour surveiller la pollution atmosphérique : un enjeu de santé p...
Des capteurs pour surveiller la pollution atmosphérique : un enjeu de santé p...Des capteurs pour surveiller la pollution atmosphérique : un enjeu de santé p...
Des capteurs pour surveiller la pollution atmosphérique : un enjeu de santé p...
 
OpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranée
OpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranéeOpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranée
OpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranée
 
Modélisation de la qualité de l'air
Modélisation de la qualité de l'airModélisation de la qualité de l'air
Modélisation de la qualité de l'air
 
R5G - Juin 2013
R5G - Juin 2013R5G - Juin 2013
R5G - Juin 2013
 
Monitoring spatio-temporel de l'ADN urbain
Monitoring spatio-temporel de l'ADN urbainMonitoring spatio-temporel de l'ADN urbain
Monitoring spatio-temporel de l'ADN urbain
 
Wireless sensor network
Wireless sensor networkWireless sensor network
Wireless sensor network
 
Cartographie des infrastructures sur OpenStreetMap - FrNOG 33
Cartographie des infrastructures sur OpenStreetMap - FrNOG 33Cartographie des infrastructures sur OpenStreetMap - FrNOG 33
Cartographie des infrastructures sur OpenStreetMap - FrNOG 33
 

Mehr von Open Transport meetup by Kisio

Prez otm an innovative plug and play approach to maa_s_meetup_open_transport_...
Prez otm an innovative plug and play approach to maa_s_meetup_open_transport_...Prez otm an innovative plug and play approach to maa_s_meetup_open_transport_...
Prez otm an innovative plug and play approach to maa_s_meetup_open_transport_...Open Transport meetup by Kisio
 
Prez laboratoire des_proximites_le_mans_meetup_open_transport_27.05.2021
Prez laboratoire des_proximites_le_mans_meetup_open_transport_27.05.2021Prez laboratoire des_proximites_le_mans_meetup_open_transport_27.05.2021
Prez laboratoire des_proximites_le_mans_meetup_open_transport_27.05.2021Open Transport meetup by Kisio
 
Prez my mobilityprofile_belgian_open_transport_meetup_10.03.2021
Prez my mobilityprofile_belgian_open_transport_meetup_10.03.2021Prez my mobilityprofile_belgian_open_transport_meetup_10.03.2021
Prez my mobilityprofile_belgian_open_transport_meetup_10.03.2021Open Transport meetup by Kisio
 
Prez stoomlink belgian_open_transport_meetup_10.03.2021
Prez stoomlink belgian_open_transport_meetup_10.03.2021Prez stoomlink belgian_open_transport_meetup_10.03.2021
Prez stoomlink belgian_open_transport_meetup_10.03.2021Open Transport meetup by Kisio
 
Prez observatoire mobilites_emergentes_laurent_jegou_meetup_open_transport_27...
Prez observatoire mobilites_emergentes_laurent_jegou_meetup_open_transport_27...Prez observatoire mobilites_emergentes_laurent_jegou_meetup_open_transport_27...
Prez observatoire mobilites_emergentes_laurent_jegou_meetup_open_transport_27...Open Transport meetup by Kisio
 
Prez mobilite electrique_julien_vaissette_avec complement_meetup_open_transpo...
Prez mobilite electrique_julien_vaissette_avec complement_meetup_open_transpo...Prez mobilite electrique_julien_vaissette_avec complement_meetup_open_transpo...
Prez mobilite electrique_julien_vaissette_avec complement_meetup_open_transpo...Open Transport meetup by Kisio
 
Prez handimap bertrand_gervais_meetup_open_transport_27.01.2021
Prez handimap bertrand_gervais_meetup_open_transport_27.01.2021Prez handimap bertrand_gervais_meetup_open_transport_27.01.2021
Prez handimap bertrand_gervais_meetup_open_transport_27.01.2021Open Transport meetup by Kisio
 
Prez onecub portrabilite_donnees_meetup_open_transport_10.12.2020
Prez onecub portrabilite_donnees_meetup_open_transport_10.12.2020Prez onecub portrabilite_donnees_meetup_open_transport_10.12.2020
Prez onecub portrabilite_donnees_meetup_open_transport_10.12.2020Open Transport meetup by Kisio
 
Prez tourisme et_mobilite_julien_delabaca_meetup_open_transport_05.11.2020
Prez tourisme et_mobilite_julien_delabaca_meetup_open_transport_05.11.2020Prez tourisme et_mobilite_julien_delabaca_meetup_open_transport_05.11.2020
Prez tourisme et_mobilite_julien_delabaca_meetup_open_transport_05.11.2020Open Transport meetup by Kisio
 
Prez lab mobilites_marie-eve_meetup_open_transport_05.11.2020
Prez lab mobilites_marie-eve_meetup_open_transport_05.11.2020Prez lab mobilites_marie-eve_meetup_open_transport_05.11.2020
Prez lab mobilites_marie-eve_meetup_open_transport_05.11.2020Open Transport meetup by Kisio
 
Prez irt system-x_ti_iva_meetup_opentransport_05.11.2020
Prez irt system-x_ti_iva_meetup_opentransport_05.11.2020Prez irt system-x_ti_iva_meetup_opentransport_05.11.2020
Prez irt system-x_ti_iva_meetup_opentransport_05.11.2020Open Transport meetup by Kisio
 
Prez geomob plan_de_mobilite_meetup_open_transport_05.11.2020
Prez geomob plan_de_mobilite_meetup_open_transport_05.11.2020Prez geomob plan_de_mobilite_meetup_open_transport_05.11.2020
Prez geomob plan_de_mobilite_meetup_open_transport_05.11.2020Open Transport meetup by Kisio
 
Prez fabrique mobilites_gabriel_plassat_meetup_open_transport_05.11.2020
Prez fabrique mobilites_gabriel_plassat_meetup_open_transport_05.11.2020Prez fabrique mobilites_gabriel_plassat_meetup_open_transport_05.11.2020
Prez fabrique mobilites_gabriel_plassat_meetup_open_transport_05.11.2020Open Transport meetup by Kisio
 

Mehr von Open Transport meetup by Kisio (20)

2021.06.24 ecov kisio meetup_partage
2021.06.24 ecov kisio meetup_partage2021.06.24 ecov kisio meetup_partage
2021.06.24 ecov kisio meetup_partage
 
Prez otm an innovative plug and play approach to maa_s_meetup_open_transport_...
Prez otm an innovative plug and play approach to maa_s_meetup_open_transport_...Prez otm an innovative plug and play approach to maa_s_meetup_open_transport_...
Prez otm an innovative plug and play approach to maa_s_meetup_open_transport_...
 
Prez apitux cyclo4-meetup-open-transport-21-06-24
Prez apitux cyclo4-meetup-open-transport-21-06-24Prez apitux cyclo4-meetup-open-transport-21-06-24
Prez apitux cyclo4-meetup-open-transport-21-06-24
 
Prez tellae meetup_open_transport_27.05.2021
Prez tellae meetup_open_transport_27.05.2021Prez tellae meetup_open_transport_27.05.2021
Prez tellae meetup_open_transport_27.05.2021
 
Prez ma course sncf meetup_open_transport_27.05.2021
Prez ma course sncf meetup_open_transport_27.05.2021Prez ma course sncf meetup_open_transport_27.05.2021
Prez ma course sncf meetup_open_transport_27.05.2021
 
Prez laboratoire des_proximites_le_mans_meetup_open_transport_27.05.2021
Prez laboratoire des_proximites_le_mans_meetup_open_transport_27.05.2021Prez laboratoire des_proximites_le_mans_meetup_open_transport_27.05.2021
Prez laboratoire des_proximites_le_mans_meetup_open_transport_27.05.2021
 
Prez my mobilityprofile_belgian_open_transport_meetup_10.03.2021
Prez my mobilityprofile_belgian_open_transport_meetup_10.03.2021Prez my mobilityprofile_belgian_open_transport_meetup_10.03.2021
Prez my mobilityprofile_belgian_open_transport_meetup_10.03.2021
 
Sp8ce presentation
Sp8ce presentationSp8ce presentation
Sp8ce presentation
 
Prez stop bystep
Prez stop bystepPrez stop bystep
Prez stop bystep
 
Prez stoomlink belgian_open_transport_meetup_10.03.2021
Prez stoomlink belgian_open_transport_meetup_10.03.2021Prez stoomlink belgian_open_transport_meetup_10.03.2021
Prez stoomlink belgian_open_transport_meetup_10.03.2021
 
Prez observatoire mobilites_emergentes_laurent_jegou_meetup_open_transport_27...
Prez observatoire mobilites_emergentes_laurent_jegou_meetup_open_transport_27...Prez observatoire mobilites_emergentes_laurent_jegou_meetup_open_transport_27...
Prez observatoire mobilites_emergentes_laurent_jegou_meetup_open_transport_27...
 
Prez mobilite electrique_julien_vaissette_avec complement_meetup_open_transpo...
Prez mobilite electrique_julien_vaissette_avec complement_meetup_open_transpo...Prez mobilite electrique_julien_vaissette_avec complement_meetup_open_transpo...
Prez mobilite electrique_julien_vaissette_avec complement_meetup_open_transpo...
 
Prez handimap bertrand_gervais_meetup_open_transport_27.01.2021
Prez handimap bertrand_gervais_meetup_open_transport_27.01.2021Prez handimap bertrand_gervais_meetup_open_transport_27.01.2021
Prez handimap bertrand_gervais_meetup_open_transport_27.01.2021
 
Prez onecub portrabilite_donnees_meetup_open_transport_10.12.2020
Prez onecub portrabilite_donnees_meetup_open_transport_10.12.2020Prez onecub portrabilite_donnees_meetup_open_transport_10.12.2020
Prez onecub portrabilite_donnees_meetup_open_transport_10.12.2020
 
Prez tourisme et_mobilite_julien_delabaca_meetup_open_transport_05.11.2020
Prez tourisme et_mobilite_julien_delabaca_meetup_open_transport_05.11.2020Prez tourisme et_mobilite_julien_delabaca_meetup_open_transport_05.11.2020
Prez tourisme et_mobilite_julien_delabaca_meetup_open_transport_05.11.2020
 
Prez lab mobilites_marie-eve_meetup_open_transport_05.11.2020
Prez lab mobilites_marie-eve_meetup_open_transport_05.11.2020Prez lab mobilites_marie-eve_meetup_open_transport_05.11.2020
Prez lab mobilites_marie-eve_meetup_open_transport_05.11.2020
 
Prez irt system-x_ti_iva_meetup_opentransport_05.11.2020
Prez irt system-x_ti_iva_meetup_opentransport_05.11.2020Prez irt system-x_ti_iva_meetup_opentransport_05.11.2020
Prez irt system-x_ti_iva_meetup_opentransport_05.11.2020
 
Prez geomob plan_de_mobilite_meetup_open_transport_05.11.2020
Prez geomob plan_de_mobilite_meetup_open_transport_05.11.2020Prez geomob plan_de_mobilite_meetup_open_transport_05.11.2020
Prez geomob plan_de_mobilite_meetup_open_transport_05.11.2020
 
Prez fabrique mobilites_gabriel_plassat_meetup_open_transport_05.11.2020
Prez fabrique mobilites_gabriel_plassat_meetup_open_transport_05.11.2020Prez fabrique mobilites_gabriel_plassat_meetup_open_transport_05.11.2020
Prez fabrique mobilites_gabriel_plassat_meetup_open_transport_05.11.2020
 
Prez ultl meetup_open_transport_paris_20032019
Prez ultl meetup_open_transport_paris_20032019Prez ultl meetup_open_transport_paris_20032019
Prez ultl meetup_open_transport_paris_20032019
 

Prez labo paris_6_meetup_open_transport_paris_17042019

  • 1. APPORT DES TECHNIQUES D’INTELLIGENCE ARTIFICIELLE POUR LE TRANSPORT 17 avril 2019 Vincent Guigue
  • 2. Introduction Applications Conclusion Short resume 98-2001 Ingénieur en mécanique (INSA de Rouen) 2005 PhD : Traitement du signal & SVM S. Canu & A. Rakotomamonjy 2006 Maître de conférences LIP6, Sorbonne Université (ex UPMC) Equipe MLIA, Patrick Gallinari Centres d’intérêt: Données textuelles Apprentissage de profils divers en particulier, les personnes et les textes Systèmes de transport intelligent Interface Cerveau-Machine (BCI) Transport et IA 2/12
  • 3. Introduction Applications Conclusion Données spatio-temporelles Capter des positions = différentes sources Différentes caractéristiques ± bruit / manque de précision ± coupures de signaux ± informations de contexte (activité, intention, ...) Données billétiques (parisiennes) Uniquement les entrées Données manquantes (fraude / pb de capteurs) Imprécisions (réseau bus) Transport et IA 3/12
  • 4. Introduction Applications Conclusion Données billétiques Traces spatio-temporelles triplets: temps, station, usager Ile de France Mobilités 13 semaines 80M de logs, 600k usagers, 20k stations (300 de métro) week00 week01 week02 week03 week04 week05 week06 week07 week08 week09 week10 week11 week12 week13 Différentes problématiques, différentes échelles Politiques de développement [Black et al., 2002, Golias, 2002] Prédiction du trafic [Ceapa et al., 2012, Louail et al., 2014] Détection d’anomalies [Tonnelier et al., 2017] Analyse des comportements d’usagers [Poussevin et al., 2014] Prédiction de log [Song et al., 2010, Foell et al., 2013] Transport et IA 4/12
  • 5. Introduction Applications Conclusion Des statistiques au machine-learning Au niveau statistique: sondage (EGT) ⇒ analyse de log Cette période correspond à la fois aux plus faibles volumes de validation et aux comportements les moins reproductibles (sorties ponctuelles, lieux variables, ...). Ces deux facteurs vont dans le même sens : il faut un échantillonnage très serré pour décrire de manière robuste les phénomènes rare. Les données billétiques sont plus à même de proposer une description efficace de ce qui se passe sur cette période. 07h-09h 09h-16h30 16h30-19h30 19h30-07h EGT - 2014 0.80117917 0.56945029 0.73599937 1.07044505 EGT - 2015 0.75419758 0.52067299 0.68501185 1.0038716 2014 - 2015 0.01930336 0.02018346 0.01791501 0.026127 TABLE 1 – Divergence KL entre les sources de données (agrégation des différentes origines). Les principaux écarts sont en rouge, les plus faibles en vert. Comparaison spatiale Nous proposons ensuite d’étudier les divergences du point de vue spatial en figure 8. Concernant les écarts entre données billétiques et EGT, la projection spatiale est malheureusement difficile à interpréter : les écarts sont biaisés par les volumes. La conclusion générale serait : plus il y a de volume à partir d’une origine, plus il y a d’écart entre les mesures 5 . Nous nous attendions à des écarts sensibles autour des gares ouvertes du réseau partant de St Lazare 6 , mais il n’y a aucun phénomène statistique marquant. En ce qui concerne les écarts entre données billétiques 2014 et 2015 (figure 8, droite), deux conclusions s’imposent : d’une part, les écarts sont faibles (au moins 25 fois plus faibles que les écarts entre EGT et données billétiques) et d’autre part ces écarts sont concentrés sur le réseau issu de la gare du nord et la zone entourant la forêt de Sénart (Vigneux-sur-seine). Analyses temporelles, spatiales, modales, ... Enjeux: Dépasser les statistiques pour comprendre les usages, prédire les flux Transport et IA 5/12
  • 6. Introduction Applications Conclusion Séparation de sources et comportement usager Usage = phénomène collectif... ... avec des variations personnelles 8am Week days 7pm Week days 11pm Thursdays 5 usagers (aléatoires) données agrégées sur 24h 0 5 10 15 20 0 5 10 15 20 0 5 10 15 20 0 5 10 15 20 0 5 10 15 20 ⇒ Dictionnaire: 0 5 10 15 20 E=2.6e+01 0 5 10 15 20 E=2.5e+01 0 5 10 15 20 E=2.4e+01 0 5 10 15 20 E=2.1e+01 0 5 10 15 20 E=2e+01 Code: 0 2 4 6 8 0 1 2 3 4 Transport et IA 6/12
  • 7. Introduction Applications Conclusion Séparation de sources et comportement usager Usage = phénomène collectif... ... avec des variations personnelles 8am Week days 7pm Week days 11pm Thursdays Focus sur l’usager #1 0 5 10 15 20 Dictionnaire: 0 5 10 15 20 E=2.6e+01 0 5 10 15 20 E=2.5e+01 0 5 10 15 20 E=2.4e+01 0 5 10 15 20 E=2.1e+01 0 5 10 15 20 E=2e+01 Code: 0 2 4 6 8 0 1 2 3 4 Transport et IA 6/12
  • 8. Introduction Applications Conclusion Séparation de sources et comportement usager Usage = phénomène collectif... ... avec des variations personnelles 8am Week days 7pm Week days 11pm Thursdays Focus sur l’usager #1 0 5 10 15 20 25 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.14 0.16 0.18 Dictionnaire: 0 5 10 15 20 E=2.6e+01 0 5 10 15 20 E=2.5e+01 0 5 10 15 20 E=2.4e+01 0 5 10 15 20 E=2.1e+01 0 5 10 15 20 E=2e+01 Code: 0 2 4 6 8 0 1 2 3 4 Transport et IA 6/12
  • 9. Introduction Applications Conclusion Séparation de sources et comportement usager Usage = phénomène collectif... ... avec des variations personnelles 8am Week days 7pm Week days 11pm Thursdays Focus sur l’usager #1 0 5 10 15 20 25 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.14 0.16 0.18 Dictionnaire: 0 5 10 15 20 E=2.6e+01 0 5 10 15 20 E=2.5e+01 0 5 10 15 20 E=2.4e+01 0 5 10 15 20 E=2.1e+01 0 5 10 15 20 E=2e+01 Code: 0 2 4 6 8 0 1 2 3 4 Transport et IA 6/12
  • 10. Introduction Applications Conclusion Séparation de sources et comportement usager Usage = phénomène collectif... ... avec des variations personnelles 8am Week days 7pm Week days 11pm Thursdays Focus sur l’usager #1 0 5 10 15 20 25 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.14 0.16 0.18 Dictionnaire: 0 5 10 15 20 E=2.6e+01 0 5 10 15 20 E=2.5e+01 0 5 10 15 20 E=2.4e+01 0 5 10 15 20 E=2.1e+01 0 5 10 15 20 E=2e+01 Code: 0 2 4 6 8 0 1 2 3 4 Transport et IA 6/12
  • 11. Introduction Applications Conclusion Séparation de sources et comportement usager Usage = phénomène collectif... ... avec des variations personnelles 8am Week days 7pm Week days 11pm Thursdays Focus sur l’usager #1 0 5 10 15 20 25 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.14 0.16 0.18 Dictionnaire: 0 5 10 15 20 E=2.6e+01 0 5 10 15 20 E=2.5e+01 0 5 10 15 20 E=2.4e+01 0 5 10 15 20 E=2.1e+01 0 5 10 15 20 E=2e+01 Code: 0 2 4 6 8 0 1 2 3 4 Transport et IA 6/12
  • 12. Introduction Applications Conclusion Séparation de sources et comportement usager Usage = phénomène collectif... ... avec des variations personnelles 8am Week days 7pm Week days 11pm Thursdays Focus sur l’usager #1 0 5 10 15 20 25 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.14 0.16 0.18 Dictionnaire: 0 5 10 15 20 E=2.6e+01 0 5 10 15 20 E=2.5e+01 0 5 10 15 20 E=2.4e+01 0 5 10 15 20 E=2.1e+01 0 5 10 15 20 E=2e+01 Code: 0 2 4 6 8 0 1 2 3 4 Transport et IA 6/12
  • 13. Introduction Applications Conclusion Séparation de sources et comportement usager Usage = phénomène collectif... ... avec des variations personnelles 8am Week days 7pm Week days 11pm Thursdays Focus sur l’usager #1 0 5 10 15 20 Dictionnaire: 0 5 10 15 20 E=2.6e+01 0 5 10 15 20 E=2.5e+01 0 5 10 15 20 E=2.4e+01 0 5 10 15 20 E=2.1e+01 0 5 10 15 20 E=2e+01 Code: 0 2 4 6 8 0 1 2 3 4 Transport et IA 6/12
  • 14. Introduction Applications Conclusion Séparation de sources et comportement usager Usage = phénomène collectif... ... avec des variations personnelles 8am Week days 7pm Week days 11pm Thursdays Focus sur l’usager #1 Catégorisation de la population Distinction des activités [Poussevin et al., 2014] Distinction des heures de réalisation des activités [Tonnelier et al., 2016] Dictionnaire: 0 5 10 15 20 E=2.6e+01 0 5 10 15 20 E=2.5e+01 0 5 10 15 20 E=2.4e+01 0 5 10 15 20 E=2.1e+01 0 5 10 15 20 E=2e+01 Code: 0 2 4 6 8 0 1 2 3 4 Transport et IA 6/12
  • 15. Introduction Applications Conclusion Projection spatiale des comportements gare de lyon marcadet poissonniers montgallet ranelagh villejuif louis aragon aubervilliers pantin porte de la chapelle campo formio billancourt chardon lagache pyramides couronnes danube volontaires saint maur telegraphe kleber monceau gare de l'est lourmel reaumur sebastopol ternes maraichers creteil pointe du lac charonne porte de bagnolet commerce tuileries villiersrome saint fargeau vaugirard ecole militaire buzenval chateau landon bir hakeim trinite d'estienne d'orves olympiades bel air gaite bolivar pyrenees pont marie rambuteau sevres lecourbe pont de levallois becon jacques bonsergent botzaris porte de vincennes montparnasse belleville franklin roosevelt pigalle reuilly diderot felix faure convention picpus nationale pont de sevres victor hugo plaisance jaures pont de neuilly blanche jules joffrin les agnettes ourcq palais royaltrocadero madeleine colonel fabien le kremlin bicetre richelieu drouot la chapelle europe charenton ecoles porte doree saint michel duroc bourse varenne mairie de montreuil vaneau creteil universite filles du calvaire odeon temple wagram 8 mai 1945 porte de charenton sevres babylone george v pelleport concorde malakoff rue etienne dolet creteil prefecture rennes porte de pantin dupleix michel bizot charles de gaulle etoile bastille mirabeau corentin cariou chaussee d'antin chateau rouge chevaleret brochant miromesnil crimee alexandre dumas avenue emile zola opera saint philippe du roule menilmontant place des fetes edgar quinet chateau d'eau saint sulpice la defense mairie de clichy gare du nordcourcelles glaciere creteil l'echat porte de vanves poissonniere pont neuf notre dame de lorette gabriel peri quai de la rapeejavel saint marcel corvisart charles michels maisons alfort stade louis blanc basilique de saint denis assemblee nationale michel ange auteuil les sablons cambronne malesherbes goncourtstrasbourg saint denis maisons alfort les juilliottes porte des lilas les gobelins pierre et marie curie hoche porte de la villette place monge argentine saint sebastien froissart pere lachaise boulogne pont de saint cloud eglise d'auteuil gallieni bibliotheque francois mitterrand place d'italie bobigny pantin jourdain laumiere etienne marcel buttes chaumont place de clichy bonne nouvelle villejuif leo lagrange corentin celton louise michel rue des boulets falguiere riquet mairie de saint ouen iena louvre rivoli la motte picquet grenelle sully morland bobigny pablo picasso berault avron sentier austerlitz la muette stalingrad carrefour pleyel maubert mutualite exelmans quatre septembre boissiere maison blanche bercy rue de la pompe grands boulevards porte de clignancourt michel ange molitor fort d'aubervilliers les halles segur saint jacques ecole veterinaire de maisons alfort villejuif paul vaillant couturier saint francois xavier porte de montreuil porte de versailles quai de la gare champs elysees clemenceau saint germain des pres mairie des lilas alma marceau pre saint gervais saint lazare pereire porte d'orleans chatillon montrouge anatole france lamarck caulaincourt pasteur raspail pernety alesia marcel sembat cardinal lemoine denfert rochereau republique mouton duvernet le peletier eglise de pantin les courtilles asnieres gennevilliers mabillon croix de chavaux saint ambroise porte de saint ouen notre dame des champs breguet sabin saint mande porte de clichy invalides boucicaut havre caumartin marx dormoy porte de choisy liege porte de saint cloud vavin liberte cour saint emilion saint placide porte d'ivry mairie d'issy porte maillot la tour maubourg censier daubenton cadet jasmin barbes rochechouart jussieu porte dauphine richard lenoir ledru rollin arts et metiers porte d'italie saint georges esplanade de la defense saint denis universite mairie d'ivry oberkampf faidherbe chaligny balard saint paul malakoff plateau de vanves simplon daumesnil chateau de vincennes saint augustin guy moquet robespierre voltaire porte de champerret garibaldi hotel de ville gambetta citerue du bac saint denis porte de paris parmentier solferino chatelet porte d'auteuil tolbiac dugommier anvers nation abbesses boulogne jean jaures passy chemin vert la fourche philippe auguste c01 c02 c03 c04 c05 Transport et IA 7/12
  • 16. Introduction Applications Conclusion Projection spatiale des comportements Analyse différentiée des comportements gare de lyon marcadet poissonniers montgallet ranelagh villejuif louis aragon aubervilliers pantin porte de la chapelle campo formio billancourt chardon lagache pyramides couronnes danube volontaires saint maur telegraphe kleber monceau gare de l'est lourmel reaumur sebastopol ternes maraichers creteil pointe du lac charonne porte de bagnolet commerce tuileries villiersrome saint fargeau vaugirard ecole militaire buzenval chateau landon bir hakeim trinite d'estienne d'orves olympiades bel air gaite bolivar pyrenees pont marie rambuteau sevres lecourbe pont de levallois becon jacques bonsergent botzaris porte de vincennes montparnasse belleville franklin roosevelt pigalle reuilly diderot felix faure convention picpus nationale pont de sevres victor hugo plaisance jaures pont de neuilly blanche jules joffrin les agnettes ourcq palais royaltrocadero madeleine colonel fabien le kremlin bicetre richelieu drouot la chapelle europe charenton ecoles porte doree saint michel duroc bourse varenne mairie de montreuil vaneau creteil universite filles du calvaire odeon temple wagram 8 mai 1945 porte de charenton sevres babylone george v pelleport concorde malakoff rue etienne dolet creteil prefecture rennes porte de pantin dupleix michel bizot charles de gaulle etoile bastille mirabeau corentin cariou chaussee d'antin chateau rouge chevaleret brochant miromesnil crimee alexandre dumas avenue emile zola opera saint philippe du roule menilmontant place des fetes edgar quinet chateau d'eau saint sulpice la defense mairie de clichy gare du nordcourcelles glaciere creteil l'echat porte de vanves poissonniere pont neuf notre dame de lorette gabriel peri quai de la rapeejavel saint marcel corvisart charles michels maisons alfort stade louis blanc basilique de saint denis assemblee nationale michel ange auteuil les sablons cambronne malesherbes goncourtstrasbourg saint denis maisons alfort les juilliottes porte des lilas les gobelins pierre et marie curie hoche porte de la villette place monge argentine saint sebastien froissart pere lachaise boulogne pont de saint cloud eglise d'auteuil gallieni bibliotheque francois mitterrand place d'italie bobigny pantin jourdain laumiere etienne marcel buttes chaumont place de clichy bonne nouvelle villejuif leo lagrange corentin celton louise michel rue des boulets falguiere riquet mairie de saint ouen iena louvre rivoli la motte picquet grenelle sully morland bobigny pablo picasso berault avron sentier austerlitz la muette stalingrad carrefour pleyel maubert mutualite exelmans quatre septembre boissiere maison blanche bercy rue de la pompe grands boulevards porte de clignancourt michel ange molitor fort d'aubervilliers les halles segur saint jacques ecole veterinaire de maisons alfort villejuif paul vaillant couturier saint francois xavier porte de montreuil porte de versailles quai de la gare champs elysees clemenceau saint germain des pres mairie des lilas alma marceau pre saint gervais saint lazare pereire porte d'orleans chatillon montrouge anatole france lamarck caulaincourt pasteur raspail pernety alesia marcel sembat cardinal lemoine denfert rochereau republique mouton duvernet le peletier eglise de pantin les courtilles asnieres gennevilliers mabillon croix de chavaux saint ambroise porte de saint ouen notre dame des champs breguet sabin saint mande porte de clichy invalides boucicaut havre caumartin marx dormoy porte de choisy liege porte de saint cloud vavin liberte cour saint emilion saint placide porte d'ivry mairie d'issy porte maillot la tour maubourg censier daubenton cadet jasmin barbes rochechouart jussieu porte dauphine richard lenoir ledru rollin arts et metiers porte d'italie saint georges esplanade de la defense saint denis universite mairie d'ivry oberkampf faidherbe chaligny balard saint paul malakoff plateau de vanves simplon daumesnil chateau de vincennes saint augustin guy moquet robespierre voltaire porte de champerret garibaldi hotel de ville gambetta citerue du bac saint denis porte de paris parmentier solferino chatelet porte d'auteuil tolbiac dugommier anvers nation abbesses boulogne jean jaures passy chemin vert la fourche philippe auguste c01 c02 c03 c04 c05 high day high week medium day medium week low day low week Transport et IA 7/12
  • 17. Introduction Applications Conclusion Prédiction de flux Signaux stationnaires Modèle de référence = moyenne du passé (jour, station) Idée: exploiter des réseaux à mémoire [Gers et al., 1999] − de monde le matin ⇒ − de monde le soir Impossible avec les modèles makoviens Difficile avec les modèles AR / ARIMA Un modèle par station We propose three recurrent architectures, introducing three different ways of dealing with spatial context. Two of them model it implicitly while the third one explicitly learns it. Each architecture is composed of a recurrent encoder E transforming the observations into hidden latent states. These states are then decoded into predictions using a linear layer D. Each of the models can then be completed with temporal context. Univariate RNN First of all, we consider each station separately. That is, we explicitly train S distinct RNNs over as many matrices of samples Xs 2 RN⇥T . In this case the input dimension of each RNN is 1, i.e. we compute p(xs t+1|xs t , ..., xs 0). The underlying assumption is that every station has a different dynamics and therefore requires a singular RNN. At time step t, for a station s the observation xs t 2 R and hidden state hs t 2 Rh are encoded via a singular encoder Es into a hidden state representing only this station, then decoded into a single- valued prediction ˆxs t+1. The process is described in Equation 1 and Figure 1. 8(s, t) 2 {1, .., S} ⇥ {1, .., T 1}, ˆxs t+1 = Ds (hs t+1) = Ds (Es (xs t , hs t )) (1) Observation Prediction Linear decoder Ds Encoder Es  S distinct decoders  S distinct encoders  Figure 1: Computing one station’s s predictions using the univariate architecture. Vector xs of observations is processed by a dedicated recurrent encoder Es which computes a hidden state hs t+1 for each t which is decoded into the prediction by Ds .Transport et IA 8/12
  • 18. Introduction Applications Conclusion Prédiction de flux Signaux stationnaires Modèle de référence = moyenne du passé (jour, station) Idée: exploiter des réseaux à mémoire [Gers et al., 1999] − de monde le matin ⇒ − de monde le soir Impossible avec les modèles makoviens Difficile avec les modèles AR / ARIMA Un modèle unique pour le réseau Under review as a conference paper at ICLR 2019 Observations Predictions Linear decoder DRecurrent encoder E  Figure 2: Computing predictions using the multivariate architecture. Vector x of observations is processed by a recurrent encoder which computes a hidden state ht+1 for each t. This state, which Transport et IA 8/12
  • 19. Introduction Applications Conclusion Prédiction de flux Signaux stationnaires Modèle de référence = moyenne du passé (jour, station) Idée: exploiter des réseaux à mémoire [Gers et al., 1999] − de monde le matin ⇒ − de monde le soir Impossible avec les modèles makoviens Difficile avec les modèles AR / ARIMA Un modèle contextuel (modèle unique, représentation du contexte fournie) Multivariate RNN - that allows to take into account the correlations between the statio y reduces the number of weights. ime, spatial context is explicitly learned in the form of a matrix of spatial embe RS⇥ s , hence the name Spatial RNN. For each station s, the corresponding emb oncatenated to the observation as in Equation 3 where c is the concatenation operation e step t, for a station s, the observation xs t 2 R is concatenated to the embedding zs 2 sulting vector and hidden state hs t 2 Rh are encoded via the common encoder E into a epresenting only this station. This state is then decoded into a single-valued prediction gure 3 for an illustration. 8(s, t) 2 {1, .., S} ⇥ {1, .., T 1}, ˆxs t+1 = D(hs t+1) = D(E(c(xs t , zs ), hs t )) Observation Prediction Linear decoder DRecurrent encoder E  3: Computing one station’s s predictions using the spatial architecture. ObservationTransport et IA 8/12
  • 20. Introduction Applications Conclusion Prédiction de flux : résultats Evolution de l’erreur en fonction de l’horizon de prédiction Prédiction sur un jour particulier non appris t+1 t+2 t+3 t+4 t+5 t+6 t+7 t+8 t+9 t+10 25 30 35 40 45 50 55 Increase in RMSE with the number of steps to predict Baseline Multivariate GRU Day&Time Multivariate GRU Spatial GRU Day&Time Spatial GRU Univariate GRU Day&Time Univariate GRU 04:00 05:00 06:00 07:00 08:00 09:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 00:00 01:00 02:00 03:00 0 200 400 600 800 Logs Wed - 2015-11-04 PONT DE LEVALLOIS-BECON Ground truth Baseline - RMSE = 108.60 Multivariate GRU - RMSE = 34.93 Univariate GRU - RMSE = 19.01 Spatial GRU - RMSE = 16.35 Transport et IA 9/12
  • 21. Introduction Applications Conclusion Prédiction/caractérisation des anomalies Modèle Usager Histo Logs Modèle Station Nouveaux Logs Ecarts Anomalies Ecarts Différents modèles Variations de flux sur une station : données brutes vs données analysées Variations des comportements des usagers : spatial / temporel Agrégation [résistance au bruit] Prédiction / caractérisation des anomalies Problème de supervision / évaluation [Tonnelier et al., 2017] Transport et IA 10/12
  • 22. Introduction Applications Conclusion Prédiction/caractérisation des anomalies Modèle Usager Histo Logs Modèle Station Nouveaux Logs Ecarts Anomalies Ecarts Différents modèles Variations de flux sur une station : données brutes vs données analysées Variations des comportements des usagers : spatial / temporel Agrégation [résistance au bruit] Prédiction / caractérisation des anomalies Problème de supervision / évaluation [Tonnelier et al., 2017] Transport et IA 10/12
  • 23. Introduction Applications Conclusion Conclusions et perspectives Nombreuses opportunités : Comportements d’usagers, de conducteurs, de réseaux, ... Peu de travaux en machine learning sur les données billétique Perspectives: Dépendances spatiales & temporelles dans les anomalies Applications connexes: Maintenance prédictive, prédictions climatiques, réseaux de capteurs ⇒ des séries spatio-temporelles multivariées RGPD : quelles données demain? Transport et IA 11/12
  • 24. Introduction Applications Conclusion Bibliography Black, J. A., Paez, A., and Suthanaya, P. A. (2002). Sustainable urban transportation: performance indicators and some analytical approaches. Journal of urban planning and development, 128(4):184–209. Ceapa, I., Smith, C., and Capra, L. (2012). Avoiding the crowds: understanding tube station congestion patterns from trip data. In ACM SIGKDD 2012, pages 134–141. ACM. Foell, S., Kortuem, G., Rawassizadeh, R., Phithakkitnukoon, S., Veloso, M., and Bento, C. (2013). Mining temporal patterns of transport behaviour for predicting future transport usage. In UbiComp 13, pages 1239–1248. ACM. Gers, F. A., Schmidhuber, J., and Cummins, F. (1999). Learning to forget: Continual prediction with lstm. Golias, J. C. (2002). Analysis of traffic corridor impacts from the introduction of the new athens metro system. Louail, T., Lenormand, M., Cantú, O. G., Picornell, M., Herranz, R., Frias-Martinez, E., Ramasco, J. J., and Barthelemy, M. (2014). From mobile phone data to the spatial structure of cities. arXiv:1401.4540. Poussevin, M., Baskiotis, N., Guigue, V., and Gallinari, P. (2014). Mining ticketing logs for usage characterization with nonnegative matrix factorization. In ECML, Workshop SenseML. Song, C., Qu, Z., Blumm, N., and Barabási, A.-L. (2010). Limits of predictability in human mobility. Science, 327(5968):1018–1021. Tonnelier, E., Baskiotis, N., Guigue, V., and Gallinari, P. (2016). Smart card in public transportation: designing a analysis system at the human scale. In ITSC. Tonnelier, E., Baskiotis, N., Guigue, V., and Gallinari, P. (2017). Anomaly detection and characterization in smart card logs using nmf and tweets. Transport et IA 12/12