Modélisation du comportement des usagers dans les réseaux de transports en commun à partir des données de billettique en Ile-de-France
Vincent Guigue, Maître de conférences au Laboratoire d’Informatique de Paris 6, Sorbonne Université
Nous nous intéressons depuis quelques années à l’analyse des données billéttiques d’Ile-de-France Mobilités. Nous avons travaillé successivement sur la prédiction des flux de passagers puis sur l’identification des anomalies sur le réseau. Pour ces deux tâches, la modélisation des usagers est la clé pour améliorer les modèles prédictifs et, à terme, sortir du paradigme de la boite noire; c’est à dire être capable d’expliquer l’usage individuel des transports et les implications sur le réseau.
2. Introduction Applications Conclusion
Short resume
98-2001 Ingénieur en mécanique (INSA de Rouen)
2005 PhD : Traitement du signal & SVM
S. Canu & A. Rakotomamonjy
2006 Maître de conférences
LIP6, Sorbonne Université (ex UPMC)
Equipe MLIA, Patrick Gallinari
Centres d’intérêt:
Données textuelles
Apprentissage de profils divers
en particulier, les personnes et les textes
Systèmes de transport intelligent
Interface Cerveau-Machine (BCI)
Transport et IA 2/12
3. Introduction Applications Conclusion
Données spatio-temporelles
Capter des positions = différentes sources
Différentes caractéristiques
± bruit / manque de précision
± coupures de signaux
± informations de contexte (activité, intention, ...)
Données billétiques (parisiennes)
Uniquement les entrées
Données manquantes
(fraude / pb de capteurs)
Imprécisions (réseau bus)
Transport et IA 3/12
4. Introduction Applications Conclusion
Données billétiques
Traces spatio-temporelles
triplets: temps, station, usager
Ile de France Mobilités
13 semaines
80M de logs, 600k usagers, 20k
stations (300 de métro)
week00
week01
week02
week03
week04
week05
week06
week07
week08
week09
week10
week11
week12
week13
Différentes problématiques, différentes échelles
Politiques de développement [Black et al., 2002, Golias, 2002]
Prédiction du trafic [Ceapa et al., 2012, Louail et al., 2014]
Détection d’anomalies [Tonnelier et al., 2017]
Analyse des comportements d’usagers [Poussevin et al., 2014]
Prédiction de log [Song et al., 2010, Foell et al., 2013]
Transport et IA 4/12
5. Introduction Applications Conclusion
Des statistiques au machine-learning
Au niveau statistique: sondage (EGT) ⇒ analyse de log
Cette période correspond à la fois aux plus faibles volumes de validation et aux comportements les
moins reproductibles (sorties ponctuelles, lieux variables, ...). Ces deux facteurs vont dans le même
sens : il faut un échantillonnage très serré pour décrire de manière robuste les phénomènes rare. Les
données billétiques sont plus à même de proposer une description efficace de ce qui se passe sur cette
période.
07h-09h 09h-16h30 16h30-19h30 19h30-07h
EGT - 2014 0.80117917 0.56945029 0.73599937 1.07044505
EGT - 2015 0.75419758 0.52067299 0.68501185 1.0038716
2014 - 2015 0.01930336 0.02018346 0.01791501 0.026127
TABLE 1 – Divergence KL entre les sources de données (agrégation des différentes origines). Les
principaux écarts sont en rouge, les plus faibles en vert.
Comparaison spatiale Nous proposons ensuite d’étudier les divergences du point de vue spatial
en figure 8. Concernant les écarts entre données billétiques et EGT, la projection spatiale est
malheureusement difficile à interpréter : les écarts sont biaisés par les volumes. La conclusion
générale serait : plus il y a de volume à partir d’une origine, plus il y a d’écart entre les mesures 5
.
Nous nous attendions à des écarts sensibles autour des gares ouvertes du réseau partant de St
Lazare 6
, mais il n’y a aucun phénomène statistique marquant.
En ce qui concerne les écarts entre données billétiques 2014 et 2015 (figure 8, droite), deux
conclusions s’imposent : d’une part, les écarts sont faibles (au moins 25 fois plus faibles que les écarts
entre EGT et données billétiques) et d’autre part ces écarts sont concentrés sur le réseau issu de la
gare du nord et la zone entourant la forêt de Sénart (Vigneux-sur-seine).
Analyses temporelles, spatiales, modales, ...
Enjeux:
Dépasser les statistiques pour comprendre les usages, prédire les flux
Transport et IA 5/12
7. Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
0 5 10 15 20
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
8. Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
0 5 10 15 20 25
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0.18
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
9. Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
0 5 10 15 20 25
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0.18
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
10. Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
0 5 10 15 20 25
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0.18
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
11. Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
0 5 10 15 20 25
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0.18
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
12. Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
0 5 10 15 20 25
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0.18
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
13. Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
0 5 10 15 20
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
14. Introduction Applications Conclusion
Séparation de sources et comportement usager
Usage = phénomène collectif...
... avec des variations personnelles
8am
Week days
7pm
Week days
11pm
Thursdays
Focus sur l’usager #1
Catégorisation de la population
Distinction des activités
[Poussevin et al., 2014]
Distinction des heures de
réalisation des activités
[Tonnelier et al., 2016]
Dictionnaire:
0 5 10 15 20
E=2.6e+01
0 5 10 15 20
E=2.5e+01
0 5 10 15 20
E=2.4e+01
0 5 10 15 20
E=2.1e+01
0 5 10 15 20
E=2e+01
Code:
0 2 4 6 8
0
1
2
3
4
Transport et IA 6/12
15. Introduction Applications Conclusion
Projection spatiale des comportements
gare de lyon
marcadet poissonniers
montgallet
ranelagh
villejuif louis aragon
aubervilliers pantin
porte de la chapelle
campo formio
billancourt
chardon lagache
pyramides
couronnes
danube
volontaires
saint maur
telegraphe
kleber
monceau
gare de l'est
lourmel
reaumur sebastopol
ternes
maraichers
creteil pointe du lac
charonne
porte de bagnolet
commerce
tuileries
villiersrome
saint fargeau
vaugirard
ecole militaire
buzenval
chateau landon
bir hakeim
trinite d'estienne d'orves
olympiades
bel air
gaite
bolivar
pyrenees
pont marie
rambuteau
sevres lecourbe
pont de levallois becon
jacques bonsergent
botzaris
porte de vincennes
montparnasse
belleville
franklin roosevelt
pigalle
reuilly diderot
felix faure
convention
picpus
nationale
pont de sevres
victor hugo
plaisance
jaures
pont de neuilly
blanche
jules joffrin
les agnettes
ourcq
palais royaltrocadero
madeleine
colonel fabien
le kremlin bicetre
richelieu drouot
la chapelle
europe
charenton ecoles
porte doree
saint michel
duroc
bourse
varenne
mairie de montreuil
vaneau
creteil universite
filles du calvaire
odeon
temple
wagram
8 mai 1945
porte de charenton
sevres babylone
george v
pelleport
concorde
malakoff rue etienne dolet
creteil prefecture
rennes
porte de pantin
dupleix
michel bizot
charles de gaulle etoile
bastille
mirabeau
corentin cariou
chaussee d'antin
chateau rouge
chevaleret
brochant
miromesnil
crimee
alexandre dumas
avenue emile zola
opera
saint philippe du roule
menilmontant
place des fetes
edgar quinet
chateau d'eau
saint sulpice
la defense
mairie de clichy
gare du nordcourcelles
glaciere
creteil l'echat
porte de vanves
poissonniere
pont neuf
notre dame de lorette
gabriel peri
quai de la rapeejavel
saint marcel
corvisart
charles michels
maisons alfort stade
louis blanc
basilique de saint denis
assemblee nationale
michel ange auteuil
les sablons
cambronne
malesherbes
goncourtstrasbourg saint denis
maisons alfort les juilliottes
porte des lilas
les gobelins
pierre et marie curie
hoche
porte de la villette
place monge
argentine
saint sebastien froissart
pere lachaise
boulogne pont de saint cloud
eglise d'auteuil
gallieni
bibliotheque francois mitterrand
place d'italie
bobigny pantin
jourdain
laumiere
etienne marcel
buttes chaumont
place de clichy
bonne nouvelle
villejuif leo lagrange
corentin celton
louise michel
rue des boulets
falguiere
riquet
mairie de saint ouen
iena
louvre rivoli
la motte picquet grenelle
sully morland
bobigny pablo picasso
berault
avron
sentier
austerlitz
la muette
stalingrad
carrefour pleyel
maubert mutualite
exelmans
quatre septembre
boissiere
maison blanche
bercy
rue de la pompe
grands boulevards
porte de clignancourt
michel ange molitor
fort d'aubervilliers
les halles
segur
saint jacques
ecole veterinaire de maisons alfort
villejuif paul vaillant couturier
saint francois xavier
porte de montreuil
porte de versailles
quai de la gare
champs elysees clemenceau
saint germain des pres
mairie des lilas
alma marceau
pre saint gervais
saint lazare
pereire
porte d'orleans
chatillon montrouge
anatole france
lamarck caulaincourt
pasteur
raspail
pernety
alesia
marcel sembat
cardinal lemoine
denfert rochereau
republique
mouton duvernet
le peletier
eglise de pantin
les courtilles asnieres gennevilliers
mabillon
croix de chavaux
saint ambroise
porte de saint ouen
notre dame des champs
breguet sabin
saint mande
porte de clichy
invalides
boucicaut
havre caumartin
marx dormoy
porte de choisy
liege
porte de saint cloud
vavin
liberte
cour saint emilion
saint placide
porte d'ivry
mairie d'issy
porte maillot
la tour maubourg
censier daubenton
cadet
jasmin
barbes rochechouart
jussieu
porte dauphine
richard lenoir
ledru rollin
arts et metiers
porte d'italie
saint georges
esplanade de la defense
saint denis universite
mairie d'ivry
oberkampf
faidherbe chaligny
balard
saint paul
malakoff plateau de vanves
simplon
daumesnil
chateau de vincennes
saint augustin
guy moquet
robespierre
voltaire
porte de champerret
garibaldi
hotel de ville
gambetta
citerue du bac
saint denis porte de paris
parmentier
solferino chatelet
porte d'auteuil
tolbiac
dugommier
anvers
nation
abbesses
boulogne jean jaures
passy chemin vert
la fourche
philippe auguste
c01
c02
c03
c04
c05
Transport et IA 7/12
16. Introduction Applications Conclusion
Projection spatiale des comportements
Analyse différentiée des comportements
gare de lyon
marcadet poissonniers
montgallet
ranelagh
villejuif louis aragon
aubervilliers pantin
porte de la chapelle
campo formio
billancourt
chardon lagache
pyramides
couronnes
danube
volontaires
saint maur
telegraphe
kleber
monceau
gare de l'est
lourmel
reaumur sebastopol
ternes
maraichers
creteil pointe du lac
charonne
porte de bagnolet
commerce
tuileries
villiersrome
saint fargeau
vaugirard
ecole militaire
buzenval
chateau landon
bir hakeim
trinite d'estienne d'orves
olympiades
bel air
gaite
bolivar
pyrenees
pont marie
rambuteau
sevres lecourbe
pont de levallois becon
jacques bonsergent
botzaris
porte de vincennes
montparnasse
belleville
franklin roosevelt
pigalle
reuilly diderot
felix faure
convention
picpus
nationale
pont de sevres
victor hugo
plaisance
jaures
pont de neuilly
blanche
jules joffrin
les agnettes
ourcq
palais royaltrocadero
madeleine
colonel fabien
le kremlin bicetre
richelieu drouot
la chapelle
europe
charenton ecoles
porte doree
saint michel
duroc
bourse
varenne
mairie de montreuil
vaneau
creteil universite
filles du calvaire
odeon
temple
wagram
8 mai 1945
porte de charenton
sevres babylone
george v
pelleport
concorde
malakoff rue etienne dolet
creteil prefecture
rennes
porte de pantin
dupleix
michel bizot
charles de gaulle etoile
bastille
mirabeau
corentin cariou
chaussee d'antin
chateau rouge
chevaleret
brochant
miromesnil
crimee
alexandre dumas
avenue emile zola
opera
saint philippe du roule
menilmontant
place des fetes
edgar quinet
chateau d'eau
saint sulpice
la defense
mairie de clichy
gare du nordcourcelles
glaciere
creteil l'echat
porte de vanves
poissonniere
pont neuf
notre dame de lorette
gabriel peri
quai de la rapeejavel
saint marcel
corvisart
charles michels
maisons alfort stade
louis blanc
basilique de saint denis
assemblee nationale
michel ange auteuil
les sablons
cambronne
malesherbes
goncourtstrasbourg saint denis
maisons alfort les juilliottes
porte des lilas
les gobelins
pierre et marie curie
hoche
porte de la villette
place monge
argentine
saint sebastien froissart
pere lachaise
boulogne pont de saint cloud
eglise d'auteuil
gallieni
bibliotheque francois mitterrand
place d'italie
bobigny pantin
jourdain
laumiere
etienne marcel
buttes chaumont
place de clichy
bonne nouvelle
villejuif leo lagrange
corentin celton
louise michel
rue des boulets
falguiere
riquet
mairie de saint ouen
iena
louvre rivoli
la motte picquet grenelle
sully morland
bobigny pablo picasso
berault
avron
sentier
austerlitz
la muette
stalingrad
carrefour pleyel
maubert mutualite
exelmans
quatre septembre
boissiere
maison blanche
bercy
rue de la pompe
grands boulevards
porte de clignancourt
michel ange molitor
fort d'aubervilliers
les halles
segur
saint jacques
ecole veterinaire de maisons alfort
villejuif paul vaillant couturier
saint francois xavier
porte de montreuil
porte de versailles
quai de la gare
champs elysees clemenceau
saint germain des pres
mairie des lilas
alma marceau
pre saint gervais
saint lazare
pereire
porte d'orleans
chatillon montrouge
anatole france
lamarck caulaincourt
pasteur
raspail
pernety
alesia
marcel sembat
cardinal lemoine
denfert rochereau
republique
mouton duvernet
le peletier
eglise de pantin
les courtilles asnieres gennevilliers
mabillon
croix de chavaux
saint ambroise
porte de saint ouen
notre dame des champs
breguet sabin
saint mande
porte de clichy
invalides
boucicaut
havre caumartin
marx dormoy
porte de choisy
liege
porte de saint cloud
vavin
liberte
cour saint emilion
saint placide
porte d'ivry
mairie d'issy
porte maillot
la tour maubourg
censier daubenton
cadet
jasmin
barbes rochechouart
jussieu
porte dauphine
richard lenoir
ledru rollin
arts et metiers
porte d'italie
saint georges
esplanade de la defense
saint denis universite
mairie d'ivry
oberkampf
faidherbe chaligny
balard
saint paul
malakoff plateau de vanves
simplon
daumesnil
chateau de vincennes
saint augustin
guy moquet
robespierre
voltaire
porte de champerret
garibaldi
hotel de ville
gambetta
citerue du bac
saint denis porte de paris
parmentier
solferino chatelet
porte d'auteuil
tolbiac
dugommier
anvers
nation
abbesses
boulogne jean jaures
passy chemin vert
la fourche
philippe auguste
c01
c02
c03
c04
c05
high day high week medium day medium week low day low week
Transport et IA 7/12
17. Introduction Applications Conclusion
Prédiction de flux
Signaux stationnaires
Modèle de référence = moyenne du passé (jour, station)
Idée: exploiter des réseaux à mémoire [Gers et al., 1999]
− de monde le matin ⇒ − de monde le soir
Impossible avec les modèles makoviens
Difficile avec les modèles AR / ARIMA
Un modèle par station
We propose three recurrent architectures, introducing three different ways of dealing with spatial
context. Two of them model it implicitly while the third one explicitly learns it. Each architecture
is composed of a recurrent encoder E transforming the observations into hidden latent states. These
states are then decoded into predictions using a linear layer D. Each of the models can then be
completed with temporal context.
Univariate RNN First of all, we consider each station separately. That is, we explicitly train S
distinct RNNs over as many matrices of samples Xs
2 RN⇥T
. In this case the input dimension of
each RNN is 1, i.e. we compute p(xs
t+1|xs
t , ..., xs
0). The underlying assumption is that every station
has a different dynamics and therefore requires a singular RNN.
At time step t, for a station s the observation xs
t 2 R and hidden state hs
t 2 Rh
are encoded via
a singular encoder Es
into a hidden state representing only this station, then decoded into a single-
valued prediction ˆxs
t+1. The process is described in Equation 1 and Figure 1.
8(s, t) 2 {1, .., S} ⇥ {1, .., T 1}, ˆxs
t+1 = Ds
(hs
t+1) = Ds
(Es
(xs
t , hs
t )) (1)
Observation Prediction
Linear decoder Ds
Encoder Es
S distinct
decoders
S distinct
encoders
Figure 1: Computing one station’s s predictions using the univariate architecture. Vector xs
of
observations is processed by a dedicated recurrent encoder Es
which computes a hidden state hs
t+1
for each t which is decoded into the prediction by Ds
.Transport et IA 8/12
18. Introduction Applications Conclusion
Prédiction de flux
Signaux stationnaires
Modèle de référence = moyenne du passé (jour, station)
Idée: exploiter des réseaux à mémoire [Gers et al., 1999]
− de monde le matin ⇒ − de monde le soir
Impossible avec les modèles makoviens
Difficile avec les modèles AR / ARIMA
Un modèle unique pour le réseau
Under review as a conference paper at ICLR 2019
Observations Predictions
Linear decoder DRecurrent encoder E
Figure 2: Computing predictions using the multivariate architecture. Vector x of observations is
processed by a recurrent encoder which computes a hidden state ht+1 for each t. This state, which
Transport et IA 8/12
19. Introduction Applications Conclusion
Prédiction de flux
Signaux stationnaires
Modèle de référence = moyenne du passé (jour, station)
Idée: exploiter des réseaux à mémoire [Gers et al., 1999]
− de monde le matin ⇒ − de monde le soir
Impossible avec les modèles makoviens
Difficile avec les modèles AR / ARIMA
Un modèle contextuel
(modèle unique, représentation du contexte fournie)
Multivariate RNN - that allows to take into account the correlations between the statio
y reduces the number of weights.
ime, spatial context is explicitly learned in the form of a matrix of spatial embe
RS⇥ s
, hence the name Spatial RNN. For each station s, the corresponding emb
oncatenated to the observation as in Equation 3 where c is the concatenation operation
e step t, for a station s, the observation xs
t 2 R is concatenated to the embedding zs
2
sulting vector and hidden state hs
t 2 Rh
are encoded via the common encoder E into a
epresenting only this station. This state is then decoded into a single-valued prediction
gure 3 for an illustration.
8(s, t) 2 {1, .., S} ⇥ {1, .., T 1}, ˆxs
t+1 = D(hs
t+1) = D(E(c(xs
t , zs
), hs
t ))
Observation Prediction
Linear decoder DRecurrent encoder E
3: Computing one station’s s predictions using the spatial architecture. ObservationTransport et IA 8/12
20. Introduction Applications Conclusion
Prédiction de flux : résultats
Evolution de l’erreur
en fonction de
l’horizon de
prédiction
Prédiction sur un
jour particulier
non appris
t+1 t+2 t+3 t+4 t+5 t+6 t+7 t+8 t+9 t+10
25
30
35
40
45
50
55
Increase in RMSE with the number of steps to predict
Baseline
Multivariate GRU
Day&Time Multivariate GRU
Spatial GRU
Day&Time Spatial GRU
Univariate GRU
Day&Time Univariate GRU
04:00
05:00
06:00
07:00
08:00
09:00
10:00
11:00
12:00
13:00
14:00
15:00
16:00
17:00
18:00
19:00
20:00
21:00
22:00
23:00
00:00
01:00
02:00
03:00
0
200
400
600
800
Logs
Wed - 2015-11-04 PONT DE LEVALLOIS-BECON
Ground truth
Baseline - RMSE = 108.60
Multivariate GRU - RMSE = 34.93
Univariate GRU - RMSE = 19.01
Spatial GRU - RMSE = 16.35
Transport et IA 9/12
21. Introduction Applications Conclusion
Prédiction/caractérisation des anomalies
Modèle
Usager
Histo
Logs
Modèle
Station
Nouveaux
Logs
Ecarts
Anomalies
Ecarts
Différents modèles
Variations de flux sur une station :
données brutes vs données analysées
Variations des comportements des usagers : spatial / temporel
Agrégation [résistance au bruit]
Prédiction / caractérisation des anomalies
Problème de supervision / évaluation [Tonnelier et al., 2017]
Transport et IA 10/12
22. Introduction Applications Conclusion
Prédiction/caractérisation des anomalies
Modèle
Usager
Histo
Logs
Modèle
Station
Nouveaux
Logs
Ecarts
Anomalies
Ecarts
Différents modèles
Variations de flux sur une station :
données brutes vs données analysées
Variations des comportements des usagers : spatial / temporel
Agrégation [résistance au bruit]
Prédiction / caractérisation des anomalies
Problème de supervision / évaluation [Tonnelier et al., 2017]
Transport et IA 10/12
23. Introduction Applications Conclusion
Conclusions et perspectives
Nombreuses opportunités :
Comportements d’usagers, de conducteurs, de réseaux, ...
Peu de travaux en machine learning sur les données billétique
Perspectives:
Dépendances spatiales & temporelles dans les anomalies
Applications connexes:
Maintenance prédictive, prédictions
climatiques, réseaux de capteurs
⇒ des séries spatio-temporelles multivariées
RGPD : quelles données demain?
Transport et IA 11/12
24. Introduction Applications Conclusion
Bibliography
Black, J. A., Paez, A., and Suthanaya,
P. A. (2002).
Sustainable urban transportation:
performance indicators and some analytical
approaches.
Journal of urban planning and development,
128(4):184–209.
Ceapa, I., Smith, C., and Capra, L. (2012).
Avoiding the crowds: understanding tube
station congestion patterns from trip data.
In ACM SIGKDD 2012, pages 134–141.
ACM.
Foell, S., Kortuem, G., Rawassizadeh, R.,
Phithakkitnukoon, S., Veloso, M., and
Bento, C. (2013).
Mining temporal patterns of transport
behaviour for predicting future transport
usage.
In UbiComp 13, pages 1239–1248. ACM.
Gers, F. A., Schmidhuber, J., and
Cummins, F. (1999).
Learning to forget: Continual prediction
with lstm.
Golias, J. C. (2002).
Analysis of traffic corridor impacts from the
introduction of the new athens metro
system.
Louail, T., Lenormand, M., Cantú, O. G.,
Picornell, M., Herranz, R., Frias-Martinez,
E., Ramasco, J. J., and Barthelemy, M.
(2014).
From mobile phone data to the spatial
structure of cities.
arXiv:1401.4540.
Poussevin, M., Baskiotis, N., Guigue, V.,
and Gallinari, P. (2014).
Mining ticketing logs for usage
characterization with nonnegative matrix
factorization.
In ECML, Workshop SenseML.
Song, C., Qu, Z., Blumm, N., and
Barabási, A.-L. (2010).
Limits of predictability in human mobility.
Science, 327(5968):1018–1021.
Tonnelier, E., Baskiotis, N., Guigue, V.,
and Gallinari, P. (2016).
Smart card in public transportation:
designing a analysis system at the human
scale.
In ITSC.
Tonnelier, E., Baskiotis, N., Guigue, V.,
and Gallinari, P. (2017).
Anomaly detection and characterization in
smart card logs using nmf and tweets.
Transport et IA 12/12