1. Analyse de l’usage des sytèmes
VLS (Velib)
pistes et travaux en cours
Etienne Côme
16/03/2012
2. Plan
Plan
1 Introduction
Données
Problématique
Statistique globales
2 Clustering des stations à partir de la matrice OD
3 Clustering des stations à partir de leurs profils d’usage temporel
Modèle génératif étudié
Analyse des résultats
4 Clustering spatio-temporel
Approche Générative
Autre pistes, factorisation de tenseur ...
Etienne Côme () Analyse de l’usage des sytèmes VLS (Velib) 16/03/2012 2 / 54
3. Introduction Données
Données
Données d’usage système VLS
Date départ ; Station départ ; Date retour ; Station de retour ; Type
abon.
Sources de données
Ouvertes : Barclays (Londre)
! Velib, 2 mois 600 mg de fichier texte ! :)
Minning
Données spatio-temporelles riches
Etienne Côme () Analyse de l’usage des sytèmes VLS (Velib) 16/03/2012 3 / 54
4. Introduction Données
Un mots sur les données Velib
Velib en quelques chiffres
1200 stations
≈ 40000 bornes
≈ 16000 vélos
≈ 100 000 trajets/jour
27% trajets = abonnements courte durée
73% trajets = abonnements longue durée
Etienne Côme () Analyse de l’usage des sytèmes VLS (Velib) 16/03/2012 4 / 54
5. Introduction Problématique
Problématique
Objectifs finaux
mise en oeuvre de nouveaux systèmes : planification des
nouveaux systèmes
amélioration du service : optimisation des politiques de
re-distribution
Problématiques
modèle de prédiction d’usage
recherche de motifs spatio-temporels
compréhension des usages
Etienne Côme () Analyse de l’usage des sytèmes VLS (Velib) 16/03/2012 5 / 54