Presentación de Esteban Moro (UCM) para Innodata, celebrado el 2 de julio de 2015 en Madrid y organizado por Adigital.
https://www.adigital.org/eventos/innodata/
4. @estebanmoro
Mejorar problemas que ya tenían respuesta
Responder a problemas que no tenían respuesta
Encontrar problemas que no sabíamos que teníamos
¿Datos no convencionales?
5. @estebanmoro
Somos lo que nos rodea
Renta ⬆︎
Cocktail
Art Gallery
Pool
Garden
Bank
Renta ⬇︎
Bar
Brewery
Grocery Store
Automotive
Datos de Foursquare para obtener el ADN comercial de las zonas
Renta de las personas está correlacionada con el ADN de la zona (R2 = 0.5)
Data: 65000 fsq venues in Madrid
9. @estebanmoro
Somos cómo nos movemos
Datos de movilidad para detectar si una persona está en paro
(Tweets geolocalizados)
Trabajando En paro
Menor movilidad geográfica, más probabilidad de estar en paro
10km
10. @estebanmoro
Datos de actividad para detectar el paro en una zona
(Tweets geolocalizados)
Torrijos, 26% paro
Sobrarbe, 7% paro
0 4 8 12 16 20
2%
Fracciónde
tweets
4%
6%
8%
Hor
a
Modelo sencillo: Paro = Actividad por la mañana
Dataset: 19.6 Million geolocalized tweets
A. Llorente, EM, et al, 2015
http://arxiv.org/abs/1411.3140
Somos cuándo actuamos
11. @estebanmoro
Somos lo que decimos o lo que hacemos?
Detectamos más o menos paro que oficialmente se declara? (por provincias)
Error = ModeloParo(Actividad) - Paro declarado
(Tweets geolocalizados)
Dataset: 19.6 Million geolocalized tweets
A. Llorente, EM, et al, 2015
http://arxiv.org/abs/1411.3140
30%
20%
10%
0%
-10%
-20%
-30%
Error
% Economía Sumergida
15 20 25 30 35
El modelo predice menos
paro que el oficial en las
provincias con mayor
economía sumergida