Tutoriaali http://datajournalismi.fi/tutoriaaleja/
Haaste: Mitkä ovat yleisimpiä ammatteja eduskuntavaaliehdokkaiden joukossa?
Vaaditut ohjelmat / työkalut:
Google Refine -ohjelma asennettuna
Sisältö tiivistetysti:
- Miten siivotaan Oikeusministerion ehdokasdatan sarake, jossa on ehdokkaiden itse ilmoittama arvo/ammatti/asema -tieto?
- Datan tuominen Google refineen
- Facet text facet
- Samankaltaisten klusterointi ja yhdistäminen
- Edit cells / split multi-valued cells
- Datan vieminen Refinesta exceliin
Tutoriaalissa käytettävä data:
Lataa data osoitteesta http://192.49.229.35/E2011/s/ehd_listat/kokomaa.htm
Suora linkki taulukkoon on http://192.49.229.35/E2011/s/ehd_listat/e2011ehd.xls
1. Google Refine
Datan siivousta tehokkaasti – Eduskuntavaaliehdokkaiden
itse ilmoittamat arvot/ammatit/asemat siivottuna
Antti Poikola – Otavan Opisto
Kuva: 1854 Broad Street cholera outbreak (wikipedia)
Attribution-Share Alike 1.0 Finland
2. Haaste: Mitkä ovat yleisimpiä
ammatteja eduskuntavaali-
Haaste: Millainen on ehdokkaiden poliittinen historia, kuka sai paljonkin ääniä aiemmissa vaaleissa?
ehdokkaiden joukossa?
Attribution-Share Alike 1.0 Finland