Luento Helsingin yliopisto Studia Generalia -sarjassa 6.10.2016, teemalla Tiede ratkaisee: big data. https://www.helsinki.fi/fi/uutiset/big-data-aloittaa-studia-generalian-tiede-ratkaisee-luentosarjan
Digivaalit 2015 - Mitä isot digitaaliset aineistot kertovat yhteiskunnasta ja vaikuttamisesta?
1. !
Digivaalit 2015
Mitä isot digitaaliset aineistot kertovat
yhteiskunnasta ja vaikuttamisesta?
Salla-Maaria Laaksonen
@jahapaula
Communication Research
Centre, University of Helsinki
!
Studia Generalia 6.10.2016
3. Ei vallankumousta.
Siirtyvätkö olemassa olevat valta-asetelmat myös
verkkoympäristöön, vai muodostaako verkkoympäristö
uuden median, jonka kautta perinteiset
valtarakenteet on mahdollista ohittaa?
Entä silloin, kun tutkitaan kuka määrittelee, mistä
verkossa keskustellaan?
Normalisaatio
-hypoteesi
Tasa-arvoistumis-
hypoteesi
(Resnick, 1997)
7. Tä
Sosiaalisesta ja
perinteisestä mediasta
kerätty laaja aineisto (n.
1,4 miljoonaa yksittäistä
viestiä)
!
● Ehdokkaiden Facebook-
päivitykset ja Twitter-viestit
● Kymmenillä eri hashtageilla
käytyä keskustelua (Twitter,
Instagram, Tumblr)
● Suomi24:n politiikka-aiheiset
viestit
● Perinteisen median politiikka-
kategorian uutiset valituista
medioista (n = 5427)
● Verkkoetnografiset
muistiinpanot
ruutukaappauksineen
11. Analyysissa tarvitaan
algoritmeja – ja tilastomenetelmiä
Vaalikeskustelun
teemojen
tunnistaminen
aihemallinnuksen
avulla
Agendavaikuttajien
tunnistaminen
kustomoidulla
Python-koodilla ja
regressioanalyysilla
Vaikuttajaindeksi
(Nelimarkka et al. 2015)
• Verkkojulkisuuden ja
median teemoihin
vaikuttivat
eduskuntapuolueiden
ehdokkaat, pienemmät
puolueet
todennäköisemmin
kuin isot puolueet.
• Nuorilla
naisehdokkailla
korkeampi
vaikuttajaindeksi
13. Small data antaa tulkinnan
Keskustelu
ehdokkaiden ja
kansalaisten
välillä erilaista
eri palveluissa:
Facebookissa
kannatetaan,
Twitterissä
ollaan
kriittisiä.
14. Big datan heikkous on
puuttuva konteksti
Verkkoetnografia
kuukauden ajan ennen
vaalipäivää
• osallistuva
havainnointi
• kenttämuistiinpanot
• ruutukaappaukset
15.
16. Hashtag-kampanjat
• Suora lobbaus vs. mobilisointi
• Vaikuttamistaktiikat: liittoumien rakentaminen, yleisen
mielipiteen muokkaus, mobilisointi (Jaatinen 1999)
• Ketterä keskustelunavaus: helppo, liikkuva, liimaava,
memeettinen, sidosryhmäkeskeinen
Kampanja-
sivusto
Äänestyslupaus Vaalilupaus
59
Viraali näkyvyys - argumentit ja emootiot
Images [1] [2]
17. Laskennallisuuden
haasteet
Muuttuvat viestinnän muodot:
• Tekstuaalinen – visuaalinen: kuvat,
videot, virtuaalimaailmat
• Reaaliaikaisuus, ”ephemeral net” (e.g.,
Snapchat)
• Algoritmit julkisuuden rakentajina (e.g.,
Grimmer & Steward, 2013; Gillespie,
2014)
!
Muuttuva käsitys yksityisestä ja julkisesta:
• Julkisesti yksityinen – yksityisesti
julkinen (Lange 2007)
• Anonyymi – pseudonyymi – identiteetti –
brändi
• Käytäjälle katoava konteksti (boyd,
2007)
!
Kysymykset datan omistajuudesta ja käytöstä
18. Palavat kysymykset
laskennalliselle
yhteiskuntatieteelle
!
Tiedätkö missä kontekstissa aineisto on syntynyt ja
kerätty?
(e.g. boyd & Crawford, 2012)
!
Oletko varma, että algoritmisi tekevät oikeita asioita?
(e.g. Grimmer & Stewart, 2013)
!
Mitä tapahtuu, kun aineistoa valitaan ja puhdistetaan?
(e.g. Ekbia et al., 2015)
Etnografinen
ote lisää
ymmärrystä
kontekstista
Ihmisen tekemät
havainnot
tukevat
tulkintoja
Laadulline ote ja
teoria tukevat
datan keräystä
+ big data
mahdollista
tulosten
yleistämisen
+ laskennallisuus
mahdollistaa
isompia data
aineistoja
19. • Yhteiskuntatiede tutkii populaatiota yleistämällä
otoksesta tai näytteestä – big data -ajattelu pyrkii
tallentamaan “koko” aineiston otoksen tai näytteen
sijaan (vrt. kuitenkin Kitchin, 2014)
• Big data näyttäytyy helposti teoriavapaana, mutta
syvällistä tietämystä aiheesta tarvitaan monessa
vaiheessa: aineistoa kerätessä ja rajatessa, sitä
analysoitaessa
• Laskennalliset menetelmät vaativat aineiston
koneluettavassa muodossa mutta kontekstin
ymmärtäminen vaatii myös laadullista tarkastelua –
monitieteisyys on voimaa ja pienikin data on arvokasta!
Lopuksi: