1. Missä mun data? – Kansalaisen digijälki
28.1.2020
#digijälki #missämundata #IHAN
2. Ohjelma #digijälki #missämundata #IHAN
8.30-09.00 Aamupala ja verkostoitumista
9.00-09.10 Tervetuloa
Antti Kivelä, johtaja, Sitra
9.10-09.40 Digijälki-selvityksen tulokset
Riitta Vänskä, asiantuntija, Sitra
09.40-10.10 Keynote: Personal data empowerment, information commons and politics
Paul-Olivier Dehaye, Founder of PersonalData.IO, Mathematician
10.10-10.20 Viewpoint via video: Children’s digital rights
Steven Vosloo, Policy Specialist in Digital Connectivity, UNICEF
10.20-10.50 Panel discussion: From darkness to brightness – how to build a better digital future
Virpi Hukkanen, Journalist, News and Current Affairs, Yle
Jussi Kivipuro, Development Director, Finnish Committee for UNICEF
Paul-Olivier Dehaye, Mathematician, Founder of PersonalData.IO
Moderator: Tiina Härkönen, Leading Specialist, Sitra
10.50-11.00 Mitä seuraavaksi? Kohti reilua ja ihmislähtöistä datataloutta
Jaana Sinipuro, projektijohtaja, Sitra
4. 5 tärkeää
1. Eduskunnan lahja 50-vuotiaalle Suomelle.
Edelleen suoraan eduskunnan alainen.
2. Riippumaton tulevaisuustalo: ennakoija,
herättelijä, visionääri, kehittäjä, kokeilija,
rahoittaja, yhteistyökumppani, kouluttaja ja
verkottaja.
3. Tehtävänä huomisen menestyvä Suomi,
visiona hyvinvoinnin seuraava erä
– reilu ja kestävä tulevaisuus.
4. Toiminta rahoitetaan peruspääoman ja
sijoitusten tuotoilla.
5. Visiota toteuttamassa kolme teemaa ja
satoja hankkeita.
+ se tärkein
Tulevaisuustyö on yhteistyötä.
#digijälki #missämundata #IHAN
5. Ekologisella
jälleen-
rakentamisella
on kiire
Verkostomainen
valta voimistuu
Teknologia
sulautuu
kaikkeen
Talous hakee
suuntaa
Väestö ikääntyy ja
monimuotoistuu
Uudenlaiset
heimot ja
yhteisöt
Keskitetyt päätökset vai laaja osallistuminen?
Ratkaisut mahdollisuutena vai uhkana?
Tulevaisuusvalta
Kestävyysvaje
Ympäristö resurssina vai
ympäristön tilan
parantaminen?
Reilu vai eriarvoistava siirtymä?
Työn ja
kulutuksen
muutos
#digijälki #missämundata #IHAN
7. 1. Miksi Digijälkiselvitys?
2. Selvityksen pääkysymykset
3. Selvityksessä käytetyt menetelmät
4. Tärkeimmät havainnot
5. Testihenkilöiden reflektointi
8. 1. Miksi Digijälkiselvitys?
Sitran kansalaistutkimus (2018)
– 7% suomalaisista oli pyytänyt pääsyä palveluntarjoajien
hänestä keräämään dataan
– 43% suomalaisista sanoo, että luottamuksen puute
palveluntarjoajia kohtaan estää käyttämästä digitaalisia palveluja
– 71% suomalaisista sanoo, että reilut palvelut pitää tunnistaa
DIGIJÄLKISELVITYS
Haluttiin selvittää kuuden esimerkin kautta, minne data kulkee digitaalisia palveluja
käytettäessä.
DIGIPROFIILITESTI
Auttaa ymmärtämään datatalouden toimintaperiaatteita ja antaa vinkkejä siitä, miten omaa
dataansa voi suojella.
9. SELVITYKSEN TEKIJÄT
• Sitra
• Futurice
• Paul-Olivier Dehaye
Mukana tuloksia seuraavista samankaltaisista tutkimuksista
• THE GREAT DATA RACE How commercial utilisation of personal data challenges privacy. Report, november 2015
https://www.datatilsynet.no/globalassets/global/english/engelsk-kommersialisering-endelig.pdf
• Princeton University: Online Tracking: a 1-million-site Measurement and Analysis 2016
http://randomwalker.info/publications/OpenWPM_1_million_site_tracking_measurement.pdf
• OUT OF CONTROL How consumers are exploited by the online advertising industry 2020
https://www.mnemonic.no/news/2020/out-of-control/
• WORLD ECONOMIC FORUM JULKAISU 1.2020
https://www.weforum.org/agenda/2020/01/how-to-restore-trust-in-data/
10. 2. Selvityksen pääkysymykset
1. Kuinka paljon ja kenelle meistä kertyy
dataa?
2. Mihin henkilökohtaista dataamme käytetään?
3. Tapahtuuko datan kerääminen/hyödyntäminen
GDPR:n mukaisesti?
4. Mitä dataa kerätään minun kauttani myös
muista (kontakteistani)?
5. Mitä kauppaa datallamme käydään?
6. Miten meitä profiloidaan/pisteytetään ja mihin
profiileja/pisteytystä käytetään?
11. 3. Selvityksessä käytetyt menetelmät
Kuusi testihenkilöä
Testihenkilöt, joiden datan kulkua selvitettiin
• 16-vuotias lukiolainen (poika)
• keski-ikäinen toimittaja (nainen)
• keski-ikäinen poliitikko (nainen)
• 22-vuotias yliopisto-opiskelija (nainen)
• eläkeläinen (nainen)
• johtavassa asemassa toimiva keski-ikäinen (mies)
12. 3. Selvityksessä käytetyt menetelmät
1. Verkkoliikennedatan analysointi
– Testihenkilöiden mobiilidataliikennettä tallennettiin noin kahden viikon ajan
– Testihenkilöt saivat käyttöönsä Android-testipuhelimen, johon oli asennettu VPN- ja monitorointisovellukset
2. Valittujen yritysten (14) tietosuojadokumentaatioiden vertailu
– Yritykset oli valittu testihenkilöiden käyttämistä digitaalisista palveluista
– Tietosuojaselosteista selvitettiin mitä tietoa yritykset keräävät ja millä tarkkuudella ne avaavat kerättyä dataa
sekä sen hyödyntämistä
3. Samojen yritysten vastaukset GDPR-lainsäädännön mukaisiin kysymyksiin
– Testihenkilöt lähettivät käyttämilleen yrityksille GDPR:n mukaisen pyynnön saada kopio omasta datastaan sekä
tarkentavia kysymyksiä
– Vastausten kautta selvitettiin millaista dataa palvelut keräävät käyttäjistä ja mm. miten palvelut kertovat datan
käyttöön liittyvistä kolmansista osapuolista ja profiloinnista
13. Monimutkaisessa ekosysteemissä useat toimijat sekä
keräävät että myyvät dataa
Notes: Simplified illustration – See more detailed description from the following pages, SSP = Supply side platform, DSP = Demand side platform, AdEx = Ad Exhange
DMP – Data management Platform
Sources: Project proposal, Sitra, Paul-Olivier Dehaye
Test persons
(6)
Terminals
Example
content
providers
Data users “Black Market”Middle-men
Monitoring
data flow of six
citizens
Only Android
phones in scope
15 service
providers in
scope
Data brokers
and other
middle-men
Not in scope
Marketers and
other data
users
Android
phones
Laptops
Voice
speaker
Wearab-
les, etc
#1
#2
#3
#4
#5
#6
SSP DSP
AdEx
DMP
More details on
Ecosystem on following
pages
14. 4. Tärkeimmät havainnot
• Datataloudessa on systeeminen ongelma: liiketoimintamallit.
• Yksilöllä ei ole realistista mahdollisuutta ymmärtää monimutkaisia
datatalouden markkinointi ekosysteemejä
• Datan kerääjien ja hyödyntäjien monimutkaisen verkoston takia
tietosuoja-asetuksen (GDPR) toimivuus on riittämätön
16. Yksilöllä ei ole realistista mahdollisuutta ymmärtää
monimutkaisia datatalouden markkinointiekosysteemejä
Netin käyttäjillä ei ole näkyvyyttä siihen mitä dataa hänestä kerätään, ja mille
kolmansille osapuolille dataa menee.
On luotettava palveluiden yleistäviin ja vaikeaselkoisiin
tietosuojalausekkeisiin ja käyttäjäehtoihin.
Tavallisen ihmisen on mahdoton ymmärtää myöskään kerätyn datan ja
kolmansien osapuolien määrää.
Monet kolmannet osapuolet vaihtavat saamaansa dataa keskenään. ID-
tunnisteeseen pohjautuva evästeiden yhdistely (cookie syncing).
17. Yksilöllä ei ole realistista mahdollisuutta ymmärtää
monimutkaisia datatalouden markkinointiekosysteemejä
- Mitä tämä tarkoittaa lapsille?
- Internet on tehty aikuisille.
- Lasten ei voi odottaa ymmärtävän käyttöehtoja, jotka ovat
vaikeaselkoisia aikuisillekin.
- Lapsista kerätään valtavia määriä dataa, sitä myydään eteenpäin ja
heitä profiloidaan siinä kuin aikuisiakin.
18. Esimerkki: New Yorkerin takana on erilaisia kolmansia
osapuolia, joista moni kerää dataa
Ääriesimerkkinä
yhdysvaltalainen
verkkolehti
newyorker.com:
datasta löytyi 56
erilaista kolmatta
osapuolta.
Sivun
tietosuojalausekkeen
mukaan tahoja on
vielä enemmän.
Webpage server
2 MB
Ad tech/
Marketing
730 kB
Social media
7 kB
Amazon Marketing
Services
Adobe Marketing Cloud
AdSense
AppNexus
Bounce Exchange
Criteo
DoubleClick
Index Exchange
LiveRamp
Moat
Media Math
PubMatic
Rubicon Project
Sonobi
TapAd
The Trade Desk
Turn
Other third-
party servers for
running the
service
64 kB
Twitter
Adobe Audience
Manager
Google Analytics
Quantcast
ScorecardResearch
Hotjar
(all Audience
measuring)
Uncategorized
385 kB
Recognized companies/serversCategory
condenastdigital.com
allure.com
architecturaldigest.com
bonappetit.com
epicurious.com
epicurious.com
glamour.com
golfdigest.com
gq.com
lennyletter.com
pitchfork.com
self.com
teenvogue.com
them.us
vanityfair.com
vogue.com
wired.com
wmagazine.com
*.chtbl.com
*.ad.gt
*.parsely.com
acdn.cookielaw.org
cdn.keywee.co
cdn.pdst.fm
cntraveler.com
events.bouncex.net
geolocation.onetrust.co
m
medtargetsystem.com
mid.rkdms.com
pixel.keywee.co
player.cnevids.com
sail-personalize.com
segment-data.zqtk.net
tr.snapchat.com
Other same
publisher’s
webpages
188 kB
19. Esimerkki: Subway Surfers käy kauppaa käyttäjädatalla,
jotta peli voidaan tarjota maksutta
First party
Game servers
Ad tech/
Marketing
Social media
Other third-party
servers for
running the
service
AdColonyChartboostMoat
Mintegral ironSource Tapjoy
Vungle
Akamai
(Hosting)
Facebook
Flurry Analytics
(App
optimization)
SubwaySurfers
Recognized companies/serversCategory
Datasta löytyi 10
erilaista kolmatta
osapuolta.
Seitsemän oli
kategoriassa mainonta
ja sen lisäksi
sosiaaliselle medialle
meni dataa
20. Garmin-sovellus: data ei paljastanut kolmansia osapuolia
Tulos on linjassa
tietosuojaselosteen kanssa,
jossa mainitaan vain kaksi
kolmatta osapuolta, ja
nekin ovat maksamiseen ja
laitteiden kuljetukseen
liittyviä.
21. Yhden testihenkilön datasta tunnistettiin 37
markkinointiin liittyvää kolmatta osapuolta. Nämä
keräsivät dataa yhteensä 22:lta sivustolta tai
sovelluksesta. Kolmansien osapuoleten kotimaat:
• EU: 9
• USA: 27
• Kanada: 1
Yhteensä mainonta/AdTech:
800 pakettia, 6.2 MB
Huom: AdTech-toimijat on tunnistettu http-kutsujen osoitteen mukaan ja kategorisointi perustuu WebXRay-tietokantaan. Osaa palveluista voidaaan
käyttää myös muihin tarkoituksiin kuin mainontaan. Kuvaajan linkit perustuvat http-kutsun 'referrer'-arvoon.
Mainontaan liittyvät toimijat
keräävät dataa ja
käyttäjätietoa useasta
lähteestä
Mainontaan liittyviä toimijoita
Eurooppa/USA/Muut
Nettisivuja ja
sovelluksia,
joita käyttäjä
käytti
37. Datan kerääjien ja hyödyntäjien monimutkaisen
verkoston takia tietosuoja-asetuksen (GDPR) toimivuus
on riittämätön
GDPR on ainoa tapa käyttäjien saada tietoa omasta datastaan.
Käyttäjät ymmärtävät kysyä tietoa käyttämistään palveluista
ensisijaisilta palveluntarjoajilta...
MUTTA
...eivät tunne kolmansia osapuolia, joille heidän datansa menee,
vaikka niiltäkin olisi oikeus pyytää dataansa.
39. ”Luulin, että datani jää
palveluntarjoajalle.”
- Toimittaja
”Tarvitaan asiantuntija
kertomaan yleiskielellä, että
tällainen se maailma on, johon
tieto lähtee kulkemaan. Ei sitä yksin
pysty ymmärtämään.”
-Toimittaja
”Pahin uhkakuva on se, että
dataa käytetään poliittiseen
manipulointiin.”
- 22-vuotias opiskelija
”Jos palvelut olisivat
läpinäkyvämpiä, se
kasvattaisi luottamusta.”
- 22-vuotias opiskelija
”Ei ollut yllättävää, että dataani
menee eri paikkoihin, mutta
kolmansien osapuolien määrä
yllätti.”
- 16-vuotias lukiolainen
Testihenkilöiden reflektointia
42. Datataloudessa on systeeminen ongelma:
liiketoimintamallit
• Ympäristö on niin monimutkainen, että alan asiantuntijoidenkin on mahdoton ymmärtää sen toimintaa
• Yksittäisten palvelujen takana on laaja verkosto tuntemattomia toimijoita, joilla ei ole asiakassuhdetta
palveluiden käyttäjiin
• Digitaalisen markkinoinnin liiketoimintamallit ovat lähtökohtaisesti haitallisia yksityisyyden kannalta
• Eurooppalaiset yritykset ovat investoineet valtavia määriä rahaa ja aikaa noudattakseen tietosuojalakia
43. Datatalouden digitaalisen markkinoinnin ekosysteemi
on kompleksinen ja sisältää paljon erilaisia toimijoita
Notes: Simplified illustration – See more detailed description from the following pages,
Sources: Project proposal, Sitra, Paul-Olivier Dehaye
Käyttäjän
käyttämät
palvelut
Mainostajat ja
muut datan
käyttäjät
“Black Market”
Data-
ekosysteemin
toimijoita
Ei mukana
selvityksessä
SSP DSP
AdEx
DMP
AdEx, advertising exchange on
mainoshuutokauppaa järjestävä taho
SSP, Supply side platform auttaa julkaisijoita
myymään mainostilaa
DSP, Demand side platform auttaa mainostajia
hallitsemaan mainosmyyntiään
DMP, data management platform, tallentaa eri
lähteistä kerättyä käyttäjädataa
Muita
toimijoita
66. A
B
Meaning = Information + Evolution, C. Rovelli
Semantic information, autonomous agency, and nonequilibrium statistical physics, A. Kolchinsky, D. Wolpert
DANGER
86. What can be done?
Negates:
● Our agency
● Our right to participate in science
● Our capacity to negotiate around
privacy concerns
Instead:
● user-centric science
● private data sharing
96. Imagine the power you would have…
Would you abuse it?
What is an abuse?
97. ● “algocracy”
○ bias concerns
○ justificatory
○ dignitary
● lack of effective democratic oversight
● lack of effective remedy
● all worse in a “minority of one”
Why should we care?
105. VIEWPOINT VIA VIDEO:
CHILDREN’S DIGITAL RIGHTS
Steven Vosloo
Policy Specialist in Digital Connectivity
UNICEF
#digijälki #missämundata #IHAN
106. PANEL DISCUSSION:
FROM DARKNESS TO BRIGHTNESS –
HOW TO BUILD A BETTER DIGITAL FUTURE
Virpi Hukkanen, Journalist, News and Current Affairs, Yle
Jussi Kivipuro, Development Director, Finnish Committee for UNICEF
Paul-Olivier Dehaye, Founder of PersonalData.IO, Mathematician
Moderator: Tiina Härkönen, Leading Specialist, Sitra
#digijälki #missämundata #IHAN
107. MITÄ SEURAAVAKSI?
KOHTI REILUA JA IHMISLÄHTÖISTÄ
DATATALOUTTA
Jaana Sinipuro
Projektijohtaja, Sitra
#digijälki #missämundata #IHAN
115. Data on noussut maailman arvokkaimmaksi
omaisuudeksi. Datataloudesta hyötyvät eniten
teknologiajätit vaikeasti ymmärrettävin
pelisäännöin. Kuluttajilla on rajallinen
ymmärrys ja vain vähän
vaikutusmahdollisuuksia datansa
hyödyntämiseen.
Sitran IHAN-projekti rakentaa perustuksia reilulle
datataloudelle, joka palauttaa luottamuksen
digitaalisiin palveluihin.
Reilun datatalouden verkostoissa data liikkuu
yksilön suostumuksella saumattomasti ja
läpinäkyvästi. Yksilöt saavat entistä
kohdennetumpia palveluja, yritykset kasvua
innovaatioista ja yhteiskunnan hyvinvointi
lisääntyy.
Eurooppa reilun datatalouden
edelläkävijäksi
116. IHAN-projektin tavoitteet
REILUN DATATALOUDEN PERUSTUKSET VALMIINA: Yksilödatan suostumuspohjaiseen
jakamiseen liittyvät pelisäännöt, tekninen arkkitehtuuri ja malliratkaisut ovat käytössä Euroopassa.
YKSILÖTASON VAIKUTTAMISMAHDOLLISUUDET: Kuluttajat tuntevat GDPR-oikeutensa ja
voivat valita sekä suosivat reiluja digitaalisia palveluja.
REILUUS: Suomi on reilun datatalouden edelläkävijä. Vastuullisesta datankäytöstä on muodostunut
yrityksille tunnistettu kilpailuetu.
MITTAKAAVA: IHAN-toimintamalli on laajasti tunnettu Euroopassa. Suomen lisäksi useassa Euroopan
maassa on IHANia edistäviä ja soveltavia toimijoita.
1
2
3
4
117. MAHDOLLISTAVA
ARKKITEHTUURI
IHAN® Blueprint,
IHAN®
kehittäjäyhteisön tuki,
Teknologiakokeilut
IHAN® LIIKE-
TOIMINNALLE
Yritysvastuufoorumi,
New Data Economy
Rainmakers - ohjelma
IHAN®
KANSALAISILLE
Digijälki,
Digiprofiilitesti,
Kampanjat, kyselyt ja
tutkimukset
IHAN®
PÄÄTÖKSEN-
TEKIJÖILLE
Faktoja
päätöksentekoon,
Tiekartta, Kyselyt ja
tutkimukset
KYVYKKYYKSIEN
RAKENTAMINEN
Dataetiikka
AJATTELUTAVAN
MUUTOS
LIIKETOIMINTA-
KYVYKKYYKSIEN
RAKENTAMINEN
IHAN® Dataverkostojen
sääntökirja,
Yrityskehitysohjelma,
Osaamisen kehittäminen
MyData
Yritysvastuu
Yksityisyydensuoja jadigitaaliset oikeudet
OLE HYVÄ!