SlideShare ist ein Scribd-Unternehmen logo
1 von 41
Downloaden Sie, um offline zu lesen
Verkostoanalyysi 2011, TTY – 11.3.2011                                                                      1




Verkostoanalyysin peruskäsitteitä ja visualisointia

Graafit ja matriisit, keskeisyys ja arvostus

11.3.2011



Thumas Miilumäki
thumas.miilumaki@tut.fi

Tampereen teknillinen yliopisto
Hypermedialaboratorio
Matematiikan laitos




                              Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                11.3.2011
Sisältö                                                                                                 2




•   SNA-graafit ja niiden ominaisuudet
•   SNA-matriisit ja niiden ominaisuudet
•   Suuntaamattomien verkostojen keskeisyyden tunnusluvut
•   Suunnattujen verkostojen toimijoiden arvostuksen tunnusluvut

• Taustalla pääosin Wassermanin ja Faustin Social Network
  Analysis: Methods and Applications (1994) teokessa esitetyt
  SNA-teoriat
• Laajennuksia Ruohosen Graafiteoria (2006)
  opetusmonisteesta sekä Knoken ja Yangin (2008) ja Scottin
  (2000) teoksista
• Termistön suomennokset pohjautuvat Ruohosen (2006),
  Johanssonin et al. (1995) ja Miilumäki (2010) teoksissa
  käytettyihin suomennoksiin
• Esitysaineisto noudattaa sisällöltään pitkälti aiempia
  seminaariesityksiä (Miilumäki, 2008; 2009a ; 2009b)

                          Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                            11.3.2011
3




SNA-graafit
    Taustat
   Määritelmät
  Ominaisuudet




  Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                    11.3.2011
Taustaa                                                                                                4




• Tapoja sosiaalisten verkostojen mallintamiseen on useita
• Käytettävät menetelmät riippuvat mallinnuksen kohteesta,
  näkökulmasta ja tavoitteesta
• Esimerkiksi monet tilastolliset mallinnusmenetelmät ovat
  sovellettavissa sosiaalisten verkostojen mallinnuksessa, mikäli
  verkostodata on valittuun tarkoitukseen relevanttia
• Edelleen monet diagrammit ja kaaviot ovat sovellettavissa
  sosiaalisen verkoston datan käsittelyyn
• Graafeilla pyritään luomaan mahdollisimman todenmukainen
  visualisointi, ikään kuin valokuva, tarkasteltavasta verkostosta,
  jossa toimijat ja niiden väliset yhteydet on esitetty selkeästi
• Graafin ja todellisuuden yhteensovittaminen on haasteellista,
  sillä graafi luodaan usein diskreetistä ja rajallisesta määrästä
  verkostodataa

                         Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                           11.3.2011
Perusteluja graafien käytölle                                                                               5




• SNA:ssa (Social Network Analysis) graafien käytölle on useita
  perusteita
   • Graafiteoreettinen sanasto soveltuu sosiaalisten rakenteiden kuvaamiseen
     ja merkitsemiseen
   • Useimmat sosiaalisten rakenteiden ja ominaisuuksien kvantitatiiviset
     tunnusluvut ovat laskettavissa graafiteoreorian sisältämien matemaattisten
     menetelmien avulla
   • Graafiteoreettinen notaatio ja sanasto sekä sen sisältämä matematiikka
     tarjoavat mahdollisuuden erilaisten graafeja koskevien teoreemien
     todistamiseen, ja siten myös sosiaalisia rakenteita koskevat väitteet ovat
     todistettavissa (Wasserman & Faust 1994, 93.)
• Graafiteoria tarjoaa mahdollisuuden sosiaalisen verkoston
  mallintamiseen
   • Graafi on esitys tarkasteltavasta verkosta
   • Reaalimaailman toimijat esitetään graafissa solmuina / (kärki)pisteinä (a
     node, nodes / a vertex, vertices) ja niiden väliset yhteydet solmuja
     yhdistävinä kaarina (an edge, edges) tai nuolina (an arc, arcs)


                              Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                11.3.2011
Historiaa graafeista ja niiden käytöstä SNA:ssa                                                          6




• Jacob Levy Moreno esitteli jo 1930-luvulla sosiogrammin
  (sociogram), joka on edelleen pohjana graafiteoreettisessa
  SNA:ssa ja verkostojen visualisoinnissa (Moreno, 1953)
• Graafiteoria on ollut voimakkaasti käytössä
   •   Antropologiassa
   •   Kommunikaatiotutkimuksissa
   •   Elinkeino- ja liiketaloustutkimuksissa
   •   Organisaatiotutkimuksissa
   •   Maantieteissä (Wasserman & Faust 1994, 94.)
   •   Piiriteoriassa ja -analyysissa
• Kaikissa em. tieteen- ja tutkimuksenaloilla on aina jollain tapaa
  ja jollain asteella mukana ihmisten muodostama sosiaalinen
  verkosto, jota graafiteoreettisin menetelmin on hyvä lähestyä ja
  analysoida

                           Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                             11.3.2011
Graafit                                                                                               7




• Seuraavassa esitellään suuntaamaton (undirected) ja
  kaksiarvoinen (dichotomous) graafi verkoston mallina
• Suuntaamattomassa graafissa verkoston toimijoiden väliset
  yhteydet ovat aina kaksisuuntaisia
• Kaksiarvoisessa graafissa
  yhteyksien voimakkuutta ei
  oteta huomioon vaan
  ainoastaan yhteyden
  olemassaoloon otetaan
  kantaa, ts. yhteys joko on
  olemassa tai ei ole




                        Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                          11.3.2011
Suuntaamaton graafi                                                                                         8




• Suuntaamaton graafi G koostuu kahdesta joukosta:
   • Toimijoita kuvaava solmujen joukko N = {n1,n2,…,ng} (a set of nodes)
   • Yhteyksiä kuvaava kaarien (viivojen) joukko L = {l1,l2,…,lL} (a set of lines)
• Graafissa G (N , L ) on siis yhteensä g solmua ja solmuja yhdistäviä
  kaaria yhteensä L kappaletta
• Suuntaamattomassa graafissa jokainen kaari on kahden erillisen
  solmun ni ja nj ei-järjestetty pari, ts. kaari
         lk = (ni,nj) = (nj,ni)
• Kaarta, jonka alku- ja päätepisteenä on yksi ja sama solmu ni,
  sanotaan silmukaksi (a loop) tai sisä-/refleksiivisidokseksi (a reflexive
  tie)
   • Silmukoita ei useinkaan käytetä sosiogrammeissa
       • Sosiogrammit yksinkertaisia (simple) graafeja
   • Arvotetuilla/painotetuilla (valued, weighted) graafeilla silmukoita voidaan
     hyödyntää kuvaamaan itseisiä toimintoja ja niiden määriä
       • Voidaan merkitä graafiin kaaren sijasta solmun kokoa muuttaen

                              Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                11.3.2011
Perusmääritelmiä                                                                                          9




• Kaksi solmua ni ja nj ovat vierekkäiset (adjacent), jos kaari
  lk=(ni,nj) on joukossa L ts.
         lk = (ni,nj) ∈ L
• Solmu ni on liittynyt (incident) kaareen lk, jos se on toinen
  solmuista, jotka muodostavat kaaren lk määrittelevän
  järjestämättömän parin lk=(ni,nj)
• Graafia, jossa on vain yksi solmu, sanotaan triviaaliksi (trivial)
• Tyhjässä (empty) graafissa ei ole yhtään kaarta solmujen
  välissä, ts.
        G (N , L ): N = {n1,n2,…,ng}, L = Ø




                            Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                              11.3.2011
Solmun aste                                                                                             10




• Suuntaamattomassa graafissa solmun aste (degree) d(ni)
  kertoo solmuun ni liittyneiden kaarien lukumäärän
• Kun graafissa G on g solmua, kullakin solmulla on aste, joka
  voi olla
   • Minimissään 0, jolloin solmuun ni ei ole liittynyt yhtään kaarta
   • Maksimissaan g-1, jolloin kaikki muut graafin solmut ovat liittyneet
     suoraan erillisillä kaarilla solmuun ni
• Graafin G , jossa on g solmua ja L kaarta, solmujen asteiden
  keskiaste (mean degree) määritellään
             ∑ ig=1 d (ni ) 2 L
        d =                =
                    g        g
• Edelleen astelukujen varianssi (variance of degrees)
            ∑ ig=1 (d (ni ) − d ) 2
        S =
          2
          D
                       g
                              Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                11.3.2011
Graafin tiheys                                                                                            11




• Graafin G (N , L ) tiheys (density) on graafin kaarien osuus
  graafin kaikista mahdollisista kaarista
• Yksinkertaisessa (ei silmukoita, eikä rinnakkaisia (parallel)
  kaaria) graafissa, jossa on g solmua, on kaaria maksimissaan
        ⎛ g ⎞ g (g − 1)
        ⎜ ⎟=
        ⎜2⎟
        ⎝ ⎠       2
• Jos graafissa G (N , L ) on L kaarta, saadaan graafin tiheydelle
  ∆ määritelmä
                   L            2L
        Δ=                 =
             g ( g − 1) / 2 g ( g − 1)
• Tiheys voi olla
   • Minimissään 0, jos graafissa ei ole lainkaan kaaria (L = 0)
   • Maksimissaan 1, jos graafi on täydellinen (complete) eli graafin
     kaikki mahdolliset kaaret ovat edustettuina (L = g(g-1)/2)
       • Täydellistä graafia, jossa on g solmua, merkitään Kg

                                Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                  11.3.2011
Graafin tiheys                                                                                      12




• Suuntaamattomassa g solmun graafissa kaikkien solmujen
  asteiden summa on 2L, mikä antaa keskiasteeksi 2L/g
• Täten tiheys voidaan kirjoittaa muodossa
                2L        d
       Δ=             =
            g ( g − 1) ( g − 1)




                          Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                            11.3.2011
Suunnattu graafi eli digraafi                                                                            13




• Jos verkoston yhteydet tulkitaan
  suunnatuiksi, on nuoli (an arc) lk kahden
  solmun ni ja nj järjestetty pari se., lk =
  <ni,nj> ≠ <nj,ni> (Wasserman & Faust,
  1994.)
• Mikäli yhteys tomijaparin välillä
  vaikuttaa molempiin suuntiin, on
  digraafissa tällöin rinnakkaiset
  vastakkaissuuntaiset nuolet solmuparin
  välillä
• Digraafilla on käytännössä samat
  perusominaisuudet kuin graafilla
    • Muistettava on kuitenkin, että
       digraafissa nuolia voi olla kaksi
       kertaa enemmän verrattuna
       vastaavan toimijajoukon graafin
       kaarien lukumäärään
             – Yhteyden tulkinnassa on ero
    • Yksityiskohtaisemmat määritelmät
       esim. digraafin tiheydelle on esitetty
       teoksessa Miilumäki (2010)


                               Thumas Miilumäki – Keskeisyys ja arvostus, matriisit ja graafit
                                                                                                 11.3.2011
Kulku, reitti ja polku                                                                                 14




• Kulku (a walk, walks) on graafin G (N , L ) solmujen ja kaarien
  äärellinen jakso
          W = ni0, lj0, ni1, lj1, … , ljk, nik
   • Kulku alkaa aina solmusta ja päättyy solmuun
       • Mikäli kulun alkusolmu ni0 ja loppusolmu nik ovat yksi ja sama solmu n,
         on kulku suljettu (closed)
   • Kulku voi sisältää saman kaaren ja solmun useammin kuin kerran
     jaksossa
   • Kulun pituus (length) on kulun sisältämien kaarien lukumäärä
       • Jos jokin kaari on kulussa useampaan kertaan lasketaan ne erillisinä
         kaarina kulun pituuteen
   • Kulun vastakulku W -1 on itse kulku käänteisessä järjestyksessä
• Reitti (a trail, trails) on kulku, jossa kukin kaari esiintyy vain kerran
• Polku (a path, paths) on kulku, jossa kukin solmu ja kaari esiintyy vain
  kerran



                             Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                               11.3.2011
Geodeesi, etäisyys, halkaisija ja eksentrisyys                                                         15




• Geodeesi (a geodesic, geodesics) on lyhin polku graafin kahden
  solmun välillä
• Geodeettinen etäisyys (geodesic distance), yksinkertaisemmin
  etäisyys (distance), kahden solmun välillä määritellään solmujen
  geodeesin pituutena
   • Etäisyyttä solmujen ni ja nj välillä merkitään d(i,j)
   • Solmujen ni ja nj välinen etäisyys on minkä tahansa geodeesin pituus ko.
     solmujen välillä
   • Mikäli solmuparin välillä ei ole polkua, on ko. solmujen välinen etäisyys
     ääretön (tai määrittämätön)
   • Suuntaamattomilla graafeilla d(i,j) = d(j,i)
• Graafin halkaisija (diameter) on yhtä suuri kuin graafin minkä tahansa
  solmuparin suurin geodeettinen etäisyys
• Solmun ni eksentrisyys (eccentricity) eli epäkeskisyys (myös ns.
  suhdeluku (association number)) on suurin geodeettinen etäisyys
  solmun ni ja minkä tahansa graafin muun solmun nj kanssa

                             Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                               11.3.2011
16




SNA-matriisit
    Määritelmät
   Ominaisuudet




   Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                     11.3.2011
Sosiomatriisi                                                                                                   17




• Verkoston toimijat ja eri toimijaparien väliset suunnatut /
  suuntaamattomat yhteydet voidaan esittää yhtenä matriisina
• Jos verkosto koostuu g toimijasta, joiden välillä joko on yhteys
  tai yhteys puuttuu, voidaan toimijoiden väliset yhteydet kuvata
  taulukkona, jossa kullekin toimijalle on merkitty oma vaakarivi
  ja vastaava pystysarake
• Taulukkoon merkitään binääriluvuilla 0 ja 1 toimijoiden välisen
  yhteyden olemassa olo se., alkio saa arvon 0, jos yhteyttä ei
  ole, ja arvon 1, jos toimijoiden välillä on yhteys
• Koska silmukoita ei sallita verkostossa,           n   n    n                                    n4
                                                                                      1    2   3

  taulukon lävistäjän alkiot jätetään           n     -  1    0           1                        1
                                                n    1    -   1                                    0
  määrittelemättä                               n    0   1     -
                                                                          2

                                                                                                   1
                                                                          3

                                                                         n4          0     1   0   -




                         Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                        11.3.2011
Sosiomatriisi                                                                                         18




• Taulukko on g x g vieruspistematriisi (an adjacency matrix) X,
  joka alkiot xij määritellään
               ⎧0, lk = (ni , n j ) ei ole olemassa
         xij = ⎨
               ⎩ 1, lk = (ni , n j ) on olemassa
• Tätä vieruspistematriisia nimitetään SNA:ssa sosiomatriisiksi
  (a sociomatrix, sociomatrices)
• Edellä esitetystä taulukosta saadaan siis sosiomatriisi X
       n1    n
             2     n
                   3    4n                  ⎡− 1 0 1 ⎤
   n
   1    -     1    0     1                  ⎢1 − 1 0 ⎥
   n
   2    1     -    1     0             X =⎢             ⎥
   n    0     1     -    1                  ⎢0 1 − 1 ⎥
                                            ⎢           ⎥
   3

   n
   4    0     1    0      -
                                            ⎣ 0 1 0 −⎦




                            Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                              11.3.2011
Sosiomatriisin ominaisuuksia                                                                       19




• Sosiomatriisi on yleisesti asymmetrinen (asymmetric)
  suuntaamattomille graafeille, mutta aina symmetrinen
  (symmetric) suuntaamattomille graafeille
• Täydellisen Kg -graafin sosiomatriisin jokainen
  diagonaalialkiosta poikkeava alkio on arvoltaan 1
• Vastaavasti tyhjää graafia vastaa sosiomatriisi, jossa jokainen
  (diagonaalialkiosta poikkeava) alkio on arvoltaan 0
• Arvotetuille graafeille sosiomatriisin alkiot ovat reaalilukuja,
  jotka vastaavat toimijoiden välisten yhteyksien arvoja vk




                         Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                           11.3.2011
Insidenssimatriisi                                                                                  20




• Insidenssimatriisissa (an incidence matrix) on esitetty tieto
  siitä, mitkä graafin (verkoston) solmut ovat johtuvia (incident)
  minkin graafin (verkoston) kaaren suhteen
• Insidenssimatriisissa kutakin solmua vastaa yksi matriisin rivi ja
  kutakin kaarta yksi sarake
• Jos siis verkostossa on g solmua ja L kaarta, on
  insidenssimatriisi I g x L matriisi
• Insidenssimatriisin alkiot Iij ovat binäärisiä se., jos solmu ni on
  liittynyt kaareen lj, on Iij = 1, ja mikäli taas solmu ni ei ole
  liittynyt kaareen lj, on Iij = 0
• Insidenssimatriisin jokaisessa sarakkeessa on täsmälleen
  kaksi ykköstä niillä riveillä, jotka edustavat kyseisen kaaren
  päätepisteitä

                          Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                            11.3.2011
Insidenssimatriisi                                                                                          21




      l1   l2    l3     l4         l5                                       ⎡1           1 0 0 1⎤
 n1   1    1     0      0          1                                        ⎢1           0 1 0 0⎥
 n2   1    0     1      0          0                                     I =⎢                   ⎥
                                                                            ⎢0           1 1 1 0⎥
                                                                            ⎢                   ⎥
 n3   0    1     1      1          0
 n4   0    0     0      1          1                                        ⎣0           0 0 1 1⎦




Insidenssimatriisia I
vastaava graafi




                             Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                    11.3.2011
Kulku                                                                                                       22




• Sosiomatriisin X alkiot xij kertovat, onko solmujen ni ja nj
  välillä kulku ninj
• Sosiomatriisin X neliön X2 alkio xij määritellään
         xij2 ] = ∑k =1 xik xkj
          [         g


• Tämän summan yksi termi xikxkj = 1 vain, jos molemmat
  yhteydet (ni,nk) ja (nk,nj) ovat olemassa
     Summa laskee siis kulkujen, joiden pituus on kaksi, lukumäärän
     solmusta ni solmuun nj
• Sosiomatriisin X neliön X2 alkiot xij2 ] ilmoittavat verkostossa
                                      [
  olevien kulkujen, joiden pituus on kaksi, lukumäärän solmusta
  ni solmuun nj
• Edelleen matriisin Xp alkiot ilmoittavat solmujen välisien
  kulkujen, joiden pituus on p, lukumäärän


                                  Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                    11.3.2011
Saavutettavuus                                                                                       23




• Saavutettavuudella (reachability) tarkoitetaan sitä, että onko
  joidenkin verkoston kahden solmun välillä kulku
• Saavutettavuusmatriisissa (a reachability matrix) X [R ] alkio xijR ]
                                                                  [
  on yksi, jos solmujen ni ja nj välillä on kulku, nolla muulloin
• Verkostossa kulku voi olla pituudeltaan korkeintaan g-1
• Sosiomatriisin X potenssit X2, X3, …, Xg-1 ilmoittavat
  solmujen välisten erimittaisten kulkujen lukumäärät
                                    [Σ ]
• Näiden summamatriisi X
             X [Σ ] = ∑i=1 X i = X + X 2 + X 3 + ... + X g −1
                       g −1


  ilmoittaa kaikkien erimittaisten kulkujen lukumäärät
  solmuparien välillä
                                      [Σ ]
• Tästä summamatriisista X saadaan saavutettavuusmatriisi
   X [R ] , kun matriisin X [Σ ] nollasta poikkeavat alkiot merkitään
  ykkösiksi
• Saavutettavuusmatriisi on määritettävissä myös Warshallin
  algoritmilla laskentatehokkaammin suurille verkostoille
                           Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                             11.3.2011
Geodeesi ja etäisyys                                                                                   24




• Geodeesit eli solmujen lyhimmät etäisyydet esitetään usein
  etäisyysmatriisin (a distance matrix) avulla
• Etäisyysmatriisin alkiot d(i,j) ilmoittavat solmujen ni ja nj
  välisen lyhimmän etäisyyden pituuden
• Lyhimmät etäisyydet löytyvät tarkastelemalla sosiomatriisia X
  ja sen potenssimatriiseja X2, X3, …, Xg-1 se.,
         d (i, j ) = min p xijp ] > 0
                            [

• Verkoston halkaisija on yhtä suuri kuin suurin verkostosta
  löytyvä geodeettinen etäisyys, eli ts. halkaisijan arvo on yhtä
  suuri kuin etäisyysmatriisin alkioiden maksimi (max [d(i,j)])




                             Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                               11.3.2011
Solmujen asteluvut                                                                                          25




• Suuntaamattomille verkostoille solmujen asteluvut ovat helposti
  laskettavissa sosiomatriisin X tai insidenssimatriisin I avulla
   • Insidenssimatriisissa rivillä on merkitty 1:llä, jos kaari on liittynyt
     solmuun ja 0:lla, jos kaari ei ole liittynyt solmuun
       • Nyt siis solmun ni asteluku d(ni) saadaan insidenssimatriisin
         rivisummana, eli
                              L
                   d (ni ) = ∑ I ij
                             j =1

   • Sosiomatriisissa rivillä on merkitty 1:llä, jos saraketta vastaava
     solmu on liittynyt kaarella riviä vastaavaan solmuun
       • Nyt siis solmun ni asteluku d(ni) saadaan sosiomatriisin
         rivisummana tai sarakesummana, koska matriisi on
         symmetrinen, eli ts.
                              g               g
                   d (ni ) = ∑ xij =∑ xij = xi + = x+ j
                             j =1            i =1


                                  Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                    11.3.2011
Solmujen vienti- ja tuontiluvut                                                                           26




• Suunnatuille verkostoille solmujen vienti- ja tuontiluvut
  (outdegree, indegree) ovat helposti laskettavissa sosiomatriisin
  X avulla
   • Sosiomatriisissa rivillä on merkitty 1:llä, jos riviä vastaavasta
     solmusta lähtee nuoli saraketta vastaavaan solmuun
       • Nyt siis solmun ni vientiluku dO(ni) saadaan sosiomatriisin
         rivisummana, eli
                               g
                   d O (ni ) = ∑ xij = xi+
                              j =1

   • Sosiomatriisissa sarakkeessa on merkitty 1:llä, jos saraketta
     vastaavaan solmuun tulee nuoli riviä vastaavasta solmusta
       • Nyt siis solmun ni tuontiluku dI(ni) saadaan sosiomatriisin
         sarakesummana, eli
                              g
                   d I (ni ) = ∑ x ji = x+i
                              j =1


                                Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                  11.3.2011
Tiheys                                                                                             27




• Verkoston tiheys määriteltiin verkostossa olemassa olevien
  solmujen välisten yhteyksien summan ja verkoston kaikkien
  mahdollisten solmujen välisten yhteyksien summan välisenä
  suhteena
• Verkostossa, jossa on g toimijaa, voi olla enintään g(g-1)
  toimijaparien välistä suoraa yhteyttä
• Verkoston sosiomatriisissa on merkitty 1:llä, mikäli toimijaparin
  välillä vallitsee yhteys ja 0:lla, jos toimiparin väliltä puuttuu
  yhteys
• Nyt siis olemassa olevien yhteyksien summa saadaan
  yksinkertaisesti sosiomatriisin kaikkien alkioiden summana, eli
  tiheys ∆ määritellään
               Σ ig=1Σ g=1 xij
          Δ=           j

                g ( g − 1)
• Tämä tiheyden määritelmä pätee myös arvotetuille verkostoille

                         Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                           11.3.2011
28




SNA-tunnusluvut
       Keskeisyys
        Arvostus




    Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                      11.3.2011
Yleisesti keskeisyydestä ja arvostuksesta                                                             29




• Suuntaamattomille verkostoille ja sen toimijoille voidaan
  määrittää erilaisia keskeisyyden (centrality) tunnuslukuja
   • Keskeisyys ei riipu verkoston yhteyksien suunnasta, vaan
     ainoastaan tarkasteltavasta toimijasta ja siihen liittyneistä
     yhteyksistä ja/tai koko verkostosta yleensä
• Suunnatuissa verkostoissa keskeisyyden tilalla käytetään
  käsitettä arvostus (prestige), joka huomioi yhteyksien suunnan
   • Erotetaan toisistaan käsitteet ”olla arvostettu” ja ”arvostaa”
   • Arvostuksen tunnusluvuissa tarkastellaan nimenomaan yhteyksien
     vastaanottamista eli arvostuksen kohteena olemista




                            Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                              11.3.2011
Keskeisyys                                                                                              30




• Keskeisyyden käsite määritellään suuntaamattomille verkostoille
• Keskeisyyttä voidaan kuvata seuraavilla tunnusluvuilla
   •   Keskeisyysaste (degree centrality)
   •   Läheisyys (closeness centrality)
   •   Välillisyys (betweenness centrality)
   •   Informaatiokeskeisyys (information centrality)
• Suuntaamattomissa verkostoissa keskeinen toimija on osallisena
  monissa yhteyksissä
   • Keskeisyyden kannalta ei ole väliä, onko toimija lähettänyt vai
     vastaanottanut yhteyden
• Keskeisyys on verkoston toimijaa ni kuvaava tunnusluku, kun taas
  koko verkostolle yhteisesti voidaan määrittää keskittyneisyys
  (centralization), joka on verkostosta toiseen vertailtava tunnusluku
   • Keskittyneisyyden avulla voidaan kuvata, missä määrin yksittäiset
     toimijat hallitsevat muiden välistä kanssakäymistä yleisesti koko
     verkoston tasolla


                              Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                11.3.2011
Keskeisyysaste                                                                                      31




• Toimijan ni keskeisyysaste CD(ni) kertoo, kuinka monta suoraa
  yhteyttä toimijalla on muihin toimijoihin (= asteluku d(ni))
• Toimijan aste ei itsessään ole kuitenkaan yleisesti vertailtava
  tunnusluku
   • Kun asteluku skaalataan verkoston tasolla, voidaan toimijoiden
     keskeisyysasteita vertailla eri verkostojen välillä
   • Normeerattu keskeisyysaste C´D(ni) määritellään
                  d(ni)
        C´D(ni) =       , missä g on verkoston toimijoiden lukumäärä
                  g–1
• Keskeisyysaste määritellään myös suunnatuille verkostoille,
  jolloin käsitellään erikseen vientikeskeisyyttä (outdegree
  centrality) ja tuontikeskeisyyttä (indegree centrality)




                          Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                            11.3.2011
Läheisyys ja välillisyys                                                                             32




• Läheisyys on toimijan ni lyhyimpien polkujen (geodeesien)
  summa ci kaikkiin verkoston muihin toimijoihin nj
   • Itsessään summa ei ole vertailtava tunnusluku eri verkostojen
     välillä
• Verkostojen kesken vertailukelpoinen normeerattu läheisyys
  määritellään
                 g–1
     C´C(ni) =         , missä g on verkoston toimijoiden lukumäärä
                  ci
• Toimijan välillisyys puolestaan mittaa, kuinka monen
  toimijaparin välisen lyhyimmän polun varrelle toimija sijoittuu
   • Toimijan välillisyys on merkityksellinen tunnusluku mm.
     tutkittaessa verkoston toiminnan tehokkuutta




                           Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                             11.3.2011
Arvostus                                                                                            33




• Kuten keskeisyyttä, niin myös arvostusta voidaan tarkastella eri
  tavoin
• Verkoston toimijoille voidaan määrittää seuraavat arvostukset
   • Arvostusaste (actor degree prestige)
   • Arvostusläheisyys (actor proximity prestige)
   • Arvoasema (actor status prestige, actor rank prestige)
• Koko verkoston tasolla voidaan määrittää verkostoa kuvaavia
  arvostuksen tunnuslukuja arvioimalla kunkin arvostuksen
  keskiarvoja ja variansseja
   • Näistä keskiarvostusläheisyys ja arvostusläheisyyden varianssi
     ovat mielekkäimpiä tarkasteltavia verkostoanalyysin kannalta




                          Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                            11.3.2011
Arvostusaste                                                                                              34




• Toimijan ni arvostusaste PD(ni) määritellään yksinkertaisesti
  toimijaan kohdistuneiden yhteyksien summana
   • Vertaa suuntaamattoman verkoston toimijan ni keskeisyysaste,
     joka määritellään toimijaa kuvaavan solmun astelukuna d(ni)
• Arvostusaste määritellään formaalisti
      PD(ni) = dI(ni) = Σj xij = x+i ,             missä dI(ni) on solmun ni tuontiluku
                                                   ja x+i on verkoston sosiomatriisin X
                                                   sarakesumma sarakkeesta i
• Jotta arvostusasteet eri verkostojen välillä olisivat verrattavissa
  keskenään, määritellään normeerattu arvostusaste P´D(ni)
                    x+i
      P´D(ni) =            ,    missä g on verkoston toimijoiden lukumäärä
                  g–1




                                Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                  11.3.2011
Arvostusläheisyys                                                                                    35




• Toimijalle ni voidaan määrittää luku Ii, joka ilmoittaa, kuinka
  moni toimija nj voi saavuttaa toimijan ni
• Tämän toimijan ni vaikutusjoukon toimijoiden lukumäärän Ii
  avulla voidaan määrittää vaikutusjoukon toimijoiden
  keskimääräinen etäisyys toimijasta ni
• Toimijan ni arvostusläheisyys PP(ni) määritellään
  vaikutusjoukon osuuden koko verkoston toimijajoukosta
  suhteena vaikutusjoukon toimijoiden keskimääräiseen
  etäisyyteen toimijasta ni
• Arvostusläheisyys saa muiden normeerattujen tunnuslukujen
  tavoin arvoja välillä [0,1]
   • Jos toimijalla ni on suora yhteys jokaiseen verkoston muuhun
     toimijaan, saa arvostusläheisyys arvon yksi
   • Jos toimija ni on isolaatti (an isolate, isolates), vaikutusjoukon
     toimijoiden lukumäärä Ii nolla, ja arvostusläheisyys määritellään
     nollaksi


                           Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                             11.3.2011
Arvoasema                                                                                                  36




• Edellä esitellyt arvostuksen tunnusluvut huomioivat vain toimijoita ja
  niihin kohdistuvia yhteyksiä
• Toimijan ni arvoasema PR(ni) on riippuvainen häneen päin yhteydessä
  olevien toimijoiden nj arvoasemista PR(nj)
   • Edelleen taas toimijoiden nj arvoasemat ovat riippuvaisia näihin päin
     yhteydessä olevien toimijoiden nk arvoasemista jne.
• Arvoaseman määrittelyn taustalla on ajatus siitä, että toimijan ni
  arvoasema on häneen päin suoraan yhteydessä olevien toimijoiden
  arvoasemien funktio
• Verkostossa, jossa on g toimijaa, toimijan ni arvoasema voidaan
  esittää sosiomatriisin X toimijaa kuvaavan sarakkeen alkioiden ja niitä
  vastaavien toimijoiden arvoasemien lineaarikombinaationa, ts.
     PR(ni) = x1i PR(n1) + x2i PR(n2) + … + xgi PR(ng)
• Arvoaseman määrittäminen vaatii syvällisempää ymmärrystä mm.
  matriisin ominaisarvoprobleeman ratkaisusta
   • Myöhemmissä esityksissä perehdytään algoritmeihin, joilla verkoston toimijoiden
     arvoasemat voidaan määrittää erilaisissa verkostoissa

                                 Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                   11.3.2011
Esimerkki – Valtioiden kauppaverkosto                                                                                 37




• Seuraavassa on esitetty 24 valtion kauppaverkosto
  (Wasserman & Faust 1994)
 http://matriisi.ee.tut.fi/~miilumak/sna/




                                            Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                              11.3.2011
Esimerkki – Valtioiden kauppaverkosto                                                                                  38




• Verkostosta määritetyt arvostuksen tunnusluvut (g = 24)

  i    VALTIO           dI (ni)              dO (ni)              PD' (ni)             PP' (ni)     PR' (ni)
  1    Algeria          13                   4                    0,565                0,661        0,222
  2    Argentina        10                   13                   0,435                0,599        0,805
  3    Brazil           11                   21                   0,478                0,619        1,000
  4    China            15                   21                   0,652                0,710        0,711
  5    Czechoslovakia   13                   21                   0,565                0,661        0,818
  6    Ecuador          9                    2                    0,391                0,581        0,183
  7    Egypt            12                   9                    0,522                0,639        0,482
  8    Ethiopia         10                   2                    0,435                0,599        0,131
  9    Finland          15                   21                   0,652                0,710        0,758
  10   Honduras         9                    1                    0,391                0,581        0,072
  11   Indonesia        14                   14                   0,609                0,685        0,617
  12   Israel           10                   11                   0,435                0,599        0,682
  13   Japan            17                   23                   0,739                0,767        0,680
  14   Liberia          9                    0                    0,391                0,601        0,000
  15   Madagascar       6                    1                    0,261                0,533        0,106
  16   New Zealand      14                   11                   0,609                0,685        0,461
  17   Pakistan         14                   13                   0,609                0,685        0,525
  18   Spain            17                   22                   0,739                0,767        0,673
  19   Switzerland      15                   23                   0,652                0,710        0,765
  20   Syria            12                   0                    0,522                0,658        0,000
  21   Thailand         15                   14                   0,652                0,710        0,589
  22   United Kingdom   16                   22                   0,696                0,738        0,633
  23   United States    19                   23                   0,826                0,834        0,644
  24   Yugoslavia       15                   18                   0,652                0,710        0,680

  MEAN                  12,917               13,292               0,562                0,668        0,510
  VARIANCE              9,993                67,955               0,018                0,005        0,085



                                  Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                               11.3.2011
Huomioitavaa                                                                                           39




• On selvää, että keskeisyyden ja arvostuksen tunnusluvut tuovat
  verkostosta esiin seikkoja, joita ei tulisi huomanneeksi pelkästään
  verkoston graafia, matriisia tai muunlaista mallia tarkastelemalla
• Keskeisyyden ja arvostuksen tunnusluvut tarjoavat monipuolista
  tietoa verkoston toiminnasta ja antavat viitteitä siitä, kuinka
  verkostoa tulisi kehittää, oli sitten kyse tehokkuuden lisäämisestä
  tai esim. rakenteen parantamisesta
• Tunnuslukuja ei saa kuitenkaan pitää ainoina mittareina verkoston
  toiminnasta
   • Graafit visualisointeina tarjoavat paljon hyödyllistä tietoa verkoston
     rakenteesta ja toiminnasta (aikasarjat, DNA – Dynamic Network
     Analysis)
   • Toimijoiden keskeisyydet ja arvostukset ovat vain osa suurempaa
     kuvaa
   • Muutosten jälkeen tulee tarkastella verkostoa uudelleen, tulkita
     tunnusluvut uudelleen ja tarkastella oliko muutos hyvä vai huono

                             Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                               11.3.2011
Lähteet                                                                                                         40




Johansson, J-E., Mattila, M. & Uusikylä, P. (1995). Johdatus verkostoanalyysiin. Helsinki:
  Kuluttajatutkimuskeskus. http://www.valt.helsinki.fi/vol/kirja/ (Viitattu 10.3.2011)
Knoke, D. & Yang, S. 2008. Social Network Analysis. Second Edition. Los Angeles: Sage
  Publications.
Miilumäki, T. (2008). Graphs in Social Network Analysis And Modeling. Graafit sosiaalisten
  verkostojen mallintamisessa. Tampere: Tampereen teknillinen yliopisto, luentoesitys.
  http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_-
  _Graafit_sosiaalisten_verkostojen_mallintamisessa.pdf (Viitattu 10.3.2011)
Miilumäki, T. (2009a). Matrices in Social Network Analysis And Modeling. Matriisit sosiaalisten
  verkostojen mallintamisessa. Tampere: Tampereen teknillinen yliopisto, luentoesitys.
  http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_-
  _Matriisit_sosiaalisten_verkostojen_mallintamisessa.pdf (Viitattu 10.3.2011)
Miilumäki, T. (2009b). Social Network Analysis – Centrality And Prestige. Sosiaalisten verkostojen
  analyysi – Keskeisyys ja arvostus. Tampere: Tampereen teknillinen yliopisto, luentoesitys.
  http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_Keskeisyys-ja-
  arvostus.pdf (Viitattu 10.3.2011)
Miilumäki, T. (2010). Web-pohjaisten sosiaalisten verkostojen analyysimenetelmät. Diplomityö.
  Tampere: Tampereen teknillinen yliopisto.
  http://dspace.cc.tut.fi/dpub/bitstream/handle/123456789/6635/miilumaki.pdf.
Moreno, J.L. (1953). Who Shall Survive? Beacon, New York: Beacon House Inc.
Ruohonen, K. (2006). Graafiteoria. Tampere: Tampereen teknillisen yliopiston opetusmoniste no. 5,
  uusi sarja.
Scott, J. (2000). Social Network Analysis. A Handbook. Second Edition. London: Sage Publications.
Wasserman, S. & Faust, K. (1994). Social Network Analysis: Methods and Applications. New York:
 Cambridge University Press.



                                      Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                                        11.3.2011
Verkostoanalyysi 2011, TTY – 11.3.2011                                                         41




Kiitos mielenkiinnostanne.

Kysymyksiä?




                                                         thumas.miilumaki@tut.fi




                     Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
                                                                                       11.3.2011

Weitere ähnliche Inhalte

Empfohlen

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Empfohlen (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

  • 1. Verkostoanalyysi 2011, TTY – 11.3.2011 1 Verkostoanalyysin peruskäsitteitä ja visualisointia Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011 Thumas Miilumäki thumas.miilumaki@tut.fi Tampereen teknillinen yliopisto Hypermedialaboratorio Matematiikan laitos Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 2. Sisältö 2 • SNA-graafit ja niiden ominaisuudet • SNA-matriisit ja niiden ominaisuudet • Suuntaamattomien verkostojen keskeisyyden tunnusluvut • Suunnattujen verkostojen toimijoiden arvostuksen tunnusluvut • Taustalla pääosin Wassermanin ja Faustin Social Network Analysis: Methods and Applications (1994) teokessa esitetyt SNA-teoriat • Laajennuksia Ruohosen Graafiteoria (2006) opetusmonisteesta sekä Knoken ja Yangin (2008) ja Scottin (2000) teoksista • Termistön suomennokset pohjautuvat Ruohosen (2006), Johanssonin et al. (1995) ja Miilumäki (2010) teoksissa käytettyihin suomennoksiin • Esitysaineisto noudattaa sisällöltään pitkälti aiempia seminaariesityksiä (Miilumäki, 2008; 2009a ; 2009b) Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 3. 3 SNA-graafit Taustat Määritelmät Ominaisuudet Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 4. Taustaa 4 • Tapoja sosiaalisten verkostojen mallintamiseen on useita • Käytettävät menetelmät riippuvat mallinnuksen kohteesta, näkökulmasta ja tavoitteesta • Esimerkiksi monet tilastolliset mallinnusmenetelmät ovat sovellettavissa sosiaalisten verkostojen mallinnuksessa, mikäli verkostodata on valittuun tarkoitukseen relevanttia • Edelleen monet diagrammit ja kaaviot ovat sovellettavissa sosiaalisen verkoston datan käsittelyyn • Graafeilla pyritään luomaan mahdollisimman todenmukainen visualisointi, ikään kuin valokuva, tarkasteltavasta verkostosta, jossa toimijat ja niiden väliset yhteydet on esitetty selkeästi • Graafin ja todellisuuden yhteensovittaminen on haasteellista, sillä graafi luodaan usein diskreetistä ja rajallisesta määrästä verkostodataa Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 5. Perusteluja graafien käytölle 5 • SNA:ssa (Social Network Analysis) graafien käytölle on useita perusteita • Graafiteoreettinen sanasto soveltuu sosiaalisten rakenteiden kuvaamiseen ja merkitsemiseen • Useimmat sosiaalisten rakenteiden ja ominaisuuksien kvantitatiiviset tunnusluvut ovat laskettavissa graafiteoreorian sisältämien matemaattisten menetelmien avulla • Graafiteoreettinen notaatio ja sanasto sekä sen sisältämä matematiikka tarjoavat mahdollisuuden erilaisten graafeja koskevien teoreemien todistamiseen, ja siten myös sosiaalisia rakenteita koskevat väitteet ovat todistettavissa (Wasserman & Faust 1994, 93.) • Graafiteoria tarjoaa mahdollisuuden sosiaalisen verkoston mallintamiseen • Graafi on esitys tarkasteltavasta verkosta • Reaalimaailman toimijat esitetään graafissa solmuina / (kärki)pisteinä (a node, nodes / a vertex, vertices) ja niiden väliset yhteydet solmuja yhdistävinä kaarina (an edge, edges) tai nuolina (an arc, arcs) Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 6. Historiaa graafeista ja niiden käytöstä SNA:ssa 6 • Jacob Levy Moreno esitteli jo 1930-luvulla sosiogrammin (sociogram), joka on edelleen pohjana graafiteoreettisessa SNA:ssa ja verkostojen visualisoinnissa (Moreno, 1953) • Graafiteoria on ollut voimakkaasti käytössä • Antropologiassa • Kommunikaatiotutkimuksissa • Elinkeino- ja liiketaloustutkimuksissa • Organisaatiotutkimuksissa • Maantieteissä (Wasserman & Faust 1994, 94.) • Piiriteoriassa ja -analyysissa • Kaikissa em. tieteen- ja tutkimuksenaloilla on aina jollain tapaa ja jollain asteella mukana ihmisten muodostama sosiaalinen verkosto, jota graafiteoreettisin menetelmin on hyvä lähestyä ja analysoida Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 7. Graafit 7 • Seuraavassa esitellään suuntaamaton (undirected) ja kaksiarvoinen (dichotomous) graafi verkoston mallina • Suuntaamattomassa graafissa verkoston toimijoiden väliset yhteydet ovat aina kaksisuuntaisia • Kaksiarvoisessa graafissa yhteyksien voimakkuutta ei oteta huomioon vaan ainoastaan yhteyden olemassaoloon otetaan kantaa, ts. yhteys joko on olemassa tai ei ole Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 8. Suuntaamaton graafi 8 • Suuntaamaton graafi G koostuu kahdesta joukosta: • Toimijoita kuvaava solmujen joukko N = {n1,n2,…,ng} (a set of nodes) • Yhteyksiä kuvaava kaarien (viivojen) joukko L = {l1,l2,…,lL} (a set of lines) • Graafissa G (N , L ) on siis yhteensä g solmua ja solmuja yhdistäviä kaaria yhteensä L kappaletta • Suuntaamattomassa graafissa jokainen kaari on kahden erillisen solmun ni ja nj ei-järjestetty pari, ts. kaari lk = (ni,nj) = (nj,ni) • Kaarta, jonka alku- ja päätepisteenä on yksi ja sama solmu ni, sanotaan silmukaksi (a loop) tai sisä-/refleksiivisidokseksi (a reflexive tie) • Silmukoita ei useinkaan käytetä sosiogrammeissa • Sosiogrammit yksinkertaisia (simple) graafeja • Arvotetuilla/painotetuilla (valued, weighted) graafeilla silmukoita voidaan hyödyntää kuvaamaan itseisiä toimintoja ja niiden määriä • Voidaan merkitä graafiin kaaren sijasta solmun kokoa muuttaen Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 9. Perusmääritelmiä 9 • Kaksi solmua ni ja nj ovat vierekkäiset (adjacent), jos kaari lk=(ni,nj) on joukossa L ts. lk = (ni,nj) ∈ L • Solmu ni on liittynyt (incident) kaareen lk, jos se on toinen solmuista, jotka muodostavat kaaren lk määrittelevän järjestämättömän parin lk=(ni,nj) • Graafia, jossa on vain yksi solmu, sanotaan triviaaliksi (trivial) • Tyhjässä (empty) graafissa ei ole yhtään kaarta solmujen välissä, ts. G (N , L ): N = {n1,n2,…,ng}, L = Ø Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 10. Solmun aste 10 • Suuntaamattomassa graafissa solmun aste (degree) d(ni) kertoo solmuun ni liittyneiden kaarien lukumäärän • Kun graafissa G on g solmua, kullakin solmulla on aste, joka voi olla • Minimissään 0, jolloin solmuun ni ei ole liittynyt yhtään kaarta • Maksimissaan g-1, jolloin kaikki muut graafin solmut ovat liittyneet suoraan erillisillä kaarilla solmuun ni • Graafin G , jossa on g solmua ja L kaarta, solmujen asteiden keskiaste (mean degree) määritellään ∑ ig=1 d (ni ) 2 L d = = g g • Edelleen astelukujen varianssi (variance of degrees) ∑ ig=1 (d (ni ) − d ) 2 S = 2 D g Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 11. Graafin tiheys 11 • Graafin G (N , L ) tiheys (density) on graafin kaarien osuus graafin kaikista mahdollisista kaarista • Yksinkertaisessa (ei silmukoita, eikä rinnakkaisia (parallel) kaaria) graafissa, jossa on g solmua, on kaaria maksimissaan ⎛ g ⎞ g (g − 1) ⎜ ⎟= ⎜2⎟ ⎝ ⎠ 2 • Jos graafissa G (N , L ) on L kaarta, saadaan graafin tiheydelle ∆ määritelmä L 2L Δ= = g ( g − 1) / 2 g ( g − 1) • Tiheys voi olla • Minimissään 0, jos graafissa ei ole lainkaan kaaria (L = 0) • Maksimissaan 1, jos graafi on täydellinen (complete) eli graafin kaikki mahdolliset kaaret ovat edustettuina (L = g(g-1)/2) • Täydellistä graafia, jossa on g solmua, merkitään Kg Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 12. Graafin tiheys 12 • Suuntaamattomassa g solmun graafissa kaikkien solmujen asteiden summa on 2L, mikä antaa keskiasteeksi 2L/g • Täten tiheys voidaan kirjoittaa muodossa 2L d Δ= = g ( g − 1) ( g − 1) Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 13. Suunnattu graafi eli digraafi 13 • Jos verkoston yhteydet tulkitaan suunnatuiksi, on nuoli (an arc) lk kahden solmun ni ja nj järjestetty pari se., lk = <ni,nj> ≠ <nj,ni> (Wasserman & Faust, 1994.) • Mikäli yhteys tomijaparin välillä vaikuttaa molempiin suuntiin, on digraafissa tällöin rinnakkaiset vastakkaissuuntaiset nuolet solmuparin välillä • Digraafilla on käytännössä samat perusominaisuudet kuin graafilla • Muistettava on kuitenkin, että digraafissa nuolia voi olla kaksi kertaa enemmän verrattuna vastaavan toimijajoukon graafin kaarien lukumäärään – Yhteyden tulkinnassa on ero • Yksityiskohtaisemmat määritelmät esim. digraafin tiheydelle on esitetty teoksessa Miilumäki (2010) Thumas Miilumäki – Keskeisyys ja arvostus, matriisit ja graafit 11.3.2011
  • 14. Kulku, reitti ja polku 14 • Kulku (a walk, walks) on graafin G (N , L ) solmujen ja kaarien äärellinen jakso W = ni0, lj0, ni1, lj1, … , ljk, nik • Kulku alkaa aina solmusta ja päättyy solmuun • Mikäli kulun alkusolmu ni0 ja loppusolmu nik ovat yksi ja sama solmu n, on kulku suljettu (closed) • Kulku voi sisältää saman kaaren ja solmun useammin kuin kerran jaksossa • Kulun pituus (length) on kulun sisältämien kaarien lukumäärä • Jos jokin kaari on kulussa useampaan kertaan lasketaan ne erillisinä kaarina kulun pituuteen • Kulun vastakulku W -1 on itse kulku käänteisessä järjestyksessä • Reitti (a trail, trails) on kulku, jossa kukin kaari esiintyy vain kerran • Polku (a path, paths) on kulku, jossa kukin solmu ja kaari esiintyy vain kerran Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 15. Geodeesi, etäisyys, halkaisija ja eksentrisyys 15 • Geodeesi (a geodesic, geodesics) on lyhin polku graafin kahden solmun välillä • Geodeettinen etäisyys (geodesic distance), yksinkertaisemmin etäisyys (distance), kahden solmun välillä määritellään solmujen geodeesin pituutena • Etäisyyttä solmujen ni ja nj välillä merkitään d(i,j) • Solmujen ni ja nj välinen etäisyys on minkä tahansa geodeesin pituus ko. solmujen välillä • Mikäli solmuparin välillä ei ole polkua, on ko. solmujen välinen etäisyys ääretön (tai määrittämätön) • Suuntaamattomilla graafeilla d(i,j) = d(j,i) • Graafin halkaisija (diameter) on yhtä suuri kuin graafin minkä tahansa solmuparin suurin geodeettinen etäisyys • Solmun ni eksentrisyys (eccentricity) eli epäkeskisyys (myös ns. suhdeluku (association number)) on suurin geodeettinen etäisyys solmun ni ja minkä tahansa graafin muun solmun nj kanssa Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 16. 16 SNA-matriisit Määritelmät Ominaisuudet Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 17. Sosiomatriisi 17 • Verkoston toimijat ja eri toimijaparien väliset suunnatut / suuntaamattomat yhteydet voidaan esittää yhtenä matriisina • Jos verkosto koostuu g toimijasta, joiden välillä joko on yhteys tai yhteys puuttuu, voidaan toimijoiden väliset yhteydet kuvata taulukkona, jossa kullekin toimijalle on merkitty oma vaakarivi ja vastaava pystysarake • Taulukkoon merkitään binääriluvuilla 0 ja 1 toimijoiden välisen yhteyden olemassa olo se., alkio saa arvon 0, jos yhteyttä ei ole, ja arvon 1, jos toimijoiden välillä on yhteys • Koska silmukoita ei sallita verkostossa, n n n n4 1 2 3 taulukon lävistäjän alkiot jätetään n - 1 0 1 1 n 1 - 1 0 määrittelemättä n 0 1 - 2 1 3 n4 0 1 0 - Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 18. Sosiomatriisi 18 • Taulukko on g x g vieruspistematriisi (an adjacency matrix) X, joka alkiot xij määritellään ⎧0, lk = (ni , n j ) ei ole olemassa xij = ⎨ ⎩ 1, lk = (ni , n j ) on olemassa • Tätä vieruspistematriisia nimitetään SNA:ssa sosiomatriisiksi (a sociomatrix, sociomatrices) • Edellä esitetystä taulukosta saadaan siis sosiomatriisi X n1 n 2 n 3 4n ⎡− 1 0 1 ⎤ n 1 - 1 0 1 ⎢1 − 1 0 ⎥ n 2 1 - 1 0 X =⎢ ⎥ n 0 1 - 1 ⎢0 1 − 1 ⎥ ⎢ ⎥ 3 n 4 0 1 0 - ⎣ 0 1 0 −⎦ Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 19. Sosiomatriisin ominaisuuksia 19 • Sosiomatriisi on yleisesti asymmetrinen (asymmetric) suuntaamattomille graafeille, mutta aina symmetrinen (symmetric) suuntaamattomille graafeille • Täydellisen Kg -graafin sosiomatriisin jokainen diagonaalialkiosta poikkeava alkio on arvoltaan 1 • Vastaavasti tyhjää graafia vastaa sosiomatriisi, jossa jokainen (diagonaalialkiosta poikkeava) alkio on arvoltaan 0 • Arvotetuille graafeille sosiomatriisin alkiot ovat reaalilukuja, jotka vastaavat toimijoiden välisten yhteyksien arvoja vk Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 20. Insidenssimatriisi 20 • Insidenssimatriisissa (an incidence matrix) on esitetty tieto siitä, mitkä graafin (verkoston) solmut ovat johtuvia (incident) minkin graafin (verkoston) kaaren suhteen • Insidenssimatriisissa kutakin solmua vastaa yksi matriisin rivi ja kutakin kaarta yksi sarake • Jos siis verkostossa on g solmua ja L kaarta, on insidenssimatriisi I g x L matriisi • Insidenssimatriisin alkiot Iij ovat binäärisiä se., jos solmu ni on liittynyt kaareen lj, on Iij = 1, ja mikäli taas solmu ni ei ole liittynyt kaareen lj, on Iij = 0 • Insidenssimatriisin jokaisessa sarakkeessa on täsmälleen kaksi ykköstä niillä riveillä, jotka edustavat kyseisen kaaren päätepisteitä Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 21. Insidenssimatriisi 21 l1 l2 l3 l4 l5 ⎡1 1 0 0 1⎤ n1 1 1 0 0 1 ⎢1 0 1 0 0⎥ n2 1 0 1 0 0 I =⎢ ⎥ ⎢0 1 1 1 0⎥ ⎢ ⎥ n3 0 1 1 1 0 n4 0 0 0 1 1 ⎣0 0 0 1 1⎦ Insidenssimatriisia I vastaava graafi Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 22. Kulku 22 • Sosiomatriisin X alkiot xij kertovat, onko solmujen ni ja nj välillä kulku ninj • Sosiomatriisin X neliön X2 alkio xij määritellään xij2 ] = ∑k =1 xik xkj [ g • Tämän summan yksi termi xikxkj = 1 vain, jos molemmat yhteydet (ni,nk) ja (nk,nj) ovat olemassa Summa laskee siis kulkujen, joiden pituus on kaksi, lukumäärän solmusta ni solmuun nj • Sosiomatriisin X neliön X2 alkiot xij2 ] ilmoittavat verkostossa [ olevien kulkujen, joiden pituus on kaksi, lukumäärän solmusta ni solmuun nj • Edelleen matriisin Xp alkiot ilmoittavat solmujen välisien kulkujen, joiden pituus on p, lukumäärän Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 23. Saavutettavuus 23 • Saavutettavuudella (reachability) tarkoitetaan sitä, että onko joidenkin verkoston kahden solmun välillä kulku • Saavutettavuusmatriisissa (a reachability matrix) X [R ] alkio xijR ] [ on yksi, jos solmujen ni ja nj välillä on kulku, nolla muulloin • Verkostossa kulku voi olla pituudeltaan korkeintaan g-1 • Sosiomatriisin X potenssit X2, X3, …, Xg-1 ilmoittavat solmujen välisten erimittaisten kulkujen lukumäärät [Σ ] • Näiden summamatriisi X X [Σ ] = ∑i=1 X i = X + X 2 + X 3 + ... + X g −1 g −1 ilmoittaa kaikkien erimittaisten kulkujen lukumäärät solmuparien välillä [Σ ] • Tästä summamatriisista X saadaan saavutettavuusmatriisi X [R ] , kun matriisin X [Σ ] nollasta poikkeavat alkiot merkitään ykkösiksi • Saavutettavuusmatriisi on määritettävissä myös Warshallin algoritmilla laskentatehokkaammin suurille verkostoille Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 24. Geodeesi ja etäisyys 24 • Geodeesit eli solmujen lyhimmät etäisyydet esitetään usein etäisyysmatriisin (a distance matrix) avulla • Etäisyysmatriisin alkiot d(i,j) ilmoittavat solmujen ni ja nj välisen lyhimmän etäisyyden pituuden • Lyhimmät etäisyydet löytyvät tarkastelemalla sosiomatriisia X ja sen potenssimatriiseja X2, X3, …, Xg-1 se., d (i, j ) = min p xijp ] > 0 [ • Verkoston halkaisija on yhtä suuri kuin suurin verkostosta löytyvä geodeettinen etäisyys, eli ts. halkaisijan arvo on yhtä suuri kuin etäisyysmatriisin alkioiden maksimi (max [d(i,j)]) Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 25. Solmujen asteluvut 25 • Suuntaamattomille verkostoille solmujen asteluvut ovat helposti laskettavissa sosiomatriisin X tai insidenssimatriisin I avulla • Insidenssimatriisissa rivillä on merkitty 1:llä, jos kaari on liittynyt solmuun ja 0:lla, jos kaari ei ole liittynyt solmuun • Nyt siis solmun ni asteluku d(ni) saadaan insidenssimatriisin rivisummana, eli L d (ni ) = ∑ I ij j =1 • Sosiomatriisissa rivillä on merkitty 1:llä, jos saraketta vastaava solmu on liittynyt kaarella riviä vastaavaan solmuun • Nyt siis solmun ni asteluku d(ni) saadaan sosiomatriisin rivisummana tai sarakesummana, koska matriisi on symmetrinen, eli ts. g g d (ni ) = ∑ xij =∑ xij = xi + = x+ j j =1 i =1 Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 26. Solmujen vienti- ja tuontiluvut 26 • Suunnatuille verkostoille solmujen vienti- ja tuontiluvut (outdegree, indegree) ovat helposti laskettavissa sosiomatriisin X avulla • Sosiomatriisissa rivillä on merkitty 1:llä, jos riviä vastaavasta solmusta lähtee nuoli saraketta vastaavaan solmuun • Nyt siis solmun ni vientiluku dO(ni) saadaan sosiomatriisin rivisummana, eli g d O (ni ) = ∑ xij = xi+ j =1 • Sosiomatriisissa sarakkeessa on merkitty 1:llä, jos saraketta vastaavaan solmuun tulee nuoli riviä vastaavasta solmusta • Nyt siis solmun ni tuontiluku dI(ni) saadaan sosiomatriisin sarakesummana, eli g d I (ni ) = ∑ x ji = x+i j =1 Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 27. Tiheys 27 • Verkoston tiheys määriteltiin verkostossa olemassa olevien solmujen välisten yhteyksien summan ja verkoston kaikkien mahdollisten solmujen välisten yhteyksien summan välisenä suhteena • Verkostossa, jossa on g toimijaa, voi olla enintään g(g-1) toimijaparien välistä suoraa yhteyttä • Verkoston sosiomatriisissa on merkitty 1:llä, mikäli toimijaparin välillä vallitsee yhteys ja 0:lla, jos toimiparin väliltä puuttuu yhteys • Nyt siis olemassa olevien yhteyksien summa saadaan yksinkertaisesti sosiomatriisin kaikkien alkioiden summana, eli tiheys ∆ määritellään Σ ig=1Σ g=1 xij Δ= j g ( g − 1) • Tämä tiheyden määritelmä pätee myös arvotetuille verkostoille Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 28. 28 SNA-tunnusluvut Keskeisyys Arvostus Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 29. Yleisesti keskeisyydestä ja arvostuksesta 29 • Suuntaamattomille verkostoille ja sen toimijoille voidaan määrittää erilaisia keskeisyyden (centrality) tunnuslukuja • Keskeisyys ei riipu verkoston yhteyksien suunnasta, vaan ainoastaan tarkasteltavasta toimijasta ja siihen liittyneistä yhteyksistä ja/tai koko verkostosta yleensä • Suunnatuissa verkostoissa keskeisyyden tilalla käytetään käsitettä arvostus (prestige), joka huomioi yhteyksien suunnan • Erotetaan toisistaan käsitteet ”olla arvostettu” ja ”arvostaa” • Arvostuksen tunnusluvuissa tarkastellaan nimenomaan yhteyksien vastaanottamista eli arvostuksen kohteena olemista Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 30. Keskeisyys 30 • Keskeisyyden käsite määritellään suuntaamattomille verkostoille • Keskeisyyttä voidaan kuvata seuraavilla tunnusluvuilla • Keskeisyysaste (degree centrality) • Läheisyys (closeness centrality) • Välillisyys (betweenness centrality) • Informaatiokeskeisyys (information centrality) • Suuntaamattomissa verkostoissa keskeinen toimija on osallisena monissa yhteyksissä • Keskeisyyden kannalta ei ole väliä, onko toimija lähettänyt vai vastaanottanut yhteyden • Keskeisyys on verkoston toimijaa ni kuvaava tunnusluku, kun taas koko verkostolle yhteisesti voidaan määrittää keskittyneisyys (centralization), joka on verkostosta toiseen vertailtava tunnusluku • Keskittyneisyyden avulla voidaan kuvata, missä määrin yksittäiset toimijat hallitsevat muiden välistä kanssakäymistä yleisesti koko verkoston tasolla Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 31. Keskeisyysaste 31 • Toimijan ni keskeisyysaste CD(ni) kertoo, kuinka monta suoraa yhteyttä toimijalla on muihin toimijoihin (= asteluku d(ni)) • Toimijan aste ei itsessään ole kuitenkaan yleisesti vertailtava tunnusluku • Kun asteluku skaalataan verkoston tasolla, voidaan toimijoiden keskeisyysasteita vertailla eri verkostojen välillä • Normeerattu keskeisyysaste C´D(ni) määritellään d(ni) C´D(ni) = , missä g on verkoston toimijoiden lukumäärä g–1 • Keskeisyysaste määritellään myös suunnatuille verkostoille, jolloin käsitellään erikseen vientikeskeisyyttä (outdegree centrality) ja tuontikeskeisyyttä (indegree centrality) Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 32. Läheisyys ja välillisyys 32 • Läheisyys on toimijan ni lyhyimpien polkujen (geodeesien) summa ci kaikkiin verkoston muihin toimijoihin nj • Itsessään summa ei ole vertailtava tunnusluku eri verkostojen välillä • Verkostojen kesken vertailukelpoinen normeerattu läheisyys määritellään g–1 C´C(ni) = , missä g on verkoston toimijoiden lukumäärä ci • Toimijan välillisyys puolestaan mittaa, kuinka monen toimijaparin välisen lyhyimmän polun varrelle toimija sijoittuu • Toimijan välillisyys on merkityksellinen tunnusluku mm. tutkittaessa verkoston toiminnan tehokkuutta Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 33. Arvostus 33 • Kuten keskeisyyttä, niin myös arvostusta voidaan tarkastella eri tavoin • Verkoston toimijoille voidaan määrittää seuraavat arvostukset • Arvostusaste (actor degree prestige) • Arvostusläheisyys (actor proximity prestige) • Arvoasema (actor status prestige, actor rank prestige) • Koko verkoston tasolla voidaan määrittää verkostoa kuvaavia arvostuksen tunnuslukuja arvioimalla kunkin arvostuksen keskiarvoja ja variansseja • Näistä keskiarvostusläheisyys ja arvostusläheisyyden varianssi ovat mielekkäimpiä tarkasteltavia verkostoanalyysin kannalta Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 34. Arvostusaste 34 • Toimijan ni arvostusaste PD(ni) määritellään yksinkertaisesti toimijaan kohdistuneiden yhteyksien summana • Vertaa suuntaamattoman verkoston toimijan ni keskeisyysaste, joka määritellään toimijaa kuvaavan solmun astelukuna d(ni) • Arvostusaste määritellään formaalisti PD(ni) = dI(ni) = Σj xij = x+i , missä dI(ni) on solmun ni tuontiluku ja x+i on verkoston sosiomatriisin X sarakesumma sarakkeesta i • Jotta arvostusasteet eri verkostojen välillä olisivat verrattavissa keskenään, määritellään normeerattu arvostusaste P´D(ni) x+i P´D(ni) = , missä g on verkoston toimijoiden lukumäärä g–1 Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 35. Arvostusläheisyys 35 • Toimijalle ni voidaan määrittää luku Ii, joka ilmoittaa, kuinka moni toimija nj voi saavuttaa toimijan ni • Tämän toimijan ni vaikutusjoukon toimijoiden lukumäärän Ii avulla voidaan määrittää vaikutusjoukon toimijoiden keskimääräinen etäisyys toimijasta ni • Toimijan ni arvostusläheisyys PP(ni) määritellään vaikutusjoukon osuuden koko verkoston toimijajoukosta suhteena vaikutusjoukon toimijoiden keskimääräiseen etäisyyteen toimijasta ni • Arvostusläheisyys saa muiden normeerattujen tunnuslukujen tavoin arvoja välillä [0,1] • Jos toimijalla ni on suora yhteys jokaiseen verkoston muuhun toimijaan, saa arvostusläheisyys arvon yksi • Jos toimija ni on isolaatti (an isolate, isolates), vaikutusjoukon toimijoiden lukumäärä Ii nolla, ja arvostusläheisyys määritellään nollaksi Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 36. Arvoasema 36 • Edellä esitellyt arvostuksen tunnusluvut huomioivat vain toimijoita ja niihin kohdistuvia yhteyksiä • Toimijan ni arvoasema PR(ni) on riippuvainen häneen päin yhteydessä olevien toimijoiden nj arvoasemista PR(nj) • Edelleen taas toimijoiden nj arvoasemat ovat riippuvaisia näihin päin yhteydessä olevien toimijoiden nk arvoasemista jne. • Arvoaseman määrittelyn taustalla on ajatus siitä, että toimijan ni arvoasema on häneen päin suoraan yhteydessä olevien toimijoiden arvoasemien funktio • Verkostossa, jossa on g toimijaa, toimijan ni arvoasema voidaan esittää sosiomatriisin X toimijaa kuvaavan sarakkeen alkioiden ja niitä vastaavien toimijoiden arvoasemien lineaarikombinaationa, ts. PR(ni) = x1i PR(n1) + x2i PR(n2) + … + xgi PR(ng) • Arvoaseman määrittäminen vaatii syvällisempää ymmärrystä mm. matriisin ominaisarvoprobleeman ratkaisusta • Myöhemmissä esityksissä perehdytään algoritmeihin, joilla verkoston toimijoiden arvoasemat voidaan määrittää erilaisissa verkostoissa Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 37. Esimerkki – Valtioiden kauppaverkosto 37 • Seuraavassa on esitetty 24 valtion kauppaverkosto (Wasserman & Faust 1994) http://matriisi.ee.tut.fi/~miilumak/sna/ Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 38. Esimerkki – Valtioiden kauppaverkosto 38 • Verkostosta määritetyt arvostuksen tunnusluvut (g = 24) i VALTIO dI (ni) dO (ni) PD' (ni) PP' (ni) PR' (ni) 1 Algeria 13 4 0,565 0,661 0,222 2 Argentina 10 13 0,435 0,599 0,805 3 Brazil 11 21 0,478 0,619 1,000 4 China 15 21 0,652 0,710 0,711 5 Czechoslovakia 13 21 0,565 0,661 0,818 6 Ecuador 9 2 0,391 0,581 0,183 7 Egypt 12 9 0,522 0,639 0,482 8 Ethiopia 10 2 0,435 0,599 0,131 9 Finland 15 21 0,652 0,710 0,758 10 Honduras 9 1 0,391 0,581 0,072 11 Indonesia 14 14 0,609 0,685 0,617 12 Israel 10 11 0,435 0,599 0,682 13 Japan 17 23 0,739 0,767 0,680 14 Liberia 9 0 0,391 0,601 0,000 15 Madagascar 6 1 0,261 0,533 0,106 16 New Zealand 14 11 0,609 0,685 0,461 17 Pakistan 14 13 0,609 0,685 0,525 18 Spain 17 22 0,739 0,767 0,673 19 Switzerland 15 23 0,652 0,710 0,765 20 Syria 12 0 0,522 0,658 0,000 21 Thailand 15 14 0,652 0,710 0,589 22 United Kingdom 16 22 0,696 0,738 0,633 23 United States 19 23 0,826 0,834 0,644 24 Yugoslavia 15 18 0,652 0,710 0,680 MEAN 12,917 13,292 0,562 0,668 0,510 VARIANCE 9,993 67,955 0,018 0,005 0,085 Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 39. Huomioitavaa 39 • On selvää, että keskeisyyden ja arvostuksen tunnusluvut tuovat verkostosta esiin seikkoja, joita ei tulisi huomanneeksi pelkästään verkoston graafia, matriisia tai muunlaista mallia tarkastelemalla • Keskeisyyden ja arvostuksen tunnusluvut tarjoavat monipuolista tietoa verkoston toiminnasta ja antavat viitteitä siitä, kuinka verkostoa tulisi kehittää, oli sitten kyse tehokkuuden lisäämisestä tai esim. rakenteen parantamisesta • Tunnuslukuja ei saa kuitenkaan pitää ainoina mittareina verkoston toiminnasta • Graafit visualisointeina tarjoavat paljon hyödyllistä tietoa verkoston rakenteesta ja toiminnasta (aikasarjat, DNA – Dynamic Network Analysis) • Toimijoiden keskeisyydet ja arvostukset ovat vain osa suurempaa kuvaa • Muutosten jälkeen tulee tarkastella verkostoa uudelleen, tulkita tunnusluvut uudelleen ja tarkastella oliko muutos hyvä vai huono Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 40. Lähteet 40 Johansson, J-E., Mattila, M. & Uusikylä, P. (1995). Johdatus verkostoanalyysiin. Helsinki: Kuluttajatutkimuskeskus. http://www.valt.helsinki.fi/vol/kirja/ (Viitattu 10.3.2011) Knoke, D. & Yang, S. 2008. Social Network Analysis. Second Edition. Los Angeles: Sage Publications. Miilumäki, T. (2008). Graphs in Social Network Analysis And Modeling. Graafit sosiaalisten verkostojen mallintamisessa. Tampere: Tampereen teknillinen yliopisto, luentoesitys. http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_- _Graafit_sosiaalisten_verkostojen_mallintamisessa.pdf (Viitattu 10.3.2011) Miilumäki, T. (2009a). Matrices in Social Network Analysis And Modeling. Matriisit sosiaalisten verkostojen mallintamisessa. Tampere: Tampereen teknillinen yliopisto, luentoesitys. http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_- _Matriisit_sosiaalisten_verkostojen_mallintamisessa.pdf (Viitattu 10.3.2011) Miilumäki, T. (2009b). Social Network Analysis – Centrality And Prestige. Sosiaalisten verkostojen analyysi – Keskeisyys ja arvostus. Tampere: Tampereen teknillinen yliopisto, luentoesitys. http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_Keskeisyys-ja- arvostus.pdf (Viitattu 10.3.2011) Miilumäki, T. (2010). Web-pohjaisten sosiaalisten verkostojen analyysimenetelmät. Diplomityö. Tampere: Tampereen teknillinen yliopisto. http://dspace.cc.tut.fi/dpub/bitstream/handle/123456789/6635/miilumaki.pdf. Moreno, J.L. (1953). Who Shall Survive? Beacon, New York: Beacon House Inc. Ruohonen, K. (2006). Graafiteoria. Tampere: Tampereen teknillisen yliopiston opetusmoniste no. 5, uusi sarja. Scott, J. (2000). Social Network Analysis. A Handbook. Second Edition. London: Sage Publications. Wasserman, S. & Faust, K. (1994). Social Network Analysis: Methods and Applications. New York: Cambridge University Press. Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  • 41. Verkostoanalyysi 2011, TTY – 11.3.2011 41 Kiitos mielenkiinnostanne. Kysymyksiä? thumas.miilumaki@tut.fi Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011