16. Ukázka vizualizace dynamiky – Dynamic Network Analysis
• Obama Twitter Network web
– https://www.youtube.com/watch?v=W0_0g407apM
• The Egyptian Revolution on Twitter
– https://www.youtube.com/watch?v=2guKJfvq4uI
• 2013 Boston Marathon Bombings on Twitter
– https://www.youtube.com/watch?v=GG027Bx_V4g
• Organic Organization Chart
– https://www.youtube.com/watch?v=mkJ-Uy5dt5g
http://en.wikipedia.org/wiki/Dynamic_network_analysis
16
17. How social networks predict epidemics (Nicholas Christakis)
17
http://www.ted.com/talks/lang/cs/nicholas_christakis_how_social_networks_predict_epidemics.html
19. Sociální síť
• Musí existovat sada entit v systému.
• Musí existovat vztah mezi těmito entitami.
• Předpoklad nenáhodnosti vztahů
– náhodné | komplexní sítě
– Terminologická poznámka:
• Obecně: síť ≠ graf
– Graf je určitý útvar (systém), který je možno znázornit obrázkem v rovině pomocí bodů (vrcholy grafu) a spojnic mezi body (hrany
grafu).
– Síť je graf, který je konečný, souvislý, orientovaný, acyklický a ohodnocený, v němž existuje jeden konečný a jeden počáteční uzel.
– Síť lze reprezentovat pomocí grafu.
• V prezentaci budeme hovořit občas o síti, i když to bude terminologicky správně graf.
21. Vybrané parametry prvků v síti
• Degree (centrality) [stupeň vrcholu] {http://en.wikipedia.org/wiki/Centrality}
• počet neorientovaných hran incidentních s vrcholem (např. kolik má člen sítě
celkem přátel)
• pro orientované hrany in/out stupeň vrcholu (indegree, outdegree)
• může implikovat důležitost (vliv) prvku v síti
23. • Closeness (centrality)
– Průměrná délka nejkratší cesty z vrcholu do všech ostatních vrcholů sítě.
• http://en.wikipedia.org/wiki/Small-world_experiment (Stanley Milgram)
– http://en.wikipedia.org/wiki/Six_degrees_of_separation
– Vyjadřuje např. jak rychle se od vrcholu rozšíří informace k ostatním vrcholům sítě.
• Daný vrchol má lepší přístup k informacím, které poskytují jiné vrcholy.
• Má možnost ovlivnit ostatní vrcholy rychleji, než vrcholy vzdálenější.
– Důležité osoby v rámci lokálních komunit v síti.
– Pozor na hodnoty – nižší hodnota (kratší cesta k ostatním) znamená vyšší blízkost (closeness).
23
24. • Betweenness (centrality)
– Počet nejkratších cest, které vedou přes daný vrchol.
• Vyšší hodnota může implikovat oblíbence a influencera v rámci sítě, ale ve
specifických případech také „úzké hrdlo“ systému. (Obrázek: Pokud např.
odstraníme Rafaela, síť se rozpadne.)
• Vrchol může být využit jako mediátor mezi skupinami (shluky) pro přenos
informací, nebo v marketingu jako osoba, která nám umožní rozšířit nový
produkt v rámci celé sítě (vhodné je získat jako advokáty značky).
• Často normalizace hodnoty do intervalu <0, 1>.
24
25. • Eigenvector (centrality)
– podobný degree centrality, ale přidává k výsledku počet vazeb vrcholů, které mají vrcholy s ním
spojené (iterace parametrem „důležitosti“ vrcholů)
– vrcholy s vysokým stupněm koeficientu mají vyšší napojení na „důležité“ vrcholy
• „velká ryba má kontakt na další velkou rybu, která má kontakt na další velkou rybu, …“
– Vrcholy s vysokou eigenvalue jsou klíčové vrcholy. (Nemusí ale mít dobrý přístup na periferie.)
• Podobné u crawlingu (link-buildingu) webu a ohodnocování stránek např. pomocí
PageRank.
25
26. • Klastrovací (shlukovací) koeficient
– Reprezentuje hustotu propojení všech sousedů daného vrcholu.
– Lidé mají tendenci tvořit shluky (komunity).
• Např. znám Pepu a Frantu → je pravděpodobné, že Pepa zná Frantu
– Triadic Closure (Georg Simmon)
– Několik způsobů měření… např. pomocí trojúhelníků.
• http://en.wikipedia.org/wiki/Clustering_coefficient
– Čím vyšší hodnota, tím „více je součástí komunity“.
26
27. Layout zobrazení komplexity sítě
• „Hairball“ problém
• Např. „force-directed“ layouting (http://en.wikipedia.org/wiki/Force-directed_graph_drawing)
– Attraction (drawing nodes closer together based on their similarity or relatedness)
– Repulsion (unrelated or distantly related nodes further apart from one another)
– Gravity (how nodes are drawn relative to the center of the graph)
– Např. ARF, Force Atlas, Force Atlas 2, Fruchterman-Reingold, OpenOrd, Yifan Hu, …
• tree, circular, radial, geographic, layered, … layouting
• Gephi tutorial
– http://www.slideshare.net/gephi/gephi-tutorial-layouts
27
28. Příklady (komerčního) využití
• Identifikace opinion makerů (influencerů).
• Doporučující algoritmy.
• Pozorování procesů na síti.
– Simulace šíření informací. (Spolupráce.)
• Informační difúze (difúze inovací).
• Viralizace.
– Ochrana před útoky. (Klíčové prvky.)
• Co se stane při odstranění důležitých entit? (např. vrcholu s
nejvyšším stupněm)
– Testování stability systému. (Robustnost.)
• Jak se změní vlastnosti systému (rychlost šíření informace,
vzdálenost, dostupnost,…) při odstranění určitých uzlů?
28
30. Doporučuji pro samostudium
• Absolvovat zdarma kurz v rámci (MOOC – Massive Open Online Course) Coursera.org
– https://www.coursera.org/course/sna
• Ken Cherven – Mastering Gephi Network Visualization
– http://www.amazon.com/Mastering-Gephi-Network-Visualization-Cherven/dp/1783987340
• Introduction to social network methods
– http://faculty.ucr.edu/~hanneman/nettext/
• Social Network Analysis Instructional Web Site
– http://www.analytictech.com/networks/
• Networks, Crowds, and Markets: Reasoning About a Highly Connected World
– http://www.cs.cornell.edu/home/kleinber/networks-book/
• Journal of Social Structure
– http://www.cmu.edu/joss/content/articles/volindex.html
30
31. Úkol: Analyzujte datový soubor z fakultní FB skupiny
• Budete potřebovat např. Gephi (na učebnách nainstalovaný, nebo volně na https://gephi.org/.)
• Datový (*.gdf) soubor: Stažený přes FB aplikaci netvizz – stahujte zde: http://gephi.michalnovak.eu/
31