SlideShare ist ein Scribd-Unternehmen logo
1 von 31
62ZMN0 – Znalostní management
19. 03. 2015
Michal Novák
michal.novak@vse.cz
1
Lehký úvod do metod vizualizace komplexity sociálních sítí
2
3
4
http://www.art-sciencefactory.com/complexity-map_feb09.html
Ukázky vizualizací z různých domén
5
http://www.moviegalaxies.com/movies/513-The-Lord-of-the-Rings:-The-Return-of-the-King
Topologie sítě
6
http://en.wikipedia.org/wiki/Network_topology
Scientometrie
7
http://paperscape.org/
Byznys
8
https://hbr.org/2015/02/the-rise-of-social-graphs-for-businesses
Organizační struktura
9http://www.autodeskresearch.com/projects/orgorgchart
Doprava
10http://casualdata.com/senseofpatterns/
Biologie
11http://www.nature.com/nrn/journal/v10/n3/full/nrn2575.html
Výskyt postav v seriálu
12
http://www.vislives.com/2014/09/the-simpons-social-netwok-season-1.html
Gastronomie (1/2)
13
http://www.nature.com/srep/2011/111215/srep00196/full/srep00196.html
Gastronomie (2/2)
14
http://www.nature.com/srep/2011/111215/srep00196/full/srep00196.html
Ekonomika
15http://viz.ged-project.de/?lang=en
Ukázka vizualizace dynamiky – Dynamic Network Analysis
• Obama Twitter Network web
– https://www.youtube.com/watch?v=W0_0g407apM
• The Egyptian Revolution on Twitter
– https://www.youtube.com/watch?v=2guKJfvq4uI
• 2013 Boston Marathon Bombings on Twitter
– https://www.youtube.com/watch?v=GG027Bx_V4g
• Organic Organization Chart
– https://www.youtube.com/watch?v=mkJ-Uy5dt5g
http://en.wikipedia.org/wiki/Dynamic_network_analysis
16
How social networks predict epidemics (Nicholas Christakis)
17
http://www.ted.com/talks/lang/cs/nicholas_christakis_how_social_networks_predict_epidemics.html
Nyní trochu nu{d, t}né teorie, než si začneme hrát
18
Sociální síť
• Musí existovat sada entit v systému.
• Musí existovat vztah mezi těmito entitami.
• Předpoklad nenáhodnosti vztahů
– náhodné | komplexní sítě
– Terminologická poznámka:
• Obecně: síť ≠ graf
– Graf je určitý útvar (systém), který je možno znázornit obrázkem v rovině pomocí bodů (vrcholy grafu) a spojnic mezi body (hrany
grafu).
– Síť je graf, který je konečný, souvislý, orientovaný, acyklický a ohodnocený, v němž existuje jeden konečný a jeden počáteční uzel.
– Síť lze reprezentovat pomocí grafu.
• V prezentaci budeme hovořit občas o síti, i když to bude terminologicky správně graf.
• Sítě
• neorientované × orientované
• vážené × nevážené
• Vrcholy (nodes, vertices, sites, actors)
• Hrany (links, edges, arcs, bonds, ties, relations)
Vybrané parametry prvků v síti
• Degree (centrality) [stupeň vrcholu] {http://en.wikipedia.org/wiki/Centrality}
• počet neorientovaných hran incidentních s vrcholem (např. kolik má člen sítě
celkem přátel)
• pro orientované hrany in/out stupeň vrcholu (indegree, outdegree)
• může implikovat důležitost (vliv) prvku v síti
Pravděpodobnostní distribuce stupňů vrcholu
22
• Closeness (centrality)
– Průměrná délka nejkratší cesty z vrcholu do všech ostatních vrcholů sítě.
• http://en.wikipedia.org/wiki/Small-world_experiment (Stanley Milgram)
– http://en.wikipedia.org/wiki/Six_degrees_of_separation
– Vyjadřuje např. jak rychle se od vrcholu rozšíří informace k ostatním vrcholům sítě.
• Daný vrchol má lepší přístup k informacím, které poskytují jiné vrcholy.
• Má možnost ovlivnit ostatní vrcholy rychleji, než vrcholy vzdálenější.
– Důležité osoby v rámci lokálních komunit v síti.
– Pozor na hodnoty – nižší hodnota (kratší cesta k ostatním) znamená vyšší blízkost (closeness).
23
• Betweenness (centrality)
– Počet nejkratších cest, které vedou přes daný vrchol.
• Vyšší hodnota může implikovat oblíbence a influencera v rámci sítě, ale ve
specifických případech také „úzké hrdlo“ systému. (Obrázek: Pokud např.
odstraníme Rafaela, síť se rozpadne.)
• Vrchol může být využit jako mediátor mezi skupinami (shluky) pro přenos
informací, nebo v marketingu jako osoba, která nám umožní rozšířit nový
produkt v rámci celé sítě (vhodné je získat jako advokáty značky).
• Často normalizace hodnoty do intervalu <0, 1>.
24
• Eigenvector (centrality)
– podobný degree centrality, ale přidává k výsledku počet vazeb vrcholů, které mají vrcholy s ním
spojené (iterace parametrem „důležitosti“ vrcholů)
– vrcholy s vysokým stupněm koeficientu mají vyšší napojení na „důležité“ vrcholy
• „velká ryba má kontakt na další velkou rybu, která má kontakt na další velkou rybu, …“
– Vrcholy s vysokou eigenvalue jsou klíčové vrcholy. (Nemusí ale mít dobrý přístup na periferie.)
• Podobné u crawlingu (link-buildingu) webu a ohodnocování stránek např. pomocí
PageRank.
25
• Klastrovací (shlukovací) koeficient
– Reprezentuje hustotu propojení všech sousedů daného vrcholu.
– Lidé mají tendenci tvořit shluky (komunity).
• Např. znám Pepu a Frantu → je pravděpodobné, že Pepa zná Frantu
– Triadic Closure (Georg Simmon)
– Několik způsobů měření… např. pomocí trojúhelníků.
• http://en.wikipedia.org/wiki/Clustering_coefficient
– Čím vyšší hodnota, tím „více je součástí komunity“.
26
Layout zobrazení komplexity sítě
• „Hairball“ problém
• Např. „force-directed“ layouting (http://en.wikipedia.org/wiki/Force-directed_graph_drawing)
– Attraction (drawing nodes closer together based on their similarity or relatedness)
– Repulsion (unrelated or distantly related nodes further apart from one another)
– Gravity (how nodes are drawn relative to the center of the graph)
– Např. ARF, Force Atlas, Force Atlas 2, Fruchterman-Reingold, OpenOrd, Yifan Hu, …
• tree, circular, radial, geographic, layered, … layouting
• Gephi tutorial
– http://www.slideshare.net/gephi/gephi-tutorial-layouts
27
Příklady (komerčního) využití
• Identifikace opinion makerů (influencerů).
• Doporučující algoritmy.
• Pozorování procesů na síti.
– Simulace šíření informací. (Spolupráce.)
• Informační difúze (difúze inovací).
• Viralizace.
– Ochrana před útoky. (Klíčové prvky.)
• Co se stane při odstranění důležitých entit? (např. vrcholu s
nejvyšším stupněm)
– Testování stability systému. (Robustnost.)
• Jak se změní vlastnosti systému (rychlost šíření informace,
vzdálenost, dostupnost,…) při odstranění určitých uzlů?
28
Social Network Analysis Software
• CFinder
• Gephi
• NetMiner
• NetworkX
• NodeXL
• R
• ScioMetrica
• Tulip
• …
Doporučuji pro samostudium
• Absolvovat zdarma kurz v rámci (MOOC – Massive Open Online Course) Coursera.org
– https://www.coursera.org/course/sna
• Ken Cherven – Mastering Gephi Network Visualization
– http://www.amazon.com/Mastering-Gephi-Network-Visualization-Cherven/dp/1783987340
• Introduction to social network methods
– http://faculty.ucr.edu/~hanneman/nettext/
• Social Network Analysis Instructional Web Site
– http://www.analytictech.com/networks/
• Networks, Crowds, and Markets: Reasoning About a Highly Connected World
– http://www.cs.cornell.edu/home/kleinber/networks-book/
• Journal of Social Structure
– http://www.cmu.edu/joss/content/articles/volindex.html
30
Úkol: Analyzujte datový soubor z fakultní FB skupiny
• Budete potřebovat např. Gephi (na učebnách nainstalovaný, nebo volně na https://gephi.org/.)
• Datový (*.gdf) soubor: Stažený přes FB aplikaci netvizz – stahujte zde: http://gephi.michalnovak.eu/
31

Weitere ähnliche Inhalte

Andere mochten auch

Educacaocfess
EducacaocfessEducacaocfess
Educacaocfess
mauxa
 
Clase 2 NES Enfoque de enseñanza y recorrido en su construcción vf.ppt 12 ...
Clase 2 NES  Enfoque de enseñanza y recorrido en su  construcción  vf.ppt 12 ...Clase 2 NES  Enfoque de enseñanza y recorrido en su  construcción  vf.ppt 12 ...
Clase 2 NES Enfoque de enseñanza y recorrido en su construcción vf.ppt 12 ...
Verónica Tomas
 
5. Ricardo Monsivais, AWS LAC (parte 1)
5. Ricardo Monsivais, AWS LAC (parte 1)5. Ricardo Monsivais, AWS LAC (parte 1)
5. Ricardo Monsivais, AWS LAC (parte 1)
Fundación Chile
 
FC Barcelona - FCB Apps
FC Barcelona - FCB AppsFC Barcelona - FCB Apps
FC Barcelona - FCB Apps
FC Barcelona
 
Norman Obciana resume1
Norman Obciana resume1Norman Obciana resume1
Norman Obciana resume1
Norman Obciana
 
Patients Like Me: Rheumatoid Arthritis
Patients Like Me: Rheumatoid ArthritisPatients Like Me: Rheumatoid Arthritis
Patients Like Me: Rheumatoid Arthritis
consultareumatologia
 
Comunicación oral y escrita en lengua originaria nivel básico aymara 1
Comunicación oral y escrita en lengua originaria nivel básico   aymara 1Comunicación oral y escrita en lengua originaria nivel básico   aymara 1
Comunicación oral y escrita en lengua originaria nivel básico aymara 1
Richard Calisaya Illacutipa
 

Andere mochten auch (20)

Educacaocfess
EducacaocfessEducacaocfess
Educacaocfess
 
Clase 2 NES Enfoque de enseñanza y recorrido en su construcción vf.ppt 12 ...
Clase 2 NES  Enfoque de enseñanza y recorrido en su  construcción  vf.ppt 12 ...Clase 2 NES  Enfoque de enseñanza y recorrido en su  construcción  vf.ppt 12 ...
Clase 2 NES Enfoque de enseñanza y recorrido en su construcción vf.ppt 12 ...
 
5. Ricardo Monsivais, AWS LAC (parte 1)
5. Ricardo Monsivais, AWS LAC (parte 1)5. Ricardo Monsivais, AWS LAC (parte 1)
5. Ricardo Monsivais, AWS LAC (parte 1)
 
Finalized Newsletter_4Oct2016_revised
Finalized Newsletter_4Oct2016_revisedFinalized Newsletter_4Oct2016_revised
Finalized Newsletter_4Oct2016_revised
 
Correo electronico
Correo electronicoCorreo electronico
Correo electronico
 
Gprs kapsch 18 12 07
Gprs kapsch 18 12 07Gprs kapsch 18 12 07
Gprs kapsch 18 12 07
 
FC Barcelona - FCB Apps
FC Barcelona - FCB AppsFC Barcelona - FCB Apps
FC Barcelona - FCB Apps
 
Norman Obciana resume1
Norman Obciana resume1Norman Obciana resume1
Norman Obciana resume1
 
Estructura wendy piña
Estructura wendy piñaEstructura wendy piña
Estructura wendy piña
 
Three years at Linkedin As Told Through Shirts
Three years at Linkedin As Told Through ShirtsThree years at Linkedin As Told Through Shirts
Three years at Linkedin As Told Through Shirts
 
Armonía en la Marca
Armonía en la MarcaArmonía en la Marca
Armonía en la Marca
 
Green chem 2
Green chem 2Green chem 2
Green chem 2
 
Custom code management & tools
Custom code management & toolsCustom code management & tools
Custom code management & tools
 
Patients Like Me: Rheumatoid Arthritis
Patients Like Me: Rheumatoid ArthritisPatients Like Me: Rheumatoid Arthritis
Patients Like Me: Rheumatoid Arthritis
 
Pwp odisea darifa_y_miriam
Pwp odisea darifa_y_miriamPwp odisea darifa_y_miriam
Pwp odisea darifa_y_miriam
 
Mlp my little pony para nivel avanzado
Mlp my little pony para nivel avanzadoMlp my little pony para nivel avanzado
Mlp my little pony para nivel avanzado
 
TFG Santiago Pellejero. Presentación
TFG Santiago Pellejero. PresentaciónTFG Santiago Pellejero. Presentación
TFG Santiago Pellejero. Presentación
 
Presentacion 25 libros para emprendedores que debes leer
Presentacion 25 libros para emprendedores que debes leerPresentacion 25 libros para emprendedores que debes leer
Presentacion 25 libros para emprendedores que debes leer
 
Comunicación oral y escrita en lengua originaria nivel básico aymara 1
Comunicación oral y escrita en lengua originaria nivel básico   aymara 1Comunicación oral y escrita en lengua originaria nivel básico   aymara 1
Comunicación oral y escrita en lengua originaria nivel básico aymara 1
 
Quimicos
QuimicosQuimicos
Quimicos
 

Ähnlich wie Lehký úvod do metod vizualizace komplexity sociálních sítí (6)

Enterprise 3.0: Podnik chycený v sociální siti vyznamů
Enterprise 3.0: Podnik chycený v sociální siti vyznamůEnterprise 3.0: Podnik chycený v sociální siti vyznamů
Enterprise 3.0: Podnik chycený v sociální siti vyznamů
 
Social network analysis
Social network analysisSocial network analysis
Social network analysis
 
Technologie sémantického webu pro vzdělávání
Technologie sémantického webu pro vzděláváníTechnologie sémantického webu pro vzdělávání
Technologie sémantického webu pro vzdělávání
 
David Novák: Historické vědy a počítačové zpracování dat
David Novák: Historické vědy a počítačové zpracování datDavid Novák: Historické vědy a počítačové zpracování dat
David Novák: Historické vědy a počítačové zpracování dat
 
Využití bibliografických dat a jejich vizualizace pomocí bibliometrickýchmetod
Využití bibliografických dat a jejich vizualizace pomocí bibliometrickýchmetodVyužití bibliografických dat a jejich vizualizace pomocí bibliometrickýchmetod
Využití bibliografických dat a jejich vizualizace pomocí bibliometrickýchmetod
 
KPI závěrečný úkol
KPI závěrečný úkolKPI závěrečný úkol
KPI závěrečný úkol
 

Lehký úvod do metod vizualizace komplexity sociálních sítí

  • 1. 62ZMN0 – Znalostní management 19. 03. 2015 Michal Novák michal.novak@vse.cz 1
  • 2. Lehký úvod do metod vizualizace komplexity sociálních sítí 2
  • 3. 3
  • 5. Ukázky vizualizací z různých domén 5 http://www.moviegalaxies.com/movies/513-The-Lord-of-the-Rings:-The-Return-of-the-King
  • 12. Výskyt postav v seriálu 12 http://www.vislives.com/2014/09/the-simpons-social-netwok-season-1.html
  • 16. Ukázka vizualizace dynamiky – Dynamic Network Analysis • Obama Twitter Network web – https://www.youtube.com/watch?v=W0_0g407apM • The Egyptian Revolution on Twitter – https://www.youtube.com/watch?v=2guKJfvq4uI • 2013 Boston Marathon Bombings on Twitter – https://www.youtube.com/watch?v=GG027Bx_V4g • Organic Organization Chart – https://www.youtube.com/watch?v=mkJ-Uy5dt5g http://en.wikipedia.org/wiki/Dynamic_network_analysis 16
  • 17. How social networks predict epidemics (Nicholas Christakis) 17 http://www.ted.com/talks/lang/cs/nicholas_christakis_how_social_networks_predict_epidemics.html
  • 18. Nyní trochu nu{d, t}né teorie, než si začneme hrát 18
  • 19. Sociální síť • Musí existovat sada entit v systému. • Musí existovat vztah mezi těmito entitami. • Předpoklad nenáhodnosti vztahů – náhodné | komplexní sítě – Terminologická poznámka: • Obecně: síť ≠ graf – Graf je určitý útvar (systém), který je možno znázornit obrázkem v rovině pomocí bodů (vrcholy grafu) a spojnic mezi body (hrany grafu). – Síť je graf, který je konečný, souvislý, orientovaný, acyklický a ohodnocený, v němž existuje jeden konečný a jeden počáteční uzel. – Síť lze reprezentovat pomocí grafu. • V prezentaci budeme hovořit občas o síti, i když to bude terminologicky správně graf.
  • 20. • Sítě • neorientované × orientované • vážené × nevážené • Vrcholy (nodes, vertices, sites, actors) • Hrany (links, edges, arcs, bonds, ties, relations)
  • 21. Vybrané parametry prvků v síti • Degree (centrality) [stupeň vrcholu] {http://en.wikipedia.org/wiki/Centrality} • počet neorientovaných hran incidentních s vrcholem (např. kolik má člen sítě celkem přátel) • pro orientované hrany in/out stupeň vrcholu (indegree, outdegree) • může implikovat důležitost (vliv) prvku v síti
  • 23. • Closeness (centrality) – Průměrná délka nejkratší cesty z vrcholu do všech ostatních vrcholů sítě. • http://en.wikipedia.org/wiki/Small-world_experiment (Stanley Milgram) – http://en.wikipedia.org/wiki/Six_degrees_of_separation – Vyjadřuje např. jak rychle se od vrcholu rozšíří informace k ostatním vrcholům sítě. • Daný vrchol má lepší přístup k informacím, které poskytují jiné vrcholy. • Má možnost ovlivnit ostatní vrcholy rychleji, než vrcholy vzdálenější. – Důležité osoby v rámci lokálních komunit v síti. – Pozor na hodnoty – nižší hodnota (kratší cesta k ostatním) znamená vyšší blízkost (closeness). 23
  • 24. • Betweenness (centrality) – Počet nejkratších cest, které vedou přes daný vrchol. • Vyšší hodnota může implikovat oblíbence a influencera v rámci sítě, ale ve specifických případech také „úzké hrdlo“ systému. (Obrázek: Pokud např. odstraníme Rafaela, síť se rozpadne.) • Vrchol může být využit jako mediátor mezi skupinami (shluky) pro přenos informací, nebo v marketingu jako osoba, která nám umožní rozšířit nový produkt v rámci celé sítě (vhodné je získat jako advokáty značky). • Často normalizace hodnoty do intervalu <0, 1>. 24
  • 25. • Eigenvector (centrality) – podobný degree centrality, ale přidává k výsledku počet vazeb vrcholů, které mají vrcholy s ním spojené (iterace parametrem „důležitosti“ vrcholů) – vrcholy s vysokým stupněm koeficientu mají vyšší napojení na „důležité“ vrcholy • „velká ryba má kontakt na další velkou rybu, která má kontakt na další velkou rybu, …“ – Vrcholy s vysokou eigenvalue jsou klíčové vrcholy. (Nemusí ale mít dobrý přístup na periferie.) • Podobné u crawlingu (link-buildingu) webu a ohodnocování stránek např. pomocí PageRank. 25
  • 26. • Klastrovací (shlukovací) koeficient – Reprezentuje hustotu propojení všech sousedů daného vrcholu. – Lidé mají tendenci tvořit shluky (komunity). • Např. znám Pepu a Frantu → je pravděpodobné, že Pepa zná Frantu – Triadic Closure (Georg Simmon) – Několik způsobů měření… např. pomocí trojúhelníků. • http://en.wikipedia.org/wiki/Clustering_coefficient – Čím vyšší hodnota, tím „více je součástí komunity“. 26
  • 27. Layout zobrazení komplexity sítě • „Hairball“ problém • Např. „force-directed“ layouting (http://en.wikipedia.org/wiki/Force-directed_graph_drawing) – Attraction (drawing nodes closer together based on their similarity or relatedness) – Repulsion (unrelated or distantly related nodes further apart from one another) – Gravity (how nodes are drawn relative to the center of the graph) – Např. ARF, Force Atlas, Force Atlas 2, Fruchterman-Reingold, OpenOrd, Yifan Hu, … • tree, circular, radial, geographic, layered, … layouting • Gephi tutorial – http://www.slideshare.net/gephi/gephi-tutorial-layouts 27
  • 28. Příklady (komerčního) využití • Identifikace opinion makerů (influencerů). • Doporučující algoritmy. • Pozorování procesů na síti. – Simulace šíření informací. (Spolupráce.) • Informační difúze (difúze inovací). • Viralizace. – Ochrana před útoky. (Klíčové prvky.) • Co se stane při odstranění důležitých entit? (např. vrcholu s nejvyšším stupněm) – Testování stability systému. (Robustnost.) • Jak se změní vlastnosti systému (rychlost šíření informace, vzdálenost, dostupnost,…) při odstranění určitých uzlů? 28
  • 29. Social Network Analysis Software • CFinder • Gephi • NetMiner • NetworkX • NodeXL • R • ScioMetrica • Tulip • …
  • 30. Doporučuji pro samostudium • Absolvovat zdarma kurz v rámci (MOOC – Massive Open Online Course) Coursera.org – https://www.coursera.org/course/sna • Ken Cherven – Mastering Gephi Network Visualization – http://www.amazon.com/Mastering-Gephi-Network-Visualization-Cherven/dp/1783987340 • Introduction to social network methods – http://faculty.ucr.edu/~hanneman/nettext/ • Social Network Analysis Instructional Web Site – http://www.analytictech.com/networks/ • Networks, Crowds, and Markets: Reasoning About a Highly Connected World – http://www.cs.cornell.edu/home/kleinber/networks-book/ • Journal of Social Structure – http://www.cmu.edu/joss/content/articles/volindex.html 30
  • 31. Úkol: Analyzujte datový soubor z fakultní FB skupiny • Budete potřebovat např. Gephi (na učebnách nainstalovaný, nebo volně na https://gephi.org/.) • Datový (*.gdf) soubor: Stažený přes FB aplikaci netvizz – stahujte zde: http://gephi.michalnovak.eu/ 31