SlideShare a Scribd company logo
1 of 34
Download to read offline
{Politika a sorok között}
Politikai témájú szövegelemzések
2015.11.16., Politikai kommunikáció
Balogh Kitti – statisztikus, adatelemző, Precognox
{Tartalom}
» Szövegbányászat, tartalom-, diskurzuselemzés
» Politikai szövegelemzés példák:
» Főpolgármester-választással kapcsolatos tweetek elemzése
predikciós céllal
» Romák médiareprezentációja egy szélsőjobboldali
hírportálon
» A magyar politikai blogszféra az érzelmek hálójában
{Szövegbányászat}
» Szöveges elektronikus adatok feldolgozása és elemzése
» Adatok közötti eligazodás, keresés, rejtett
összefüggések feltárása, kinyerése
» Egyre növekvő elektronikus adatmennyiség
kb. 85% strukturálatlan adat (pl. emailek, hírek,
weboldalak, közösségi média tartalmak)
{Hagyományos szövegelemzés}
» Tartalomelemzés
» Szavak, nyelvi kategóriák gyakorisága, együttes megjelenése
» Kvantitatív elemzés
» Diskurzuselemzés
» Több megközelítés, pl. narratívaelemzés (Propp),
konverzációelemzés (Goffman, Garfinkel), kritikai
diskurzuselemzés (van Dijk, Wodak, Fairclough)
» A szöveg formai, tartalmi elemzésével társadalmi,
kulturális, politikai összefüggések feltárása
» Hagyományosan kvalitatív
{Szövegbányászat és hagyományos
szövegelemzés}
» Szövegbányászat vs. hagyományos szövegelemzés
» Nagy mennyiségű szöveg vs. kis mennyiségű szöveg
» Automatikus vs. sok emberi erőforrást, időt igénylő
» Szubjektivitás csökkentése vs. szubjektivitás veszélye
» Reprodukálhatóság javítása vs. Reprodukálhatóság
nehézsége/lehetetlensége
{Főpolgármester-választás előrejelzése}
» Módszertan
» Főpolgármester-jelöltek neveit tartalmazó tweetek leszedése
» R twitteR package
» 462 tweet
» választás előtti este (2014.10.11.)
» Tweetek szentiment- és emócióelemzése
» Szentiment- és emóciószótárak
» Gyakoriságok elemzése
» Relatív gyakoriságok szentimentenként, emóciónként
» Összehasonlítás közvélemény-kutatási adatokkal, majd az eredménnyel
{Főpolgármester-választás előrejelzése}
» Elmélet
» DiGrazia, McKelevy, Bollen és Rojas (2010): More Tweets, More
Votes: Social Media as a Quantitative Indicator of Political Behavior
» Szentiment- és emócióelemzés
» Szövegek által közvetített vélemények, attitűdök,
érzések detektálása pl. termékekkel, személyekkel,
eseményekkel, témákkal kapcsolatban
» Szentiment: ált. 3 (negatív, semleges, pozitív)
vagy 5 (nagyon negatív, negatív, semleges,
pozitív, nagyon pozitív) kategória
» Emóció: ált. 6 alapérzelem (bánat, düh, undor,
félelem, meglepődés, öröm)
» Pollyanna-hipotézis vs. negatív: több info
{Főpolgármester-választás előrejelzése}
» Elemzés
Tweetek gyakorisága emóció szerint
Tarlós Bokros Staudt Csárdi Bodnár Össz.
Düh 164 133 7 13 15 332
Szomorúság 6 6 1 1 1 15
Öröm 9 9 1 2 1 22
Félelem 1 0 0 0 0 1
Meglepődás 0 1 0 0 0 1
Undor 0 0 0 0 0 0
Ismeretlen 30 52 1 6 2 91
Össz. 210 201 10 22 19 462
{Főpolgármester-választás előrejelzése}
Tweetek gyakorisága szentiment szerint
Tarlós Bokros Staudt Csárdi Bodnár Össz.
Semleges 149 146 6 16 14 331
Pozitív 26 33 3 3 4 69
Negatív 35 22 1 3 1 62
Össz. 210 201 10 22 19 462
{Főpolgármester-választás előrejelzése}
Eredmények
Nézőpont,
2014.10.6-8.,
biztos szav.
(n=500)
Minden Düh Szom. Öröm Seml. Poz. Neg.
Tarlós 49,06% 52% 45,45% 49,40% 40,00% 40,91% 45,02% 37,68% 56,45%
Bokros 36,04% 25% 43,51% 40,06% 40,00% 40,91% 44,11% 47,83% 35,48%
Staudt 7,10% 6% 2,16% 2,11% 6,67% 4,55% 1,81% 4,35% 1,61%
Csárdi 5,69% 6% 4,76% 3,92% 6,67% 9,09% 4,83% 4,35% 4,84%
Bodnár 2,10% 1% 4,11% 4,52% 6,67% 4,55% 4,23% 5,80% 1,61%
{Főpolgármester-választás előrejelzése}
Tarlós Istvánt ill. Bokros Lajost említő tweetek emóciós szófelhői
{A kuruc.info romaellenes témái}
» Módszertan
» „Cigánybűnözés” rovat cikkeinek begyűjtése, feldolgozása
» 10.304 cikk
» Időszak: 2006-2015. február
» Cikkekhez tartozó időbélyeg
» Cikkek témáinak kinyerése
» Látens Dirichlet allokáció (LDA)
» Input: dokumentumok szavai, témák száma
» Output: dokumentumok témaeloszlása, témák szóeloszlása
» Kapott témák összevetése a szakirodalommal és kiértékelés
» Témák időbeli változásának vizualizációja
{A kuruc.info romaellenes témái}
»Elmélet
» Romareprezentációs kutatások a magyar írott médiában
» Bogdán – Feischmidt - Guld (2010): „Csak másban”. Romareprezentáció a magyar
médiában
» Kriza – Vidra (2010): A többség fogságában – kisebbségek
médiareprezentációja
» Munk (2013): A romák reprezentációja a többségi média híreiben az 1960-as
évektől napjainkig
» Bernáth – Messing (1998, 2003, 2012)
» Témák számának meghatározása Bernáth és Messing (2012)
témastruktúrája + mat-i optimalizálás alapján: 27 téma
{A kuruc.info romaellenes témái}
» Minden téma megtalálható, kivéve:
» Jogvédelem, kisebbségi jogok
» Gazdaság, vállalkozás
» Természeti katasztrófák
» Differenciáltabb témafelosztás:
» Bűnözés
» Politika, közpolitika
» Diszkrimináció, előítéletek
» Külföldi romák
» Külpolitika, EU
» Kivándorlás
» Kiértékelés
» 600 cikk humán annotálása, 74%-os
recall, 55% precesion
» Összevetés a szakirodalmi témastruktúrával, kiértékelés
{A kuruc.info romaellenes témái}
» Témák időbeli változásának vizualizációja
» 27 téma, nehéz áttekinthetőség
» Szűcs Krisztina - tervezőgrafikus, data visualization designer,
krisztinaszucs.com
» Interaktív adatvizualizáció
» Elérhető: labs.precognox.com/kurucinfo_adatviz/
{A kuruc.info romaellenes témái}
» Eredeti idősorok 1-9. téma:
{A kuruc.info romaellenes témái}
{A kuruc.info romaellenes témái}
{A kuruc.info romaellenes témái}
{A magyar politikai blogszféra}
» Módszertan
» Magyar politikai blogok összegyűjtése
» Kb. 70 politikai blog
» Szövegek begyűjtése
» Összegyűjtött listából kiindulva
» Szövegekben lévő linkeken továbbhaladva weboldalak hálózata
» Csúcs: weboldal, él: link
» 12.121 db egyedi url, 22.542 él
» Hálózat normalizálása, tisztítása
» 1.441 db csomópont (pay-level url), 2.472 él
» Oldalakhoz kötődő szövegek emócióelemzése
{A magyar politikai blogszféra}
» Elmélet
» Hálózatelemzés
» Barabási Albert-László: Behálózva
» Gráfelmélet
» Kolaczyk – Csárdi: Statistical Analysis of Network Data with R
» Emóció-, szentimentelemzés
» Bing, Liu: Sentiment Analysis and Opinion Mining
{A magyar politikai blogszféra}
» Csúcsok közötti
átlagos úthossz: 3.342
» Átmérő: 9
» Kép: csúcsméret
PageRank szerint
{A magyar politikai blogszféra}
{A magyar politikai blogszféra}
{A magyar politikai blogszféra}
{A magyar politikai blogszféra}
» Bánat
{A magyar politikai blogszféra}
» Düh
{A magyar politikai blogszféra}
» Félelem
{A magyar politikai blogszféra}
» Meglepődés
{A magyar politikai blogszféra}
» Öröm
{A magyar politikai blogszféra}
» Undor
{A magyar politikai blogszféra}
» További tervek
» Gyűlöletbeszéd terjedése a hálózatban
» Csomópontok csoportosítása, visszaadja-e a politikai
blokkokat, csoportokat
» Bizonyos témák vizsgálata szentiment-, ill.
emócióelemzéssel
{Köszönöm szépen a figyelmet!}
Bővebben: kereses.blog.hu
precognox.com
labs.precognox.com/kurucinfo_adatviz/
Kontakt: kbalogh@precognox.com

More Related Content

Viewers also liked

La paritaria nacional es un fraude
La paritaria nacional es un fraudeLa paritaria nacional es un fraude
La paritaria nacional es un fraudeLaura Marrone
 
Sayed Kassem Gallup Report
Sayed Kassem Gallup ReportSayed Kassem Gallup Report
Sayed Kassem Gallup ReportSayed Kassem
 
Marketing in a Social World - FinanceConnect 2015
Marketing in a Social World - FinanceConnect 2015Marketing in a Social World - FinanceConnect 2015
Marketing in a Social World - FinanceConnect 2015LinkedIn India
 
Lista de-precios-compugreiff-enero-09-2013
Lista de-precios-compugreiff-enero-09-2013Lista de-precios-compugreiff-enero-09-2013
Lista de-precios-compugreiff-enero-09-2013xxxxx
 
NYU 5-Day Lean Launchpad Syllabus
NYU 5-Day Lean Launchpad SyllabusNYU 5-Day Lean Launchpad Syllabus
NYU 5-Day Lean Launchpad SyllabusNew York University
 
Сервис бронирования отелей в последний момент LastRoom
Сервис бронирования отелей в последний момент LastRoomСервис бронирования отелей в последний момент LastRoom
Сервис бронирования отелей в последний момент LastRoomТимур Низами
 
Ten Things Agencies Should Accentuate When It Comes To Social Media
Ten Things Agencies Should Accentuate When It Comes To Social MediaTen Things Agencies Should Accentuate When It Comes To Social Media
Ten Things Agencies Should Accentuate When It Comes To Social MediaAbhishek Shah
 

Viewers also liked (10)

La paritaria nacional es un fraude
La paritaria nacional es un fraudeLa paritaria nacional es un fraude
La paritaria nacional es un fraude
 
Sayed Kassem Gallup Report
Sayed Kassem Gallup ReportSayed Kassem Gallup Report
Sayed Kassem Gallup Report
 
Marketing in a Social World - FinanceConnect 2015
Marketing in a Social World - FinanceConnect 2015Marketing in a Social World - FinanceConnect 2015
Marketing in a Social World - FinanceConnect 2015
 
Lista de-precios-compugreiff-enero-09-2013
Lista de-precios-compugreiff-enero-09-2013Lista de-precios-compugreiff-enero-09-2013
Lista de-precios-compugreiff-enero-09-2013
 
Inclusion europe.
Inclusion europe.Inclusion europe.
Inclusion europe.
 
NYU 5-Day Lean Launchpad Syllabus
NYU 5-Day Lean Launchpad SyllabusNYU 5-Day Lean Launchpad Syllabus
NYU 5-Day Lean Launchpad Syllabus
 
tablas y Secciones
tablas y Seccionestablas y Secciones
tablas y Secciones
 
Сервис бронирования отелей в последний момент LastRoom
Сервис бронирования отелей в последний момент LastRoomСервис бронирования отелей в последний момент LastRoom
Сервис бронирования отелей в последний момент LastRoom
 
Cosma Paradores
Cosma ParadoresCosma Paradores
Cosma Paradores
 
Ten Things Agencies Should Accentuate When It Comes To Social Media
Ten Things Agencies Should Accentuate When It Comes To Social MediaTen Things Agencies Should Accentuate When It Comes To Social Media
Ten Things Agencies Should Accentuate When It Comes To Social Media
 

More from Zoltan Varju

NLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Bódogh Attila: xdroidNLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Bódogh Attila: xdroidZoltan Varju
 
NLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
NLP meetup 2016.10.05 - Szabó Martina Katalin: PrecognoxNLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
NLP meetup 2016.10.05 - Szabó Martina Katalin: PrecognoxZoltan Varju
 
NLP meetup 2016.10.05 - Szekeres Péter: Neticle
NLP meetup 2016.10.05 - Szekeres Péter: NeticleNLP meetup 2016.10.05 - Szekeres Péter: Neticle
NLP meetup 2016.10.05 - Szekeres Péter: NeticleZoltan Varju
 
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzéseBalogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzéseZoltan Varju
 
Babak Rasolzadeh: The importance of entities
Babak Rasolzadeh: The importance of entitiesBabak Rasolzadeh: The importance of entities
Babak Rasolzadeh: The importance of entitiesZoltan Varju
 
Szövegbányászat a gyakorlatban
Szövegbányászat a gyakorlatbanSzövegbányászat a gyakorlatban
Szövegbányászat a gyakorlatbanZoltan Varju
 
Szövegbányászat
SzövegbányászatSzövegbányászat
SzövegbányászatZoltan Varju
 
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...Zoltan Varju
 
Kisvilágunk, a nyelv
Kisvilágunk, a nyelvKisvilágunk, a nyelv
Kisvilágunk, a nyelvZoltan Varju
 
Balogh Kitti - Szűcs Krisztina: Képes beszéd
Balogh Kitti - Szűcs Krisztina: Képes beszédBalogh Kitti - Szűcs Krisztina: Képes beszéd
Balogh Kitti - Szűcs Krisztina: Képes beszédZoltan Varju
 
Érzelmek hálójában – hálózat- és tartalomelemzés
Érzelmek hálójában – hálózat- és tartalomelemzésÉrzelmek hálójában – hálózat- és tartalomelemzés
Érzelmek hálójában – hálózat- és tartalomelemzésZoltan Varju
 
Szabó - Varjú: Automatikus értékelés- és érzelemelemzés magyar nyelvű szöveg...
Szabó - Varjú: Automatikus  értékelés- és érzelemelemzés magyar nyelvű szöveg...Szabó - Varjú: Automatikus  értékelés- és érzelemelemzés magyar nyelvű szöveg...
Szabó - Varjú: Automatikus értékelés- és érzelemelemzés magyar nyelvű szöveg...Zoltan Varju
 
Mókus (Koncsik Anita, Varjú Zoltán)
Mókus (Koncsik Anita, Varjú Zoltán)Mókus (Koncsik Anita, Varjú Zoltán)
Mókus (Koncsik Anita, Varjú Zoltán)Zoltan Varju
 
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...Zoltan Varju
 
Sorok között olvasni
Sorok között olvasniSorok között olvasni
Sorok között olvasniZoltan Varju
 
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...Zoltan Varju
 
Rasztik Zita: A стартовать jövevényszó fejlődési útja
Rasztik Zita: A стартовать jövevényszó fejlődési útjaRasztik Zita: A стартовать jövevényszó fejlődési útja
Rasztik Zita: A стартовать jövevényszó fejlődési útjaZoltan Varju
 
Kontextus és a hivatkozások ereje
Kontextus és a hivatkozások erejeKontextus és a hivatkozások ereje
Kontextus és a hivatkozások erejeZoltan Varju
 
Simon Eszter: Silver standard korpuszok tulajdonnév-felismeréshez
Simon Eszter: Silver standard korpuszok tulajdonnév-felismeréshezSimon Eszter: Silver standard korpuszok tulajdonnév-felismeréshez
Simon Eszter: Silver standard korpuszok tulajdonnév-felismeréshezZoltan Varju
 
Vincze Veronika: Korpuszok az információkinyerésben
Vincze Veronika: Korpuszok az információkinyerésben Vincze Veronika: Korpuszok az információkinyerésben
Vincze Veronika: Korpuszok az információkinyerésben Zoltan Varju
 

More from Zoltan Varju (20)

NLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Bódogh Attila: xdroidNLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Bódogh Attila: xdroid
 
NLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
NLP meetup 2016.10.05 - Szabó Martina Katalin: PrecognoxNLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
NLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
 
NLP meetup 2016.10.05 - Szekeres Péter: Neticle
NLP meetup 2016.10.05 - Szekeres Péter: NeticleNLP meetup 2016.10.05 - Szekeres Péter: Neticle
NLP meetup 2016.10.05 - Szekeres Péter: Neticle
 
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzéseBalogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
 
Babak Rasolzadeh: The importance of entities
Babak Rasolzadeh: The importance of entitiesBabak Rasolzadeh: The importance of entities
Babak Rasolzadeh: The importance of entities
 
Szövegbányászat a gyakorlatban
Szövegbányászat a gyakorlatbanSzövegbányászat a gyakorlatban
Szövegbányászat a gyakorlatban
 
Szövegbányászat
SzövegbányászatSzövegbányászat
Szövegbányászat
 
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
 
Kisvilágunk, a nyelv
Kisvilágunk, a nyelvKisvilágunk, a nyelv
Kisvilágunk, a nyelv
 
Balogh Kitti - Szűcs Krisztina: Képes beszéd
Balogh Kitti - Szűcs Krisztina: Képes beszédBalogh Kitti - Szűcs Krisztina: Képes beszéd
Balogh Kitti - Szűcs Krisztina: Képes beszéd
 
Érzelmek hálójában – hálózat- és tartalomelemzés
Érzelmek hálójában – hálózat- és tartalomelemzésÉrzelmek hálójában – hálózat- és tartalomelemzés
Érzelmek hálójában – hálózat- és tartalomelemzés
 
Szabó - Varjú: Automatikus értékelés- és érzelemelemzés magyar nyelvű szöveg...
Szabó - Varjú: Automatikus  értékelés- és érzelemelemzés magyar nyelvű szöveg...Szabó - Varjú: Automatikus  értékelés- és érzelemelemzés magyar nyelvű szöveg...
Szabó - Varjú: Automatikus értékelés- és érzelemelemzés magyar nyelvű szöveg...
 
Mókus (Koncsik Anita, Varjú Zoltán)
Mókus (Koncsik Anita, Varjú Zoltán)Mókus (Koncsik Anita, Varjú Zoltán)
Mókus (Koncsik Anita, Varjú Zoltán)
 
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
 
Sorok között olvasni
Sorok között olvasniSorok között olvasni
Sorok között olvasni
 
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
 
Rasztik Zita: A стартовать jövevényszó fejlődési útja
Rasztik Zita: A стартовать jövevényszó fejlődési útjaRasztik Zita: A стартовать jövevényszó fejlődési útja
Rasztik Zita: A стартовать jövevényszó fejlődési útja
 
Kontextus és a hivatkozások ereje
Kontextus és a hivatkozások erejeKontextus és a hivatkozások ereje
Kontextus és a hivatkozások ereje
 
Simon Eszter: Silver standard korpuszok tulajdonnév-felismeréshez
Simon Eszter: Silver standard korpuszok tulajdonnév-felismeréshezSimon Eszter: Silver standard korpuszok tulajdonnév-felismeréshez
Simon Eszter: Silver standard korpuszok tulajdonnév-felismeréshez
 
Vincze Veronika: Korpuszok az információkinyerésben
Vincze Veronika: Korpuszok az információkinyerésben Vincze Veronika: Korpuszok az információkinyerésben
Vincze Veronika: Korpuszok az információkinyerésben
 

Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések

  • 1. {Politika a sorok között} Politikai témájú szövegelemzések 2015.11.16., Politikai kommunikáció Balogh Kitti – statisztikus, adatelemző, Precognox
  • 2. {Tartalom} » Szövegbányászat, tartalom-, diskurzuselemzés » Politikai szövegelemzés példák: » Főpolgármester-választással kapcsolatos tweetek elemzése predikciós céllal » Romák médiareprezentációja egy szélsőjobboldali hírportálon » A magyar politikai blogszféra az érzelmek hálójában
  • 3. {Szövegbányászat} » Szöveges elektronikus adatok feldolgozása és elemzése » Adatok közötti eligazodás, keresés, rejtett összefüggések feltárása, kinyerése » Egyre növekvő elektronikus adatmennyiség kb. 85% strukturálatlan adat (pl. emailek, hírek, weboldalak, közösségi média tartalmak)
  • 4. {Hagyományos szövegelemzés} » Tartalomelemzés » Szavak, nyelvi kategóriák gyakorisága, együttes megjelenése » Kvantitatív elemzés » Diskurzuselemzés » Több megközelítés, pl. narratívaelemzés (Propp), konverzációelemzés (Goffman, Garfinkel), kritikai diskurzuselemzés (van Dijk, Wodak, Fairclough) » A szöveg formai, tartalmi elemzésével társadalmi, kulturális, politikai összefüggések feltárása » Hagyományosan kvalitatív
  • 5. {Szövegbányászat és hagyományos szövegelemzés} » Szövegbányászat vs. hagyományos szövegelemzés » Nagy mennyiségű szöveg vs. kis mennyiségű szöveg » Automatikus vs. sok emberi erőforrást, időt igénylő » Szubjektivitás csökkentése vs. szubjektivitás veszélye » Reprodukálhatóság javítása vs. Reprodukálhatóság nehézsége/lehetetlensége
  • 6. {Főpolgármester-választás előrejelzése} » Módszertan » Főpolgármester-jelöltek neveit tartalmazó tweetek leszedése » R twitteR package » 462 tweet » választás előtti este (2014.10.11.) » Tweetek szentiment- és emócióelemzése » Szentiment- és emóciószótárak » Gyakoriságok elemzése » Relatív gyakoriságok szentimentenként, emóciónként » Összehasonlítás közvélemény-kutatási adatokkal, majd az eredménnyel
  • 7. {Főpolgármester-választás előrejelzése} » Elmélet » DiGrazia, McKelevy, Bollen és Rojas (2010): More Tweets, More Votes: Social Media as a Quantitative Indicator of Political Behavior » Szentiment- és emócióelemzés » Szövegek által közvetített vélemények, attitűdök, érzések detektálása pl. termékekkel, személyekkel, eseményekkel, témákkal kapcsolatban » Szentiment: ált. 3 (negatív, semleges, pozitív) vagy 5 (nagyon negatív, negatív, semleges, pozitív, nagyon pozitív) kategória » Emóció: ált. 6 alapérzelem (bánat, düh, undor, félelem, meglepődés, öröm) » Pollyanna-hipotézis vs. negatív: több info
  • 8. {Főpolgármester-választás előrejelzése} » Elemzés Tweetek gyakorisága emóció szerint Tarlós Bokros Staudt Csárdi Bodnár Össz. Düh 164 133 7 13 15 332 Szomorúság 6 6 1 1 1 15 Öröm 9 9 1 2 1 22 Félelem 1 0 0 0 0 1 Meglepődás 0 1 0 0 0 1 Undor 0 0 0 0 0 0 Ismeretlen 30 52 1 6 2 91 Össz. 210 201 10 22 19 462
  • 9. {Főpolgármester-választás előrejelzése} Tweetek gyakorisága szentiment szerint Tarlós Bokros Staudt Csárdi Bodnár Össz. Semleges 149 146 6 16 14 331 Pozitív 26 33 3 3 4 69 Negatív 35 22 1 3 1 62 Össz. 210 201 10 22 19 462
  • 10. {Főpolgármester-választás előrejelzése} Eredmények Nézőpont, 2014.10.6-8., biztos szav. (n=500) Minden Düh Szom. Öröm Seml. Poz. Neg. Tarlós 49,06% 52% 45,45% 49,40% 40,00% 40,91% 45,02% 37,68% 56,45% Bokros 36,04% 25% 43,51% 40,06% 40,00% 40,91% 44,11% 47,83% 35,48% Staudt 7,10% 6% 2,16% 2,11% 6,67% 4,55% 1,81% 4,35% 1,61% Csárdi 5,69% 6% 4,76% 3,92% 6,67% 9,09% 4,83% 4,35% 4,84% Bodnár 2,10% 1% 4,11% 4,52% 6,67% 4,55% 4,23% 5,80% 1,61%
  • 11. {Főpolgármester-választás előrejelzése} Tarlós Istvánt ill. Bokros Lajost említő tweetek emóciós szófelhői
  • 12. {A kuruc.info romaellenes témái} » Módszertan » „Cigánybűnözés” rovat cikkeinek begyűjtése, feldolgozása » 10.304 cikk » Időszak: 2006-2015. február » Cikkekhez tartozó időbélyeg » Cikkek témáinak kinyerése » Látens Dirichlet allokáció (LDA) » Input: dokumentumok szavai, témák száma » Output: dokumentumok témaeloszlása, témák szóeloszlása » Kapott témák összevetése a szakirodalommal és kiértékelés » Témák időbeli változásának vizualizációja
  • 13. {A kuruc.info romaellenes témái} »Elmélet » Romareprezentációs kutatások a magyar írott médiában » Bogdán – Feischmidt - Guld (2010): „Csak másban”. Romareprezentáció a magyar médiában » Kriza – Vidra (2010): A többség fogságában – kisebbségek médiareprezentációja » Munk (2013): A romák reprezentációja a többségi média híreiben az 1960-as évektől napjainkig » Bernáth – Messing (1998, 2003, 2012) » Témák számának meghatározása Bernáth és Messing (2012) témastruktúrája + mat-i optimalizálás alapján: 27 téma
  • 14. {A kuruc.info romaellenes témái} » Minden téma megtalálható, kivéve: » Jogvédelem, kisebbségi jogok » Gazdaság, vállalkozás » Természeti katasztrófák » Differenciáltabb témafelosztás: » Bűnözés » Politika, közpolitika » Diszkrimináció, előítéletek » Külföldi romák » Külpolitika, EU » Kivándorlás » Kiértékelés » 600 cikk humán annotálása, 74%-os recall, 55% precesion » Összevetés a szakirodalmi témastruktúrával, kiértékelés
  • 15. {A kuruc.info romaellenes témái} » Témák időbeli változásának vizualizációja » 27 téma, nehéz áttekinthetőség » Szűcs Krisztina - tervezőgrafikus, data visualization designer, krisztinaszucs.com » Interaktív adatvizualizáció » Elérhető: labs.precognox.com/kurucinfo_adatviz/
  • 16. {A kuruc.info romaellenes témái} » Eredeti idősorok 1-9. téma:
  • 20. {A magyar politikai blogszféra} » Módszertan » Magyar politikai blogok összegyűjtése » Kb. 70 politikai blog » Szövegek begyűjtése » Összegyűjtött listából kiindulva » Szövegekben lévő linkeken továbbhaladva weboldalak hálózata » Csúcs: weboldal, él: link » 12.121 db egyedi url, 22.542 él » Hálózat normalizálása, tisztítása » 1.441 db csomópont (pay-level url), 2.472 él » Oldalakhoz kötődő szövegek emócióelemzése
  • 21. {A magyar politikai blogszféra} » Elmélet » Hálózatelemzés » Barabási Albert-László: Behálózva » Gráfelmélet » Kolaczyk – Csárdi: Statistical Analysis of Network Data with R » Emóció-, szentimentelemzés » Bing, Liu: Sentiment Analysis and Opinion Mining
  • 22. {A magyar politikai blogszféra} » Csúcsok közötti átlagos úthossz: 3.342 » Átmérő: 9 » Kép: csúcsméret PageRank szerint
  • 23. {A magyar politikai blogszféra}
  • 24. {A magyar politikai blogszféra}
  • 25. {A magyar politikai blogszféra}
  • 26. {A magyar politikai blogszféra} » Bánat
  • 27. {A magyar politikai blogszféra} » Düh
  • 28. {A magyar politikai blogszféra} » Félelem
  • 29. {A magyar politikai blogszféra} » Meglepődés
  • 30. {A magyar politikai blogszféra} » Öröm
  • 31. {A magyar politikai blogszféra} » Undor
  • 32. {A magyar politikai blogszféra} » További tervek » Gyűlöletbeszéd terjedése a hálózatban » Csomópontok csoportosítása, visszaadja-e a politikai blokkokat, csoportokat » Bizonyos témák vizsgálata szentiment-, ill. emócióelemzéssel
  • 33. {Köszönöm szépen a figyelmet!}