Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.

WordSuite: como identificar cyborgs no Twitter

667 Aufrufe

Veröffentlicht am

Slides apresentados no #CodaBR, no dia 25 de novembro de 2017.

Veröffentlicht in: Internet
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

WordSuite: como identificar cyborgs no Twitter

  1. 1. Carga viral desinformativa: léxicos e comportamento estruturais Fábio Malini LABIC | UFES http://labic.net fabiomalini@gmail.com twitter: @fabiomalini  
  2. 2. a url pesquisa visual com os anúncios. Todo anúncio é uma imagem. Possui um tamanho padrão. Coletar (scraping) anúncios em sites e revelar quem patrocina a desinformação (fake news).   Frentes novas de pesquisa do labic
  3. 3. a rede de bots e fake news comportamento estrutural na distribuição de links maliciosos. A rede distribuição da desinformação é mais fragmentada. Contudo, na política, a distribuição passa por clusters (grupos de convertidos que se replicam).  
  4. 4. os cyborgs pesquisa de léxico político repetitivo. Bots possuem comportamentos relativamente simples de identificar. Já cyborgs demandam análise lexical. Cyborgs (nova classe de bots) possuem universo lexical empobrecido. Humanos variam mais o seu universo vocabular.  
  5. 5. Criamos no Labic um script chamado “Word Suite”. O  Foco  é  encontrar   quais  são  as  palavras   mais  frequentes  em   blocos  de  tweets  (que   podem  ser  semanais,   mensais,  diários  etc)   o  que  resulta  disso?     Uma  Linha  do  tempo   das  palavras  mais   frequentemente   uAlizados  por  um   perfil,  por  exemplo.    
  6. 6. WordSuite  de  perfil  @silva_marina.   Legenda:   Eixo  y:  frequência  da  palavra  em  100  tweets.   Eixo  x:  sequência  de  13  blocos  de  100  tweets  (ou  seja,  coletei  úlDmos  1300  tweets  de   Marina  Silva  no  TwiHer).    
  7. 7. WordSuite  de  perfil  @Lulapelobrasil.   Legenda:   Eixo  y:  frequência  da  palavra  em  100  tweets.   Eixo  x:  sequência  de  33  blocos  de  100  tweets  (ou  seja,  coletei  úlDmos  3300  tweets  de  Lula   da  Silva  no  TwiHer).    
  8. 8. wordSuite  de  perfil  @jairbolsonaro   Legenda:   Eixo  y:  frequência  da  palavra  em  100  tweets.   Eixo  x:  sequência  de  33  blocos  de  100  tweets  (ou  seja,  coletei  úlDmos  3300  tweets  de  Jair   Bolsonaro  no  TwiHer).  
  9. 9. O “Word Suite” pode também demonstrar o fluxo de agendamento de um perfil. Podemos  separar  X   palavras  mais   frequentes  em  cada   bloco  de  x  tweets.     Por  x,  entende-­‐se  o   número  determinado   pelo  pesquisador.       o  que  resulta  disso?     Os  tópicos  de   discussão  variam   semana  a  semana,  o   que  é  algo  muito   caracterísAco  dos   humanos  e  perfis   insAtucionais.    
  10. 10. Variação lexical de perfis institucional. Ex: @mblivre Do  bloco  de  100  tweets  mais   atuais  para  os  mais  anDgos.  
  11. 11. #WordSuite dos último 4 blocos de 100 tweets do perfil cyborg @helena70942303 Reparem  a  baixa  variação  lexical  –  marca  dos  cyborgs  
  12. 12. datasets: http://bit.ly/2k1XJbf

×