Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.
Social Network Analysis: una
herramienta para desenmascarar
falsedades en Twitter
Mariluz Congosto (@congosto)
11/04/2019
Los españoles y los mundos virtuales
Fuente: CIS, POSTELECTORAL ELECCIONES GENERALES 2016 VARIABLES SOCIODEMOGRÁFICAS
http...
Entorno de Twitter: Penetración social
Fuente: CIS, POSTELECTORAL ELECCIONES GENERALES 2016 VARIABLES SOCIODEMOGRÁFICAS
ht...
Twitter vs. Facebook
11/042019
Twitter de lo local a lo global
5
#HT RT
TT
TV Prensa
11/042019
Entorno de Twitter
Los mensajes son públicos
Sus usuarios son más sensibles a los temas
sociales que en otros medios on-li...
PROPAGACIONES
11/042019
Conexiones
11/042019
= cámaras de eco
11/042019
Revelan estructuras internas de partido
10
Panel t-hoarder del 38 congreso del PSOE (2012)
38º congreso del PSOE
11/042019
Cómo participamos en las elecciones
27S-2015 Catalanas
http://t-hoarder.com/27S/11/042019
La reacción ante las campañas
https://twitter.com/congosto/status/921305942930722816
11/042019
Campañas de mujeres
Campaña para denunciar agresiones sexuales #cuéntalo
41,57% 16,93%, 41,50%
?
11/042019
RUIDO EN LA RED
11/042019
Del bot 1.0 al bot 2.0
• Del bot automático que tuiteaba en horario
continuo y a ráfagas sin disimular su
automatismo, al ...
El negocio de los falsos perfiles
https://www.nytimes.com/interactive/2018/01/27/technology/social-media-bots.html
11/0420...
Manipulación
11/042019
Propagación Crispación
Trollsbots
No es un fenómeno nuevo
11/042019
Metodología Ferrara
11/042019
Metodología Ferrara
11/042019
Investigaciones
11/042019
https://botometer.iuni.iu.edu/#!/
METODOLOGÍA DE ANÁLISIS
11/042019
1
1. DATOS
3
VISUALIZAR
2
PROCESADO
DATOS Y PROCESADO
11/042019
Máquina Virtual
Los datos están compartidos con la máquina anfitrión
Contraseña: cambiala
https://www.dropbox.com/s/j0p26b...
Entorno de trabajo Webscraping
https://github.com/congosto/GetOldTweets-python
Carpeta
compartida
11/042019
Abrir script y usar opciones
La carpeta
que hemos
creado
11/042019
Entorno de trabajo API
https://github.com/congosto/t-hoarder_kit
Carpeta
compartida
11/042019
Datos de contexto
App para acceder -> taller_datos.key
Usuario: cada uno el suyo
Experimento: directorio donde se dejarán ...
Abrir script y usar opciones
API
11/042019
Crear un token de usuario para
autentificar
Copiar
Pegar copiar
11/042019
Información de usuarios
• Abrir el editor pluma
• Escribir la lista de usuarios,
uno por línea
• Guardarlo en el directori...
Obtener tuits mediante consulta
11/042019
Obtener tuits en tiempo real
11/042019
Obtener relaciones
Con teoría de grafos, que modela:
• Individuos como nodos
• Relaciones como aristas
Un grafo es una abs...
Obtener relaciones
Relaciones declaradas
A BA sigue a B
A es seguido por B
A y B se siguen
mutuamente
Relaciones dinámicas...
Obtener relaciones declaradas
11/042019
Obtener relaciones dinámicas
11/042019
Limitaciones de la API
La frecuencia importa: el efecto meseta
API streaming
http://t-hoarder.com/7DElDebateDecisivo/
#7DE...
Limitaciones
El tiempo importa Ahora
Streaming API
REST API (search)
REST API (3500 últimos tuits)
Genip
Histórico 1 seman...
VISUALIZACIÓN
11/042019
Herramientas
11/042019
Tableau Public: Timelines y
distribución de variables
Uso Personalización
Orientado a publicación en Web
Pero válido para ...
Componentes de Tableau Public
11/042019
Menú
Gráfica
Tipos
De
gráficaDatos Ajustes
Filtros
Similar a las tablas dinámicas ...
Funcionamiento de Tableau Public
Datos
Arrastrar
11/042019
Graficas de Tableau Public
Tipos de gráfica
Gráfica
Seleccionar
11/042019
Personalización de Tableau Public
Arrastrar
11/042019
Gephi: análisis de grafos
11/042019
- Calcula los parámetros globales
de la red y de los nodos
- Permite filtrar nodos o c...
Entrada de datos a Gephi
11/042019
Formato gdf
nodedef>name VARCHAR,label VARCHAR, Attrb1,VARCHAR,
Attb2 VARCHAR…
s1,name_node_1, Attrib1, Attrib2,…
s2, name...
Interfaz gráfica
Apariencia:
(tamaño y color)
forma
Cálculo
de red y
filtrado
Zona de
trabajo
11/042019
Abrimos con gephi el grafo
11/042019
Nos muestra los nodos y enlaces que
tiene
11/042019
Filtramos la componente Gigante
11/042019
Quitamos nodos no conectados
Calculamos parámetros de red
11/042019
Modularidad, grado con pesos
Damos color por modularidad
11/042019
Damos tamaño por grado de entrada
con pesos
11/042019
Damos forma con un algoritmo de
pesos
11/042019
Force-Altas, ajustando las fuerzas de
atracción y repulsión
Aplicamos “no overlap”
11/042019
Evitar que se solapen los nodos
Ponemos los parámetros de pre-
visualización
11/042019
Borde del nodo
Poner etiquetas y dimensionar tamaño de letras
Poner...
Visualizamos el grafo
11/042019
Salvamos los datos de red
11/042019
Salvamos el grafo
11/042019
CASOS DE ESTUDIO
11/042019
Falso perfil @anonymus_ES
11/042019
https://twitter.com/congosto/status/1057694234201837568
Falso perfil @anonymus_ES
11/042019
Falso perfil @duplamaria
11/042019
Falso perfil @duplamaria
11/042019
Falso perfil @duplamaria
11/042019
Falso perfil @duplamaria
11/042019
https://twitter.com/congosto/status/1106589757759520770
El bulo de #CurroDuermeEnCasa
11/042019
https://twitter.com/congosto/status/1077973674618171393
El bulo de #CurroDuermeEnCasa
11/042019
Propagación de un bulo xenófobo
11/042019
https://twitter.com/congosto/status/1075109938421252096
Propagación de un bulo xenófobo
11/042019
Resumen
11/042019
1. Las redes sociales son una fuente imperfecta pero
continua de información
2. Podemos estudiar la prop...
Gracias por vuestra atención
11/042019
Contacto:
http://twitter.com/congosto
http://www.linkedin.com/in/congosto
Experimen...
Nächste SlideShare
Wird geladen in …5
×

Mariluz Congosto (2019). Social network analysis: una herramienta para desenmascarar falsedades en Twitter

70 Aufrufe

Veröffentlicht am

Se describen los patrones de comportamiento en el uso y la interacción con las redes sociales (Twitter, en especial), destacó la tendencia actual a consumir y distribuir los mensajes con los que estamos de acuerdo e hizo referencia a los problemas de Twitter derivados de la existencia de prácticas deshonestas (bots, perfiles y seguidores falsos, etc.). Posteriormente, detalló los programas informáticos que utiliza para descargar los datos de Twitter y visualizar las relaciones que existen entre los usuarios y lo acompañó de varios ejemplos que muestran los flujos de mensajes y algunas anomalías que le sirven para detectar los perfiles artificiales.

Veröffentlicht in: Internet
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Mariluz Congosto (2019). Social network analysis: una herramienta para desenmascarar falsedades en Twitter

  1. 1. Social Network Analysis: una herramienta para desenmascarar falsedades en Twitter Mariluz Congosto (@congosto) 11/04/2019
  2. 2. Los españoles y los mundos virtuales Fuente: CIS, POSTELECTORAL ELECCIONES GENERALES 2016 VARIABLES SOCIODEMOGRÁFICAS http://datos.cis.es/pdf/Es3145sd_A.pdf Sobre el 67,8% que accedió a Internet en los últimos tres meses 91,2 87,7 80 68,3 55,3 46,8 51,9 38 23,3 17,1 15,2 10,6 54,5 29,9 17,3 10,3 7,1 5,10 20 40 60 80 100 18-24 25-34 35-44 45-54 55-64 65 o más Usuarios según edad Facebook Twitter Instagram Ninguna Otras_redes_sociales LinkedIn 11/042019
  3. 3. Entorno de Twitter: Penetración social Fuente: CIS, POSTELECTORAL ELECCIONES GENERALES 2016 VARIABLES SOCIODEMOGRÁFICAS http://datos.cis.es/pdf/Es3145sd_A.pdf Sobre el 67,8% que accedió a Internet en los últimos tres meses 2016 91,2 87,7 80 68,3 55,3 46,851,9 38 23,3 17,1 15,2 10,6 0 10 20 30 40 50 60 70 80 90 100 18-24 25-34 35-44 45-54 55-64 65 o más Usuarios según edad Facebook Twitter 11/042019 26,1%
  4. 4. Twitter vs. Facebook 11/042019
  5. 5. Twitter de lo local a lo global 5 #HT RT TT TV Prensa 11/042019
  6. 6. Entorno de Twitter Los mensajes son públicos Sus usuarios son más sensibles a los temas sociales que en otros medios on-line (Bernal 2013) Es un medio utilizado para la política Es una fuente para conocer la opinión pública (Congosto 2014) 11/042019
  7. 7. PROPAGACIONES 11/042019
  8. 8. Conexiones 11/042019
  9. 9. = cámaras de eco 11/042019
  10. 10. Revelan estructuras internas de partido 10 Panel t-hoarder del 38 congreso del PSOE (2012) 38º congreso del PSOE 11/042019
  11. 11. Cómo participamos en las elecciones 27S-2015 Catalanas http://t-hoarder.com/27S/11/042019
  12. 12. La reacción ante las campañas https://twitter.com/congosto/status/921305942930722816 11/042019
  13. 13. Campañas de mujeres Campaña para denunciar agresiones sexuales #cuéntalo 41,57% 16,93%, 41,50% ? 11/042019
  14. 14. RUIDO EN LA RED 11/042019
  15. 15. Del bot 1.0 al bot 2.0 • Del bot automático que tuiteaba en horario continuo y a ráfagas sin disimular su automatismo, al bot que simula ser una persona (perfiles falsos, cyborgs o Sybils ) • La comercialización de servicios de “perfiles falsos” tras los que hay personas, lo que dificulta su detección. Hay dinero para innovar y mutar 11/042019
  16. 16. El negocio de los falsos perfiles https://www.nytimes.com/interactive/2018/01/27/technology/social-media-bots.html 11/042019
  17. 17. Manipulación 11/042019 Propagación Crispación Trollsbots
  18. 18. No es un fenómeno nuevo 11/042019
  19. 19. Metodología Ferrara 11/042019
  20. 20. Metodología Ferrara 11/042019
  21. 21. Investigaciones 11/042019 https://botometer.iuni.iu.edu/#!/
  22. 22. METODOLOGÍA DE ANÁLISIS 11/042019 1 1. DATOS 3 VISUALIZAR 2 PROCESADO
  23. 23. DATOS Y PROCESADO 11/042019
  24. 24. Máquina Virtual Los datos están compartidos con la máquina anfitrión Contraseña: cambiala https://www.dropbox.com/s/j0p26bmgmct3vll/como_instalar_VM_taller_datos_twitter.pdf?dl=0 11/042019
  25. 25. Entorno de trabajo Webscraping https://github.com/congosto/GetOldTweets-python Carpeta compartida 11/042019
  26. 26. Abrir script y usar opciones La carpeta que hemos creado 11/042019
  27. 27. Entorno de trabajo API https://github.com/congosto/t-hoarder_kit Carpeta compartida 11/042019
  28. 28. Datos de contexto App para acceder -> taller_datos.key Usuario: cada uno el suyo Experimento: directorio donde se dejarán los datos Se introduce al principio y todos las peticiones utilizarán ese contexto 11/042019
  29. 29. Abrir script y usar opciones API 11/042019
  30. 30. Crear un token de usuario para autentificar Copiar Pegar copiar 11/042019
  31. 31. Información de usuarios • Abrir el editor pluma • Escribir la lista de usuarios, uno por línea • Guardarlo en el directorio del experimento • Ponerle al fichero extensión txt 11/042019
  32. 32. Obtener tuits mediante consulta 11/042019
  33. 33. Obtener tuits en tiempo real 11/042019
  34. 34. Obtener relaciones Con teoría de grafos, que modela: • Individuos como nodos • Relaciones como aristas Un grafo es una abstracción que representa una red, donde: • Un conjunto de nodos o vértices está conectado mediante aristas o enlaces 11/042019
  35. 35. Obtener relaciones Relaciones declaradas A BA sigue a B A es seguido por B A y B se siguen mutuamente Relaciones dinámicas A retuitea a B A es retuiteado por B A y B se retuitean mutuamente A B A B A B A B A B 11/042019
  36. 36. Obtener relaciones declaradas 11/042019
  37. 37. Obtener relaciones dinámicas 11/042019
  38. 38. Limitaciones de la API La frecuencia importa: el efecto meseta API streaming http://t-hoarder.com/7DElDebateDecisivo/ #7DEldebateDecisivo API REST 11/042019
  39. 39. Limitaciones El tiempo importa Ahora Streaming API REST API (search) REST API (3500 últimos tuits) Genip Histórico 1 semana 11/042019
  40. 40. VISUALIZACIÓN 11/042019
  41. 41. Herramientas 11/042019
  42. 42. Tableau Public: Timelines y distribución de variables Uso Personalización Orientado a publicación en Web Pero válido para publicaciones estáticas 11/042019
  43. 43. Componentes de Tableau Public 11/042019 Menú Gráfica Tipos De gráficaDatos Ajustes Filtros Similar a las tablas dinámicas de Excel, pero mejor visualización
  44. 44. Funcionamiento de Tableau Public Datos Arrastrar 11/042019
  45. 45. Graficas de Tableau Public Tipos de gráfica Gráfica Seleccionar 11/042019
  46. 46. Personalización de Tableau Public Arrastrar 11/042019
  47. 47. Gephi: análisis de grafos 11/042019 - Calcula los parámetros globales de la red y de los nodos - Permite filtrar nodos o conexiones - Calcula la modularidad (comunidades) - Da forma con distintos layouts - Modela los nodos en tamaño y color según unos atributos - Renderiza el grafo generando salida en pdf, png y svg
  48. 48. Entrada de datos a Gephi 11/042019
  49. 49. Formato gdf nodedef>name VARCHAR,label VARCHAR, Attrb1,VARCHAR, Attb2 VARCHAR… s1,name_node_1, Attrib1, Attrib2,… s2, name_node_2, Attrib1, Attrib2,… s3, name_node_3, Attrib1, Attrib2,… edgedef>node1 VARCHAR,node2 VARCHAR, Attrb1,VARCHAR, Attb2 VARCHAR… s1,s2,attrb1,attrib2,.. s2,s3,attrb1,attrib2 s3,s2,attrb1,attrib2 s3,s1,attrb1,attrib2 11/042019
  50. 50. Interfaz gráfica Apariencia: (tamaño y color) forma Cálculo de red y filtrado Zona de trabajo 11/042019
  51. 51. Abrimos con gephi el grafo 11/042019
  52. 52. Nos muestra los nodos y enlaces que tiene 11/042019
  53. 53. Filtramos la componente Gigante 11/042019 Quitamos nodos no conectados
  54. 54. Calculamos parámetros de red 11/042019 Modularidad, grado con pesos
  55. 55. Damos color por modularidad 11/042019
  56. 56. Damos tamaño por grado de entrada con pesos 11/042019
  57. 57. Damos forma con un algoritmo de pesos 11/042019 Force-Altas, ajustando las fuerzas de atracción y repulsión
  58. 58. Aplicamos “no overlap” 11/042019 Evitar que se solapen los nodos
  59. 59. Ponemos los parámetros de pre- visualización 11/042019 Borde del nodo Poner etiquetas y dimensionar tamaño de letras Poner color de los arcos
  60. 60. Visualizamos el grafo 11/042019
  61. 61. Salvamos los datos de red 11/042019
  62. 62. Salvamos el grafo 11/042019
  63. 63. CASOS DE ESTUDIO 11/042019
  64. 64. Falso perfil @anonymus_ES 11/042019 https://twitter.com/congosto/status/1057694234201837568
  65. 65. Falso perfil @anonymus_ES 11/042019
  66. 66. Falso perfil @duplamaria 11/042019
  67. 67. Falso perfil @duplamaria 11/042019
  68. 68. Falso perfil @duplamaria 11/042019
  69. 69. Falso perfil @duplamaria 11/042019 https://twitter.com/congosto/status/1106589757759520770
  70. 70. El bulo de #CurroDuermeEnCasa 11/042019 https://twitter.com/congosto/status/1077973674618171393
  71. 71. El bulo de #CurroDuermeEnCasa 11/042019
  72. 72. Propagación de un bulo xenófobo 11/042019 https://twitter.com/congosto/status/1075109938421252096
  73. 73. Propagación de un bulo xenófobo 11/042019
  74. 74. Resumen 11/042019 1. Las redes sociales son una fuente imperfecta pero continua de información 2. Podemos estudiar la propagación tanto desde el punto de vista temporal como de red 3. Las relaciones nos definen mejor que los contenidos. Somos endogámicos y difundimos lo que estamos de acuerdo. Con el análisis de red se pueden clasificar a los perfiles con bastante precisión 4. El ruido en Twitter está creciendo y sofisticándose. Esto perturba el estudio de las propagaciones, pero también es posible determinar patrones que lo identifiquen mediante el análisis de red
  75. 75. Gracias por vuestra atención 11/042019 Contacto: http://twitter.com/congosto http://www.linkedin.com/in/congosto Experimentos: Barriblog.com T-hoarder.com http://www.slideshare.net/mlcm https://github.com/congosto

×