SlideShare ist ein Scribd-Unternehmen logo
1 von 13
Downloaden Sie, um offline zu lesen
BIG DATA: Extraer y visualizar grandes volúmenes de datos



                        Visualizaciones en tiempo real
                                 sobre Twitter
                              Fernando Zunino                  Pauline Morrison Fell
                              @fzunino                         @polinmf


Thursday, June 21, 12
Acerca de Zauber
                        •    Somos una boutique de software y lab con base en Argentina y
                             Estados Unidos que provee servicios a una alta gama de líderes
                             de la industria y startups de internet en América Latina y Silicon
                             Valley.

                        •    Nos especializamos en proyectos de Consumer Web, Social
                             Analytics y Big Data. Combinamos nuestros servicios de
                             desarrollo boutique con un laboratorio de I+D para desarrollar
                             nuevos emprendimientos y productos.



                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Nuestra experiencia con Twitter APIs


     Al Jazeera - Twitter Dashboard                        CABA - Elecciones legislativas 2011          JSConfAr - Visualizing Tweets




     Coca Cola - Social World Cup                          La Nacion - Elecciones presidenciales 2011   Zauberlabs - Tweet Discover



                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Análisis de
                                                                                     audiencias
                                                                                       online

                             Value insights on social audiences and conversations

         Plataforma online que:
              •         Procesa social media data a gran escala para entregar
                        reportes en tiempo real

              •         Identifica patrones demográficos y de comportamiento
                        de seguidores y conversaciones en Twitter

              •         Usa ML y NLP para entregar perfiles sociales aumentados
                        con información nueva respecto de APIs existentes o
                        perfiles de usuarios.
         Diseñada para:
              •         Investigación de mercado online
              •         Monitoreo de marcas en tiempo real
              •         ROI en Social Media
              •         Estrategias en Social Media



                         Visualizaciones en tiempo real sobre Twitter
                         Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Visualizacio-
                                                                                     nes animadas
                                                                                      de Twitter

                          Build your own Twitter real-time visualizations

        Plataforma online que permite:

              •         Construir infografías animadas sobre temas
                        en Twitter

              •         Enriquecer noticias con contenido social

              •         Ofrecer una segunda pantalla para un programa de TV

              •         Aumentar la participación en un evento

              •         Cubrir el buzz en eventos grandes o internacionales

         Diseñada para:

              •         Periodistas, Bloggers, Directores de Contenido,
                        Marketeers, Organizadores de Eventos, Emisoras



                         Visualizaciones en tiempo real sobre Twitter
                         Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Cómo lo construimos
      FRONTEND                                                                       BACKEND

                                                                                                     Storm

                                                                                                               Oozie



      INFRAESTRUCTURA                                                                TWITTER API


                                                                                                   Rest API
                             ELB, EC2, S3                                                           Streaming API
                         Elastic Map Reduce
                        Route53, CloudWatch




                         Visualizaciones en tiempo real sobre Twitter
                         Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Desafíos tecnológicos

                        •    Límites API Twitter

                        •    Big Data

                        •    Manejo de datos no estructurados

                        •    Inferencia de atributos ocultos




                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Límites API Twitter

                        •    Rest API limitada a 350 requests por ahora por IP

                        •    Streaming API (statuses/filter) está limitada si tweets exceden el
                             1% del Firehose
                            •    Partners de Twitter (Gnip, DataSift) pueden ser una opción para
                                 obtener un acceso mayor




                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Big Data
                            •    Twitter en #
                                     •    400M tweets por dia (http://www.theverge.com/
                                          2012/6/6/3069424/twitter-400-million-total-daily-tweets)
                                     •    140M usuarios activos (http://blog.twitter.com/2012/03/twitter-
                                          turns-six.html)

                            •    Generación de estadísticas en tiempo real
                                     •    Stream Processing => Storm

                            •    Generación de estadísticas sobre los usuarios
                                     •    Batch Processing => Hadoop (Map Reduce, Pig)


                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Manejo de datos no estructurados
                           •    Ubicación

                               •     5% de tweets utilizan GeoLocation API

                               •     72% Ingresan datos de ubicación en forma no
                                     estructurada

                               •     Utilizamos técnicas de NLP e Information Retrieval
                                     para detectar ubicación




                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Inferencia de atributos ocultos
                                •     Datos demográficos de usuarios no están presentes

                                       •     Tipo de Usuario

                                           •    Hombre/Mujer/Compañia

                                       •     Rango etario

                                •     Machine Learning al rescate!

                                       •     Se utilizan técnicas de aprendizaje supervisado para
                                             detectar dichos atributos


                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Demos


                 Rio+20                                                             Malvinas




                  Boca vs Universidad de Chile                                      Elecciones en Mexico

                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12
Gracias!




                                                             Preguntas?
                        Visualizaciones en tiempo real sobre Twitter
                        Big Data: Extraer y visualizar grandes volúmenes de datos
Thursday, June 21, 12

Weitere ähnliche Inhalte

Andere mochten auch

¿Qué Es El Método Científico?
¿Qué Es El Método Científico?¿Qué Es El Método Científico?
¿Qué Es El Método Científico?jhefersonn
 
Presentacion Alternativa Especiales
Presentacion Alternativa   EspecialesPresentacion Alternativa   Especiales
Presentacion Alternativa Especialesguest8ba189
 
Diputados Aprueban Lei
Diputados Aprueban LeiDiputados Aprueban Lei
Diputados Aprueban LeiDerecho U.N.A.
 
Firewall
FirewallFirewall
FirewallMarcelo
 
Ciro AlegríA
Ciro AlegríACiro AlegríA
Ciro AlegríAgmcb
 
Contaduria.1
Contaduria.1Contaduria.1
Contaduria.1tepepan
 
Reseña Historica e Introduccion al Regimen Legal de Telecomunicaciones - Colo...
Reseña Historica e Introduccion al Regimen Legal de Telecomunicaciones - Colo...Reseña Historica e Introduccion al Regimen Legal de Telecomunicaciones - Colo...
Reseña Historica e Introduccion al Regimen Legal de Telecomunicaciones - Colo...JuanK Bustos
 
Proyecto Museo De Prado
Proyecto Museo De PradoProyecto Museo De Prado
Proyecto Museo De PradoYuliCompu
 
Texto Emociones Y Lenguaje En EducacióN Y PolíTica
Texto Emociones Y Lenguaje En EducacióN Y PolíTicaTexto Emociones Y Lenguaje En EducacióN Y PolíTica
Texto Emociones Y Lenguaje En EducacióN Y PolíTicaroxananavarrete
 
La convocatoria de huelga general
La convocatoria de huelga generalLa convocatoria de huelga general
La convocatoria de huelga generalMelomontobien
 
MóDulos Computadorizados
MóDulos ComputadorizadosMóDulos Computadorizados
MóDulos Computadorizadoscecimat
 
Evaluació..
Evaluació..Evaluació..
Evaluació..sergei
 
Frontpage
FrontpageFrontpage
Frontpagececimat
 
Importancia del agua para el cerebro
Importancia del agua para el cerebroImportancia del agua para el cerebro
Importancia del agua para el cerebroVeronica Espindola
 
Yasil Fatla InteracióN
Yasil Fatla InteracióNYasil Fatla InteracióN
Yasil Fatla InteracióNyasil
 
La Contaminacion Ambientalo
La Contaminacion AmbientaloLa Contaminacion Ambientalo
La Contaminacion Ambientaloguest061007
 

Andere mochten auch (20)

¿Qué Es El Método Científico?
¿Qué Es El Método Científico?¿Qué Es El Método Científico?
¿Qué Es El Método Científico?
 
Presentacion Alternativa Especiales
Presentacion Alternativa   EspecialesPresentacion Alternativa   Especiales
Presentacion Alternativa Especiales
 
Diputados Aprueban Lei
Diputados Aprueban LeiDiputados Aprueban Lei
Diputados Aprueban Lei
 
Firewall
FirewallFirewall
Firewall
 
Ciro AlegríA
Ciro AlegríACiro AlegríA
Ciro AlegríA
 
Contaduria.1
Contaduria.1Contaduria.1
Contaduria.1
 
Reseña Historica e Introduccion al Regimen Legal de Telecomunicaciones - Colo...
Reseña Historica e Introduccion al Regimen Legal de Telecomunicaciones - Colo...Reseña Historica e Introduccion al Regimen Legal de Telecomunicaciones - Colo...
Reseña Historica e Introduccion al Regimen Legal de Telecomunicaciones - Colo...
 
InformáTica 4º Eso
InformáTica 4º EsoInformáTica 4º Eso
InformáTica 4º Eso
 
Proyecto Museo De Prado
Proyecto Museo De PradoProyecto Museo De Prado
Proyecto Museo De Prado
 
Texto Emociones Y Lenguaje En EducacióN Y PolíTica
Texto Emociones Y Lenguaje En EducacióN Y PolíTicaTexto Emociones Y Lenguaje En EducacióN Y PolíTica
Texto Emociones Y Lenguaje En EducacióN Y PolíTica
 
La convocatoria de huelga general
La convocatoria de huelga generalLa convocatoria de huelga general
La convocatoria de huelga general
 
MóDulos Computadorizados
MóDulos ComputadorizadosMóDulos Computadorizados
MóDulos Computadorizados
 
Evaluació..
Evaluació..Evaluació..
Evaluació..
 
Frontpage
FrontpageFrontpage
Frontpage
 
Creyente
CreyenteCreyente
Creyente
 
Algosorprendente T
Algosorprendente TAlgosorprendente T
Algosorprendente T
 
Importancia del agua para el cerebro
Importancia del agua para el cerebroImportancia del agua para el cerebro
Importancia del agua para el cerebro
 
Yasil Fatla InteracióN
Yasil Fatla InteracióNYasil Fatla InteracióN
Yasil Fatla InteracióN
 
La Contaminacion Ambientalo
La Contaminacion AmbientaloLa Contaminacion Ambientalo
La Contaminacion Ambientalo
 
Cv leav 2010 merida
Cv leav 2010 meridaCv leav 2010 merida
Cv leav 2010 merida
 

Ähnlich wie Big Data : Extraer y visualizar grandes volúmenes de datos

Big Data Introducción
Big Data IntroducciónBig Data Introducción
Big Data IntroducciónGorka Armentia
 
Social Media Day Buenos Aires 2012: Zauber
Social Media Day Buenos Aires 2012: ZauberSocial Media Day Buenos Aires 2012: Zauber
Social Media Day Buenos Aires 2012: ZauberAdry Bustamante
 
De la web 2.0 al Social Media
De la web 2.0 al Social MediaDe la web 2.0 al Social Media
De la web 2.0 al Social MediaPablo Hamada
 
Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)Carlos Cuesta
 
Axicom twitter 9th june 2010
Axicom twitter 9th june 2010Axicom twitter 9th june 2010
Axicom twitter 9th june 2010axicom2013
 
SocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
SocialBro: Cómo sacar el máximo partido a tus contactos de TwitterSocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
SocialBro: Cómo sacar el máximo partido a tus contactos de TwitterLeticia Polese
 
Presentación BigDataMachine para Marketing
Presentación BigDataMachine para MarketingPresentación BigDataMachine para Marketing
Presentación BigDataMachine para MarketingBigDataMachine
 
Big Data para analizar las redes sociales
Big Data para analizar las redes socialesBig Data para analizar las redes sociales
Big Data para analizar las redes socialesDatKnoSys
 
Big data, Inteligencia Artificial y Redes Sociales en la investigación
Big data, Inteligencia Artificial y Redes Sociales en la investigaciónBig data, Inteligencia Artificial y Redes Sociales en la investigación
Big data, Inteligencia Artificial y Redes Sociales en la investigaciónMariché Navío Navarro
 
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...COIICV
 
Innovación mediante TIC aplicada con redes sociales y crowdsourcing
Innovación mediante TIC aplicada con redes sociales y crowdsourcingInnovación mediante TIC aplicada con redes sociales y crowdsourcing
Innovación mediante TIC aplicada con redes sociales y crowdsourcingSantiago Bonet
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014Eduardo Castro
 
APLICACION DEL CROWDSOURCING EN LAS EMPRESAS: "Es facil obtener ayuda a trave...
APLICACION DEL CROWDSOURCING EN LAS EMPRESAS: "Es facil obtener ayuda a trave...APLICACION DEL CROWDSOURCING EN LAS EMPRESAS: "Es facil obtener ayuda a trave...
APLICACION DEL CROWDSOURCING EN LAS EMPRESAS: "Es facil obtener ayuda a trave...Santiago Bonet
 
Web 2.0
Web 2.0Web 2.0
Web 2.0OBS
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para DummiesStratebi
 

Ähnlich wie Big Data : Extraer y visualizar grandes volúmenes de datos (20)

Big Data Introducción
Big Data IntroducciónBig Data Introducción
Big Data Introducción
 
Social Media Day Buenos Aires 2012: Zauber
Social Media Day Buenos Aires 2012: ZauberSocial Media Day Buenos Aires 2012: Zauber
Social Media Day Buenos Aires 2012: Zauber
 
Anatomía de un proyecto de Big Data
Anatomía de un proyecto de Big DataAnatomía de un proyecto de Big Data
Anatomía de un proyecto de Big Data
 
The Data Republic
The Data RepublicThe Data Republic
The Data Republic
 
De la web 2.0 al Social Media
De la web 2.0 al Social MediaDe la web 2.0 al Social Media
De la web 2.0 al Social Media
 
Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)
 
Axicom twitter 9th june 2010
Axicom twitter 9th june 2010Axicom twitter 9th june 2010
Axicom twitter 9th june 2010
 
1. Introducción Big Data
1.  Introducción Big Data1.  Introducción Big Data
1. Introducción Big Data
 
SocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
SocialBro: Cómo sacar el máximo partido a tus contactos de TwitterSocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
SocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
 
Redes Sociales, Facebook Vs. Twitter
Redes Sociales, Facebook Vs. TwitterRedes Sociales, Facebook Vs. Twitter
Redes Sociales, Facebook Vs. Twitter
 
Presentación BigDataMachine para Marketing
Presentación BigDataMachine para MarketingPresentación BigDataMachine para Marketing
Presentación BigDataMachine para Marketing
 
Big Data para analizar las redes sociales
Big Data para analizar las redes socialesBig Data para analizar las redes sociales
Big Data para analizar las redes sociales
 
Big data, Inteligencia Artificial y Redes Sociales en la investigación
Big data, Inteligencia Artificial y Redes Sociales en la investigaciónBig data, Inteligencia Artificial y Redes Sociales en la investigación
Big data, Inteligencia Artificial y Redes Sociales en la investigación
 
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...
 
Innovación mediante TIC aplicada con redes sociales y crowdsourcing
Innovación mediante TIC aplicada con redes sociales y crowdsourcingInnovación mediante TIC aplicada con redes sociales y crowdsourcing
Innovación mediante TIC aplicada con redes sociales y crowdsourcing
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
 
APLICACION DEL CROWDSOURCING EN LAS EMPRESAS: "Es facil obtener ayuda a trave...
APLICACION DEL CROWDSOURCING EN LAS EMPRESAS: "Es facil obtener ayuda a trave...APLICACION DEL CROWDSOURCING EN LAS EMPRESAS: "Es facil obtener ayuda a trave...
APLICACION DEL CROWDSOURCING EN LAS EMPRESAS: "Es facil obtener ayuda a trave...
 
SMM-SEO.SEM
SMM-SEO.SEMSMM-SEO.SEM
SMM-SEO.SEM
 
Web 2.0
Web 2.0Web 2.0
Web 2.0
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para Dummies
 

Big Data : Extraer y visualizar grandes volúmenes de datos

  • 1. BIG DATA: Extraer y visualizar grandes volúmenes de datos Visualizaciones en tiempo real sobre Twitter Fernando Zunino Pauline Morrison Fell @fzunino @polinmf Thursday, June 21, 12
  • 2. Acerca de Zauber • Somos una boutique de software y lab con base en Argentina y Estados Unidos que provee servicios a una alta gama de líderes de la industria y startups de internet en América Latina y Silicon Valley. • Nos especializamos en proyectos de Consumer Web, Social Analytics y Big Data. Combinamos nuestros servicios de desarrollo boutique con un laboratorio de I+D para desarrollar nuevos emprendimientos y productos. Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 3. Nuestra experiencia con Twitter APIs Al Jazeera - Twitter Dashboard CABA - Elecciones legislativas 2011 JSConfAr - Visualizing Tweets Coca Cola - Social World Cup La Nacion - Elecciones presidenciales 2011 Zauberlabs - Tweet Discover Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 4. Análisis de audiencias online Value insights on social audiences and conversations Plataforma online que: • Procesa social media data a gran escala para entregar reportes en tiempo real • Identifica patrones demográficos y de comportamiento de seguidores y conversaciones en Twitter • Usa ML y NLP para entregar perfiles sociales aumentados con información nueva respecto de APIs existentes o perfiles de usuarios. Diseñada para: • Investigación de mercado online • Monitoreo de marcas en tiempo real • ROI en Social Media • Estrategias en Social Media Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 5. Visualizacio- nes animadas de Twitter Build your own Twitter real-time visualizations Plataforma online que permite: • Construir infografías animadas sobre temas en Twitter • Enriquecer noticias con contenido social • Ofrecer una segunda pantalla para un programa de TV • Aumentar la participación en un evento • Cubrir el buzz en eventos grandes o internacionales Diseñada para: • Periodistas, Bloggers, Directores de Contenido, Marketeers, Organizadores de Eventos, Emisoras Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 6. Cómo lo construimos FRONTEND BACKEND Storm Oozie INFRAESTRUCTURA TWITTER API Rest API ELB, EC2, S3 Streaming API Elastic Map Reduce Route53, CloudWatch Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 7. Desafíos tecnológicos • Límites API Twitter • Big Data • Manejo de datos no estructurados • Inferencia de atributos ocultos Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 8. Límites API Twitter • Rest API limitada a 350 requests por ahora por IP • Streaming API (statuses/filter) está limitada si tweets exceden el 1% del Firehose • Partners de Twitter (Gnip, DataSift) pueden ser una opción para obtener un acceso mayor Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 9. Big Data • Twitter en # • 400M tweets por dia (http://www.theverge.com/ 2012/6/6/3069424/twitter-400-million-total-daily-tweets) • 140M usuarios activos (http://blog.twitter.com/2012/03/twitter- turns-six.html) • Generación de estadísticas en tiempo real • Stream Processing => Storm • Generación de estadísticas sobre los usuarios • Batch Processing => Hadoop (Map Reduce, Pig) Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 10. Manejo de datos no estructurados • Ubicación • 5% de tweets utilizan GeoLocation API • 72% Ingresan datos de ubicación en forma no estructurada • Utilizamos técnicas de NLP e Information Retrieval para detectar ubicación Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 11. Inferencia de atributos ocultos • Datos demográficos de usuarios no están presentes • Tipo de Usuario • Hombre/Mujer/Compañia • Rango etario • Machine Learning al rescate! • Se utilizan técnicas de aprendizaje supervisado para detectar dichos atributos Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 12. Demos Rio+20 Malvinas Boca vs Universidad de Chile Elecciones en Mexico Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12
  • 13. Gracias! Preguntas? Visualizaciones en tiempo real sobre Twitter Big Data: Extraer y visualizar grandes volúmenes de datos Thursday, June 21, 12