SlideShare ist ein Scribd-Unternehmen logo
1 von 29
Un universo de datos. El
fenómeno Big Data y la Ciencia

   Joaquín Salvachúa @ DIT ETSIT UPM
        joaquin.salvachua@upm.es
Movimiento browniano

• Movimiento aleatorio de particulas en un
 medio fluido.

• Analizado en función de la agregación de los
 movimientos de las moléculas del agua.



• ¿Que ocurriría si tuviesemos acceso a los
 movimientos de TODAS las moleculas del
 agua? (en vez de una agregación de datos).
Movimiento browniano
                social toda la
• Actualmente podemos tener
 información de lo que realiza una persona.

• ... Incluso lo que piensa, siente o desea
 (facebook, twitter, etc).

• .. Movimientos (smartCity, smartCar).




• El mundo como un gran fuente de datos.
Datos

• Análisis en casi tiempo real.
• Acceso a mayor cantidad de datos, de todo
 tipo, relevancia y veracidad.

• Posiblidad de almacenarlos todos.
• Posiblidad de procesar y guardar TODOS los
 datos. ( 1 W / n R ).
¿Muerte del método
               científico?
• ¿Modelo analítico? tengo datos...
• Evitar razonar sobre el problema.


• Ciencia guiada por datos.


• El mundo como experimento (gripe)
Big Data

• Capacidad de manipular grandes cantidades
 heterogeneas de datos.

  • Volumen
  • Variedad
  • Velocidad
  • Veracidad
Volumen grande
• Es como lo de antes.. pero más
    • Bussines intelligence.
• ¿Seguro?
• ¿Podemos tener una hormiga de 10 m de
 largo?
Almacenamiento y
          procesado
• Diversos enfoques para sistemas
 distribuidos.

• Problemas de resistencia a caidas, dificultad
 de configuración etc.



• Evitar que sea necesario manejar dichos
 datos.
Sistemas de
              almacenamiento
• BigTable (google GFS ) 2006
• Imitado en Hadoop (HDFS)


• Almacen clave-valor sin estructura.


• Discos baratos y fungibles (3 replicas)
P2P
• Sistemas autoregulados y autoconfigurados.
• Basados en DHT (Distributed Hash Tables)


• Base de los sistemas de compartición de
 ficheros P2P.

• Bases de datos NoSQL
• Sistema deMapReduce
            procesado distribuido
 autoorganizado y autosincronizado.

  • Diseñado por google (2004)
  • Estado en disco.
  • Dos fases.
Hadoop y otras hierbas.


• Proyecto de software libre Apache que
 replica la infraestructura inicial de google.

• Escrito en Java.
• Diversas capas para que sea más sencillo
 usarlo.
Relación con
        CloudComputing
• Despliegue de Hadoop en la nube.
• Pagas por lo que gastas.


• Soporte en los distintos proveedores.
• Engarce con sistemas de almacenamiento y
 de procesado de valores.
Variedad
• Manipulación de datos no estructurados, ni
 agregados.

• Necesidad de “cocinarlos” previamente.
• De múltiples fuentes no disjuntas:
 redundancia.



• Sobrepasar las ideas de la fracasada web
 semántica. (enfoque más pragmatico).
Velocidad
• Problema en transportar datos de un sensor
 a un almacenamiento o entre
 almacenamiento.



• Necesidad de procesarlos rapidamente.
• Esquemas similares a multimedia.
• Uso de GPUs.
• Procesado en “streamming”.
Visualización

• Mark Twain : "Lies, damned lies, and
 statistics Visualization”.

• Componente vital de todo análisis.
• Parte artistica del análisis.


• Nicho de gran futuro.
Privacidad
• Cambio en el esquema.
• Saben como nos comportamos (tipado de
 patos// duck-typing ).
¿Nuestros datos?




            Internet of things



           Socialmedia
IoT & SmartCities
• Fuente de datos en crudo.
• Abundancia de sensores: nuevos API.
• Problemas de almacenamiento: procesado
 distribuido.



• Ciudades inteligentes: propiedad emergente
 de sistemas analizados con BigData.
Problemas prácticos
• Podemos sintetizar atributos a los que
 debemos aplicar la ley de protección de
 datos.

    • Inferir sexo, orientación sexual, religión.


• Dificultad de la anonimización de los datos:
 esquemas de federación de busquedas-
 resultados.
Cerrando el bucle
Periodismo de datos

• Importancia de saber procesar datos no solo
 por científicos.

• Importante para la sociedad.
• OpenData


• Necesidad de entornos sencillos.
“Los limites de mi lenguaje
son los limites de mi mundo”
• R : Comunidad y flexibilidad


• Julia : Rapidez.


• NumPy (selección por parte de Darpa)
Problemas clásicos

• Lo ha dicho el “BigData”: Eliminación de
 teletrabajo en Yahoo (Marisa Mayer).




• GarbageIn-Garbage-Out
Social Media.

• Importancia del analisis basado en ciencia
 de redes.

• Extrapolable a otros campos.
• el Grafo social como “mi tesoro”.
• Ciencia de las redes.
• Necesidad de avances teóricos.
Problemas de procesado de
         grafos
• Almacenamientos poco orientado a análisis
 de grafos



• Nuevos enfoques
• (Google Pregel 2010)
  • ¿ enfoque correcto ?
Future Internet
FI-ware Fi-ppp
Triste es pedir... pero más
      triste es robar.
• Dificultad de acceder a “datasets”
 interesantes.



• ¿Es realmente el nuevo petroleo?


• Enfoques abiertos y colaborativos.
¿ Preguntas?

Weitere ähnliche Inhalte

Andere mochten auch

Pfsense 121202023417-phpapp02
Pfsense 121202023417-phpapp02Pfsense 121202023417-phpapp02
Pfsense 121202023417-phpapp02
Mohamed Houssem
 
53458737 manual-de-usuario-de-pfsense-firewall
53458737 manual-de-usuario-de-pfsense-firewall53458737 manual-de-usuario-de-pfsense-firewall
53458737 manual-de-usuario-de-pfsense-firewall
Sebastian Berrios Vasquez
 
Guide pfsense
Guide pfsenseGuide pfsense
Guide pfsense
r_sadoun
 

Andere mochten auch (15)

Programador Jr. para Python Primera Parte
Programador Jr. para Python Primera ParteProgramador Jr. para Python Primera Parte
Programador Jr. para Python Primera Parte
 
Odd2015 scraping
Odd2015 scrapingOdd2015 scraping
Odd2015 scraping
 
pfSense Platform Binnaris 2014
pfSense Platform Binnaris 2014pfSense Platform Binnaris 2014
pfSense Platform Binnaris 2014
 
Pfsense
PfsensePfsense
Pfsense
 
Primeros Pasos en PyQt4
Primeros Pasos en PyQt4Primeros Pasos en PyQt4
Primeros Pasos en PyQt4
 
Introducción a PyQt
Introducción a PyQtIntroducción a PyQt
Introducción a PyQt
 
pfSense, OpenSource Firewall
pfSense, OpenSource FirewallpfSense, OpenSource Firewall
pfSense, OpenSource Firewall
 
Pfsense
PfsensePfsense
Pfsense
 
Pfsense 121202023417-phpapp02
Pfsense 121202023417-phpapp02Pfsense 121202023417-phpapp02
Pfsense 121202023417-phpapp02
 
El uso de Python en la Ingenieria Química - Charla Completa
El uso de Python en la Ingenieria Química - Charla CompletaEl uso de Python en la Ingenieria Química - Charla Completa
El uso de Python en la Ingenieria Química - Charla Completa
 
Pfsense: securizando tu infraestructura
Pfsense: securizando tu infraestructuraPfsense: securizando tu infraestructura
Pfsense: securizando tu infraestructura
 
53458737 manual-de-usuario-de-pfsense-firewall
53458737 manual-de-usuario-de-pfsense-firewall53458737 manual-de-usuario-de-pfsense-firewall
53458737 manual-de-usuario-de-pfsense-firewall
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Guide pfsense
Guide pfsenseGuide pfsense
Guide pfsense
 

Ähnlich wie Big data Jornada Fundación Ramón Areces

Esp #001-no son los documentos; son los datos-traducido
 Esp #001-no son los documentos; son los datos-traducido Esp #001-no son los documentos; son los datos-traducido
Esp #001-no son los documentos; son los datos-traducido
J T "Tom" Johnson
 

Ähnlich wie Big data Jornada Fundación Ramón Areces (20)

Bibliotecari@s en la ‪Big Data‬
Bibliotecari@s en la ‪Big Data‬Bibliotecari@s en la ‪Big Data‬
Bibliotecari@s en la ‪Big Data‬
 
Big Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesBig Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patrones
 
Big Data Introducción
Big Data IntroducciónBig Data Introducción
Big Data Introducción
 
Desayuno de arquitectos: Big data en azure
Desayuno de arquitectos: Big data en azureDesayuno de arquitectos: Big data en azure
Desayuno de arquitectos: Big data en azure
 
Big data
Big dataBig data
Big data
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
SGNext Elasticsearch
SGNext ElasticsearchSGNext Elasticsearch
SGNext Elasticsearch
 
Big data
Big dataBig data
Big data
 
Minería de Datos - Unidad 1
Minería de Datos - Unidad 1Minería de Datos - Unidad 1
Minería de Datos - Unidad 1
 
Big data
Big dataBig data
Big data
 
Retos actuales y futuros del Cómputo en la Nube - Un enfoque académico
Retos actuales y futuros del Cómputo en la Nube - Un enfoque académicoRetos actuales y futuros del Cómputo en la Nube - Un enfoque académico
Retos actuales y futuros del Cómputo en la Nube - Un enfoque académico
 
Esp #001-no son los documentos; son los datos-traducido
 Esp #001-no son los documentos; son los datos-traducido Esp #001-no son los documentos; son los datos-traducido
Esp #001-no son los documentos; son los datos-traducido
 
Big Data para mortales
Big Data para mortalesBig Data para mortales
Big Data para mortales
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 
Tech tuesday Big data with horton works
Tech tuesday Big data with horton worksTech tuesday Big data with horton works
Tech tuesday Big data with horton works
 
01 Introduccion a Big Data y Hadoop.pdf
01 Introduccion a Big Data y Hadoop.pdf01 Introduccion a Big Data y Hadoop.pdf
01 Introduccion a Big Data y Hadoop.pdf
 
Manual Base Datos
Manual Base DatosManual Base Datos
Manual Base Datos
 
Unidad 1 - Introducción a los Sistemas de Gestión de Bases de Datos.pdf
Unidad 1 - Introducción a los Sistemas de Gestión de Bases de Datos.pdfUnidad 1 - Introducción a los Sistemas de Gestión de Bases de Datos.pdf
Unidad 1 - Introducción a los Sistemas de Gestión de Bases de Datos.pdf
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOS
 

Mehr von Joaquín Salvachúa

Mehr von Joaquín Salvachúa (20)

Eemov data
Eemov dataEemov data
Eemov data
 
Etica big data
Etica big dataEtica big data
Etica big data
 
FIWARE Data usage control
FIWARE Data usage controlFIWARE Data usage control
FIWARE Data usage control
 
Fiware overview3
Fiware overview3Fiware overview3
Fiware overview3
 
Fiware overview
Fiware overviewFiware overview
Fiware overview
 
Kubernetes2
Kubernetes2Kubernetes2
Kubernetes2
 
Introducción al ecosistema de React.js
Introducción al ecosistema de React.jsIntroducción al ecosistema de React.js
Introducción al ecosistema de React.js
 
FIWARE Identity Manager Exercises
FIWARE Identity Manager ExercisesFIWARE Identity Manager Exercises
FIWARE Identity Manager Exercises
 
FIware Identity Manager
FIware Identity ManagerFIware Identity Manager
FIware Identity Manager
 
Fi ware en Hack for good (#H4G)
Fi ware en Hack for good  (#H4G) Fi ware en Hack for good  (#H4G)
Fi ware en Hack for good (#H4G)
 
Id fiware upm-dit
Id fiware  upm-ditId fiware  upm-dit
Id fiware upm-dit
 
Vagrant
VagrantVagrant
Vagrant
 
Intro20 socioeconomia
Intro20 socioeconomiaIntro20 socioeconomia
Intro20 socioeconomia
 
Master w20 01
Master w20 01Master w20 01
Master w20 01
 
Blogs micro
Blogs microBlogs micro
Blogs micro
 
Social networks upm
Social networks upmSocial networks upm
Social networks upm
 
Nube redes
Nube redesNube redes
Nube redes
 
Identidad2
Identidad2Identidad2
Identidad2
 
Blogs Micro
Blogs MicroBlogs Micro
Blogs Micro
 
Blogs Micro
Blogs MicroBlogs Micro
Blogs Micro
 

Kürzlich hochgeladen

Criterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficiosCriterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficios
JonathanCovena1
 

Kürzlich hochgeladen (20)

Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática5    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática5    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
 
Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.
 
Imperialismo informal en Europa y el imperio
Imperialismo informal en Europa y el imperioImperialismo informal en Europa y el imperio
Imperialismo informal en Europa y el imperio
 
Estrategias de enseñanza-aprendizaje virtual.pptx
Estrategias de enseñanza-aprendizaje virtual.pptxEstrategias de enseñanza-aprendizaje virtual.pptx
Estrategias de enseñanza-aprendizaje virtual.pptx
 
Valoración Crítica de EEEM Feco2023 FFUCV
Valoración Crítica de EEEM Feco2023 FFUCVValoración Crítica de EEEM Feco2023 FFUCV
Valoración Crítica de EEEM Feco2023 FFUCV
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literario
 
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSOCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
 
Criterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficiosCriterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficios
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
actividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° gradoactividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° grado
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
 
plan de capacitacion docente AIP 2024 clllll.pdf
plan de capacitacion docente  AIP 2024          clllll.pdfplan de capacitacion docente  AIP 2024          clllll.pdf
plan de capacitacion docente AIP 2024 clllll.pdf
 
Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes d
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grande
 
Programacion Anual Matemática4 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática4    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática4    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática4 MPG 2024 Ccesa007.pdf
 
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 

Big data Jornada Fundación Ramón Areces

  • 1. Un universo de datos. El fenómeno Big Data y la Ciencia Joaquín Salvachúa @ DIT ETSIT UPM joaquin.salvachua@upm.es
  • 2. Movimiento browniano • Movimiento aleatorio de particulas en un medio fluido. • Analizado en función de la agregación de los movimientos de las moléculas del agua. • ¿Que ocurriría si tuviesemos acceso a los movimientos de TODAS las moleculas del agua? (en vez de una agregación de datos).
  • 3. Movimiento browniano social toda la • Actualmente podemos tener información de lo que realiza una persona. • ... Incluso lo que piensa, siente o desea (facebook, twitter, etc). • .. Movimientos (smartCity, smartCar). • El mundo como un gran fuente de datos.
  • 4. Datos • Análisis en casi tiempo real. • Acceso a mayor cantidad de datos, de todo tipo, relevancia y veracidad. • Posiblidad de almacenarlos todos. • Posiblidad de procesar y guardar TODOS los datos. ( 1 W / n R ).
  • 5. ¿Muerte del método científico? • ¿Modelo analítico? tengo datos... • Evitar razonar sobre el problema. • Ciencia guiada por datos. • El mundo como experimento (gripe)
  • 6. Big Data • Capacidad de manipular grandes cantidades heterogeneas de datos. • Volumen • Variedad • Velocidad • Veracidad
  • 7. Volumen grande • Es como lo de antes.. pero más • Bussines intelligence. • ¿Seguro? • ¿Podemos tener una hormiga de 10 m de largo?
  • 8. Almacenamiento y procesado • Diversos enfoques para sistemas distribuidos. • Problemas de resistencia a caidas, dificultad de configuración etc. • Evitar que sea necesario manejar dichos datos.
  • 9. Sistemas de almacenamiento • BigTable (google GFS ) 2006 • Imitado en Hadoop (HDFS) • Almacen clave-valor sin estructura. • Discos baratos y fungibles (3 replicas)
  • 10. P2P • Sistemas autoregulados y autoconfigurados. • Basados en DHT (Distributed Hash Tables) • Base de los sistemas de compartición de ficheros P2P. • Bases de datos NoSQL
  • 11. • Sistema deMapReduce procesado distribuido autoorganizado y autosincronizado. • Diseñado por google (2004) • Estado en disco. • Dos fases.
  • 12. Hadoop y otras hierbas. • Proyecto de software libre Apache que replica la infraestructura inicial de google. • Escrito en Java. • Diversas capas para que sea más sencillo usarlo.
  • 13. Relación con CloudComputing • Despliegue de Hadoop en la nube. • Pagas por lo que gastas. • Soporte en los distintos proveedores. • Engarce con sistemas de almacenamiento y de procesado de valores.
  • 14. Variedad • Manipulación de datos no estructurados, ni agregados. • Necesidad de “cocinarlos” previamente. • De múltiples fuentes no disjuntas: redundancia. • Sobrepasar las ideas de la fracasada web semántica. (enfoque más pragmatico).
  • 15. Velocidad • Problema en transportar datos de un sensor a un almacenamiento o entre almacenamiento. • Necesidad de procesarlos rapidamente. • Esquemas similares a multimedia. • Uso de GPUs. • Procesado en “streamming”.
  • 16. Visualización • Mark Twain : "Lies, damned lies, and statistics Visualization”. • Componente vital de todo análisis. • Parte artistica del análisis. • Nicho de gran futuro.
  • 17. Privacidad • Cambio en el esquema. • Saben como nos comportamos (tipado de patos// duck-typing ).
  • 18. ¿Nuestros datos? Internet of things Socialmedia
  • 19. IoT & SmartCities • Fuente de datos en crudo. • Abundancia de sensores: nuevos API. • Problemas de almacenamiento: procesado distribuido. • Ciudades inteligentes: propiedad emergente de sistemas analizados con BigData.
  • 20. Problemas prácticos • Podemos sintetizar atributos a los que debemos aplicar la ley de protección de datos. • Inferir sexo, orientación sexual, religión. • Dificultad de la anonimización de los datos: esquemas de federación de busquedas- resultados.
  • 22. Periodismo de datos • Importancia de saber procesar datos no solo por científicos. • Importante para la sociedad. • OpenData • Necesidad de entornos sencillos.
  • 23. “Los limites de mi lenguaje son los limites de mi mundo” • R : Comunidad y flexibilidad • Julia : Rapidez. • NumPy (selección por parte de Darpa)
  • 24. Problemas clásicos • Lo ha dicho el “BigData”: Eliminación de teletrabajo en Yahoo (Marisa Mayer). • GarbageIn-Garbage-Out
  • 25. Social Media. • Importancia del analisis basado en ciencia de redes. • Extrapolable a otros campos. • el Grafo social como “mi tesoro”. • Ciencia de las redes. • Necesidad de avances teóricos.
  • 26. Problemas de procesado de grafos • Almacenamientos poco orientado a análisis de grafos • Nuevos enfoques • (Google Pregel 2010) • ¿ enfoque correcto ?
  • 28. Triste es pedir... pero más triste es robar. • Dificultad de acceder a “datasets” interesantes. • ¿Es realmente el nuevo petroleo? • Enfoques abiertos y colaborativos.