El documento habla sobre la revolución del Big Data y cómo los datos se han convertido en un activo estratégico para las empresas. Explica que la cantidad de datos generados diariamente ha aumentado exponencialmente y continuará creciendo en el futuro, pasando de 2 exabytes diarios en 2013 a 35 zettabytes en 2020. También analiza cómo el entorno de los datos ha cambiado de estar centralizados y generarse de forma semanal a provenir de múltiples fuentes y requerir análisis continuos con nueva información.
1. La revolución del Big Data
De datos a negocio
Lluís Soldevila i Vilasís
Online Business School
25 de julio de 2013
Partners académicos
2.
3.
4.
5. Es improbable que la energía atómica produzca algo mucho más
peligroso que un explosivo convencional
Winston Churchill (1930)
6. Creo que hay mercado mundial como mucho para cinco ordenadores
Thomas Watson, presidente de IBM (1943)
7. Se acabará demostrando que los rayos X son un timo
Lord Kelvin, presidente de la Royal Society (1883)
8. Nunca se fabricará un avión más grande que éste
Un ingeniero de Boeing, deslumbrado al ver el Boeing 247, con
capacidad para 10 personas (1933)
9. Acabaremos con el spam en dos años
Bill Gates, fundador de Microsoft (2004)
10. La televisión no durará porque la gente pronto se cansará de mirar
fijamente a una caja de madera contrachapada cada noche
Darryl Zanuch, productor de 20th Century Fox (1946)
11. La limpieza del hogar se llevará a cabo con aspiradoras nucleares
Alex Lewyt, presidente de Lewyt Corp (1950)
12. No hay necesidad de tener un ordenador en cada casa
Ken Olsen, fundador de Digital Equipment, 1977
13. El teléfono tiene demasiados inconvenientes para ser considerados
un medio de comunicación serio. Este aparato no nos sirve para nada
Circular interna de Western Union (1876)
14. El fonógrafo no tiene ningún valor comercial Thomas Edison
(1880)
15. Los americanos necesitan el teléfono. Nosotros no. Tenemos
mensajeros de sobra
William Preece, director del Servicio Postal británico (1878)
51. antes
• Sistema transaccional que no da datos completos
• Los datos están centralizados
• Generación de datos diaria o semanalmente
• Entorno estable para el análisis
52. después (hoy!)
• Datos de muchas fuentes, de dentro y fuera de la
organización
• Los datos están físicamente distribuidos
• Necesidad de iterar para validad modelos
• Cada iteración requiere nueva carga de información
53.
54. • Cuál era mi nómina
• Cuál era la nómina de mi mujer
• Cuántas tarjetas de crédito tenía (como mínimo!)
• Mi hipoteca
• Si ahorraba o no
55. • Cuál era mi nómina
• Cuál era la nómina de mi mujer
• Cuántas tarjetas de crédito tenía (como mínimo!)
• Mi hipoteca
• Si ahorraba o no
… y también
• Cuántos hijos tenía
• A qué cole iban mis hijos
• Cómo vestía
• Cuáles cuantos coches tenía
• Mis aficiones
• Si marchaba fuera a el fin de semana
• Cuántas veces a la semana cenaba fuera
56. • Cuál era mi nómina
• Cuál era la nómina de mi mujer
• Cuántas tarjetas de crédito tenía (como mínimo!)
• Mi hipoteca
• Si ahorraba o no
… y también
• Cuántos hijos tenía
• A qué cole iban mis hijos
• Cómo vestía
• Cuáles cuantos coches tenía
• Mis aficiones
• Si marchaba fuera a el fin de semana
• Cuántas veces a la semana cenaba fuera
… y también
• Cuándo necesitaba un nuevo producto
• Cuándo dejaría de pagar
• Cuándo dejaría de ser cliente