3. ●
¿Qué es el Big Data?
No existe una definición única, pero básicamente se
refiere a la administración y explotación de grandes
volúmenes de datos que no puede ser procesados
instantaneamente.
4. ●
¿Qué tan grande es la Big Data?
Simplemente es incalculable.
Para 2012 se estimaba que se producian 2.8 zetabytes
de información anualmente.
1zb = 1,000eb = 1,000,000pb = 1,000,000,000tb = 1,000,000,000,000gb
zeta exa peta tera giga
Algunas estimaciones dicen que el cerebro humano almacena entre 1 a 10
Tbytes de información, otros dicen que puede almacenar como máximo 2.5
Pbytes, es decir al año creamos el conocimiento que pueden almacenar
aproximadamente entre 1.12 millones de personas y 2.8k millones de
personas.
5. ●
¿De donde nacen esos datos?
Las fuentes de datos son innumerables:
– Data transaccional
– Datos multimedia
– Sensores
– Ud.
6. ●
¿Qué esperamos encontrar en toda esta información?
Esta pregunta precede a una más importante: ¿Qué
problema esperamos resolver?
Las necesidades son diferentes para todos los
usuarios, fundamentalmente se espera convertir todos
esos datos en información mediante métodos
analíticos y estadísticos.
7. ●
¿Qué necesitamos para “hacer” Big Data?
1. Los Datos, que deben cumplir estas 5 características:
a)Voluminosos, se dice que a partir de 1Pbyte ya se
puede considerar big data.
b)Variados, provienen de diversas fuente de datos.
c)Se debe requerir su proceso Velozmente.
d)Veraces, debe poder confiarse en la calidad del dato.
e)Deben tener Valor para el problema a resolver.
8. ●
¿Qué necesitamos para “hacer” Big Data?
2. Poder computacional.
El Big Data no puede ser procesado por un
coputador convencional, generalmente se requiere
de un gran super computador o de muchos
computadores tratando la misma data.
9. ●
¿Qué necesitamos para “hacer” Big Data?
3. Software Especializado.
Evidentemente para procesar estos grandes
volúmenes de datos se requiere de herramientas
mucho más especializadas que un simple motor de
bases de datos relacionales.
Actualmente mucho del software a utilizar para
estas soluciones de es licencia LIBRE, es decir puede
ser utilizado sin costos de licenciamiento
(especialmente para fines de investigación).
10.
11. ●
Un caso práctico.
El proyecto SETI en el año 1999 requirió a la comunidad
mundial apoyo en el procesamiento de los datos que
captan los radiotelescopios en búsqueda de señales de
vida extraterrestre.
Para esto se creó el proyecto SETI@Home, este consiste en
instalar en computadores personales un aplicativo que
funciona cada vez que se activa el “screen saver”, al
activarse solicita a SETI fragmentos de datos que son
procesados y los resultados enviados de regreso al
proyecto.
12. ●
Un caso práctico.
– 5,2 millones de participantes en todo el mundo.
– Desde su lanzamiento en 1999, el proyecto ha registrado más de
dos millones de años de tiempo de cálculo.
– Al 2001 SETI@home había realizado un total de 1021 operaciones
de coma flotante.
– Guinness World Record como el más grande proceso de
computación en la historia. 278.832 ordenadores activos en el
sistema (2,4 millones en total) en 234 países
– A 2009, SETI@home tenía la capacidad para calcular más de 769
teraFLOPS, el Tianhe-2 el superordenador más rápido del mundo
al 2013 solo procesa 33,86 petaFLOPS.
13. ●
Big Data en beneficio del ciudadano
Básicamente el poder que nos da el Big Data puede
ser utilizado en muchos campos los cuales repercuten
finalmente en beneficio de los ciudadanos, como por
ejemplo:
– Investigación médica.
– Calidad de vida y control medioambiental.
– Seguridad pública.
– Control de la administración pública.
– Etc. etc. etc.
14. ●
Big Data en beneficio del ciudadano
En Salud:
– Por ejemplo control de gripes, epidemias, enfermedades
infectocontagiosas, etc.
●
Como:
– Minando datos en la web y redes sociales
– Procesando los informes de los centros de salud
– Recibiendo feed-back de los médicos familiares
15. ●
Big Data en beneficio del ciudadano
En Calidad de Vida y Control
Medioambiental
– Por ejemplo polución del aire,
decremento de las áreas verdes,
contaminación sonora, tráfico
excesivo.
●
Como:
– Sensores interconectados de gases,
ruido, temperatura, radiación,
humedad, etc.
– Informes ciudadanos del estado del
tráfico, servicios, etc. (directos o
minados de la red/redes sociales).
– Análisis de fotografías de plantas
enfermas.
16. ●
Big Data en beneficio del ciudadano
En Seguridad ciudadana
– Por ejemplo detección de prontuariados, analisis de
comportamiento y zonas calientes.
●
Como:
– Interconexión de las cámaras de los locales comerciales y
aplicación de análisis facial.
– Informes directos de los ciudadanos o minados de la red.
●
Tendencias a crímenes pre-anunciados (saqueos, asesinatos,
etc.)
17. ●
Big Data en beneficio del ciudadano
En Control de la Administración Pública
– Por ejemplo optimización del gasto público, peculado,
pertinencia de obras públicas, etc.
●
Como:
– Seguimiento de compras públicas (minado web dirigido).
– Sensores de conteo de flujo peatonal y automovilístico .
19. ●
Big Data y Smart Cities
“Smart City” es un
termino que engloba el
desarrollo de políticas y
procedimientos eficientes
en el ámbito del
desarrollo urbano
sostenible para las
ciudades.
20. ●
¿Donde se unen el Big Data y las Smart Cities?
Los Smart Cities basan mucho su parte “inteligente”
en la recaudación ingente de datos y el análisis de los
mismos,
información tan
masiva que no
podría ser
procesada si no
tuvieramos
plataformas de
Big Data para
poder analizarlas.
21. ●
Lo malo del Big Data
El Big Data es muy potente, no solo informa en tiempo real sino
que puede predecir situaciones, esto puede llevar a pre-juicios o
incomodidades en las personas (especialmente en el área
comercial y seguridad personal).
Además el Big Data en gran medida aprovechar la falta de
privacidad en la red, esta definitivamente NO EXISTE.
22. ●
Un paso mas lejos…..
Actualmente el nuevo reto del Big Data es que las máquinas
aprendan sobre la información que están procesando y
obtengan mejores resultados, en ese sentido hay proyectos
levantando:
– Bases de datos de enfermos crónicos
– Bases de datos de fotos de especies animales y vegetales
– Bases de datos de enfermedades en plantas
– Etc. etc. etc.