1. ARQUITECTURA DE COMPUTADORAS
UNIDAD 4
“BIG DATA”
CATEDRÁTICO: M.T.I. RODOLFO VAZQUEZ PALACIOS.
AGUILAR ORTIZ JULISSA
ANAYA MANZANO JUAN
CORTÉS SÁNCHEZ MISAEL
DOMINGUEZ GARCÍA YOEL ALEXIS
GARCÍA CAYETANO FLORENCIO
ING. INFORMATICA
SEMESTRE: 4°
SAN JUAN BAUTISTA TUXTEPEC, OAXACA A 14 DE MAYO DE
2015.
INSTITU
TO
TECNOLOGICO DE
TU
X
TEPEC
2. 2
INTRODUCCIÓN.
Debido al gran avance que existe día con día en las tecnologías de información, las
organizaciones se han tenido que enfrentar a nuevos desafíos que les permitan
analizar, descubrir y entender más allá de lo que sus herramientas tradicionales
reportan sobre su información, al mismo tiempo que durante los últimos años el gran
crecimiento de las aplicaciones disponibles en internet (redes sociales, etc.) han
sido parte importante en las decisiones de negocio de las empresas.
3. 3
ÍNDICE.
Pág.
Introducción
Historia sobre “BIG DATA”
BIG DATA definición
Características
Importancia
Ejemplos reales del uso inteligente del BIG DATA
Ventajas
Otros usos de BIG DATA
Conclusión
2
4
8
8
10
10
13
14
15
4. 4
HISTORIA
La historia del término Big Data puede ser breve, pero muchos de los cimientos de
los conceptos detrás de Big Data se construyeron y establecieron hace mucho
tiempo. Mucho antes de que las computadoras (tal como la conocemos hoy) eran
comunes, la idea de que estábamos creando un cuerpo cada vez mayor de
conocimientos para el análisis, era muy popular y había madurado en el mundo
académico. Aunque podría ser fácil de olvidar, nuestra creciente capacidad de
almacenar y analizar información, ha sido una evolución gradual. Aunque las cosas,
sin duda, se aceleraron a finales del siglo pasado, con la invención de
almacenamiento digital y de Internet.
1926
Nikola Tesla predice que en el futuro un hombre será capaz de acceder y analizar
grandes cantidades de datos utilizando un dispositivo lo suficientemente pequeño
que cabrá en el bolsillo.
1991
El nacimiento de Internet. Cualquier persona puede ahora ir en línea y subir sus
propios datos, o analizar los datos cargados por otras personas.
1996
El precio de almacenamiento digital cae hasta el punto donde es más rentable que
el papel.
5. 5
1997
Google lanza su motor de búsqueda que rápidamente se convertirá en el más
popular del mundo. Michael Lesk estima que el universo digital está aumentando
diez veces su tamaño cada año.
1999
Las primeras ideas de Big Data. El primer uso del término Big Data en un trabajo
académico: “Visually Exploring Gigabyte Datasets in Realtime (ACM)”. El primer uso
del concepto “Internet of Things” (Internet de las Cosas) en una presentación de
negocios de Kevin Ashton para Procter and Gamble.
2001
Las tres “V” definida por Doug Laney para Big Data: “Volumen, Velocity, Variety”
(Volumen, Velocidad, Variedad)
2005
La Web 2.0 aumenta el volumen de datos.
2007
Emerge el uso actual del término “Big Data”.
2008
Globalmente, 9,57 zetabytes (9.570.000.000.000 gigabytes) de información se pro-
cesa por las CPUs del mundo. Se estima que 14,7 exabytes de información nueva
se produciría este año.
6. 6
2009
Una compañía promedio estadounidense con más de 1.000 empleados, almacena
más de 200 terabytes de datos de acuerdo al informe sobre Big Data: “The Next
Frontier for Innovation, Competition and Productivity” (La próxima frontera para la
innovación, la competencia y la productividad) realizado por McKinsey Global
Institute.
2010
Eric Schmidt, presidente ejecutivo de Google, dice en una conferencia que la canti
dad de datos que ahora se están creando cada dos días, es mayor que la creada
desde el comienzo de la civilización humana hasta el año 2003.
2011
El informe McKinsey señala que en 2018 los EE.UU. se enfrentará a un déficit de
entre 140.000 y 190.000 científicos profesionales de datos, y advierte que
cuestiones como la privacidad, la seguridad y la propiedad intelectual tendrán que
ser resueltas antes de que se den cuenta de todo el valor de Big Data.
2014
El uso de Internet móvil supera a las computadoras de escritorio por primera vez
88% de los ejecutivos que respondieron a una encuesta internacional realizada GE
dice que el análisis de grandes volúmenes de datos es una prioridad.
7. 7
BIG DATA
El Big Data o Datos Masivos se refier a sistemas
informáticos basados en la acumunlación a gran
escala de datos y de los procedimientos usados
para identificar patrones recurrentes dentro de
esos datos.
8. 8
DEFINICIÓN
Datos masivos es un término que hace referencia a una cantidad de datos tal que
supera la capacidad del software habitual para ser capturados, gestionados y
procesados en un tiempo razonable. El volumen de los datos masivos crece
constantemente. En 2012 se estimaba su tamaño de entre una docena de terabytes
hasta varios petabytes de datos en un único conjunto de datos.
CARACTERISTICAS
Se estima que cada 10 minutos se generan 5 exabites de información, la misma
cantidad de datos generados en toda la historia de la humanidad hasta 2003. Esto
quiere decir que una persona hoy ve más información en un solo día que una
persona que vivió en el año 1500 en toda su vida.
Información tan grande que no podemos administrar con facilidad, pero si lo
conseguimos se convierte en una herramienta muy poderosa para acercarse al
consumidor con acciones muy específicas.
Para entender mejor el comportamiento del Big Data debemos dividir el concepto
en el que es conocido como las 3 V’s.
Volumen. El volumen de los datos almacenados en los depósitos de las
empresas ha pasado de ocupar megabytes y gigabytes a "petabytes". Google
procesa 20 petabytes al día.
Variedad. Los datos han pasado de ser datos almacenados y estructurados,
guardados en bancos de datos empresariales, a ser desestructurados,
semiestructurados, audio, vídeo, XML, etc. Una creciente variedad de datos
necesitan ser procesados y convertidos en información.
9. 9
Velocidad. La velocidad del movimiento, proceso y captura de datos dentro
y fuera de la empresa ha aumentado significativamente. Los modelos
basados en inteligencia de negocios generalmente suelen tardar días en
procesar, frente a las necesidades analíticas casi en tiempo real de hoy en
día debido al flujo de datos a alta velocidad.
Una gran cantidad de información producida en muy poco tiempo. Ésta se
genera a través de redes sociales, correo electrónico, aplicaciones móviles,
navegación cotidiana por Internet, etcétera.
No toda la información generada es confiable, incluso hay muchas mentiras
generadas todos los días. Es necesario analizar los datos y determinar cuál
es confiable y cuál es incorrecta.
Existen dos clases de datos. Estructurados: bases de datos organizadas y
divididas de forma lógica. No Estructurados: fotografías, videos, posts,
grabaciones de audio, etcétera.
10. 10
IMPORTANCIA
Su importancia radica en que las marcas pueden desarrollar mejores campañas a
partir de los datos que los mismos usuarios comparten. El Big Data permite realizar
un análisis de entrada para determinar la relevancia de los datos y así decidir qué
datos deben incluirse en los procesos de análisis y cuáles no. El objetivo de todas
las organizaciones que gestionan grandes cantidades de datos debe ser detectar
los más relevantes y usarlos para optimizar la toma de decisiones.
EJEMPLOS REALES DEL USO INTELIGENTE DEL BIG DATA.
En los dos últimos años se ha hablado mucho de Big Data. De cómo ayuda a tomar
mejores decisiones de negocio y cómo está impactando en las organizaciones.
Precisamente para mostrar de qué forma está cambiando la forma de trabajar de
las empresas, hoy hablamos gracias al Centro de Innovación del BBVA de tres
grandes casos de éxito del BigData: cómo ajusta sus precios en tiempo real Macy’s,
el uso de estadística en los deportes y cómo ya ha impactado en las elecciones de
Estados Unidos.
11. 11
Macy’s es el perfecto ejemplo de cómo el big data puede ser más que útil a la hor
de fidelizar a los clientes de una gran compañía. Gracias al análisis que hace
de los datos que generan sus consumidores (tanto en sus grandes almacenes
como en su tienda on-line) a través de la tecnología proporcionada por el SAS
Institute, han conseguido entender cómo todos los clientes son diferentes entre sí
y muestran sus particularidades, lo que les ha permitido ahorrar hasta 500.000
euros anuales en análisis y envíos de e-mail marketing indiscriminados.
“Moneyball: rompiendo las reglas” cuenta la historia de cómo un equipo de béisbol
perdedor, pudo convertirse en uno muy diferente gracias al análisis de los datos.
La película, basada en una historia real, retoma la historia de los Oakland Athletics
en 2002 y cómo el gerente del equipo, Billy Beane, ficha a un joven
economista (Peter Brand) que recurre únicamente al análisis estadístico para ela-
borar el equipo ideal, tomando para ello jugadores que en principio pasarían
desapercibidos para el mejor de los ojeadores. Si bien finalmente no consiguen
ganar la final, el equipo se queda a un paso de conseguirlo.
Coca Cola: Coca Cola no solo usa el Big Data para
saber más sobre los consumidores o para saber lo
que ellos dicen a su alrededor acerca de la marca,
también lo usa para desarrollar nuevos productos que
no dependen únicamente de ellos. Coca Cola ha
diseñado un algoritmo que le permite producir zumo
12. 12
de naranja que combina diferentes factores como el tiempo en dicho momento, las
presiones, las preferencias en cada región.
Otro motivo del trabajo conjunto de Coca Cola y el Big Data es que, dado que el
principal objetivo de la empresa es vender, sabiendo aprovechar correctamente los
datos, se incrementarán dichas ventas ya que se podrá optimizar el comportamiento
de los usuarios orientado a la compra.
Mercedes-Benz Next (Big Data en la calle)
¿Cuántas veces te ha pasado eso de ir con
el coche de camino al trabajo por la mañana
y que empiecen a decir por la radio los
típicos atascos de hora punta? ¿O irte de
vacaciones y que justo haya obras? Bueno,
lo normal es que por la radio se digan los
principales tramos conflictivos pero no todos, por eso Mercedes se ha dado cuenta
de lo importante qué es saber lo que pasa en la carretera y han desarrollado un
sistema que va informando gracias a la tecnología GPS.
Nestlé ¿Alguna vez has pensado lo grande que puede ser una marca como Nestlé?
Cuánta gente trabaja en ella, cuántas fábricas tiene, en cuántos países está… Si te
dijera los números seguramente se quedarían cortos. Pero
no solo eso afecta al Big Data en una empresa como
Nestlé. Desde la crisis de Kit Kat que tuvo lugar en 2010,
Nestlé ha aprendido muchísimo. Cuando tuvo lugar dicha
crisis la empresa no contestó a ninguno de los mensajes
13. 13
que se generaron a través de sus redes sociales, ni tampoco a los e-mails y hasta
borró algunos de los vídeos que se colgaron en Youtube durante la polémica.
VENTAJAS.
Mejora de la eficiencia y los costes:
El análisis del Big Data puede acelerar la velocidad con que se desarrolla un
producto. También permite compartir datos de forma rápida y realizar simulaciones
de producto. En algunos sectores, los plazos de desarrollo se han llegado a reducir
entre el 30% y el 50%.
Mejora de la gestión empresarial:
Además de optimizar la cadena de suministro y elinventario, el Big Data puede ser
útil para reducir el ciclo de conversión de efectivo, controlarfactores de riesgo y
tomar decisiones empresariales que pueden virar el futuro de la empresa
fundamentadas en datos recogidos en tiempo real.
Almacenamiento en la nube:
Uno de los problemas para gestionar altos volúmenes de datoses el elevado
costode la infraestructura de almacenamiento. Muchos proveedores
dealmacenamiento masivo de datos alquilan potentes servidores a losque se puede
acceder enlínea, y ponen a disposición del cliente como solución almacenarlos en
una especie de nube. Elresultado es que se puede acceder a ella mediante
apliaciones diseñadas para manejargrandes volúmenes de datos y sepueden
obtener soluciones a menudo en tiempo real de forma sencilla.
14. 14
Otros usos de BIG DATA.
Big Data contra el crimen.
El análisis y cruce de datos de la actividad delictiva en Londres se utiliza
para orientar la actuación de la policía antes de que estos se cometan, analizando
las tendencias clave y poniendo mayor énfasis en vigila aquellas zonas de más
riesgo. Por ejemplo, gracias a una aplicación con la que manejan los datos son
capaces de saber con un 68% de probabilidad si en una zona concreta se van a
producir más de 5 crímenes al mes.
Big Data para ofrecer ofertas personalizadas.
La empresa T-Mobile de telecomunicación redujo su número de portabilidades
hasta un 50% analizando los datos de quejas y conversaciones en redes sociales
de sus clientes, lo cual les llevó a conocer a cada cliente hasta el punto de asignarle
a cada uno de ellos un valor en función de sus expectativas de negocio y
permanencia. De esta manera se enviaban ofertas especiales para cada cliente con
tal de ofrecerle lo que necesitara específicamente antes de abandonar la compañía.
Big Data para ayudar al cliente.
La empresa de comercios minoristas Wal-
Mart ha incrementado la conversión de sus
visitas en la web en un 10%desde la utilización
de análisis semántico de texto en el buscador
de su página. El entendimiento de los datos que
da el cliente permite ofrecer resultados más
relevantes que solucionan sus necesidades.
15. 15
CONCLUSIÓN
Durante esta investigación pudimos analizar todo sobre la Big data, así como sus
características y funcionamiento, se trató de explicar lo mejor posible para que
hubiese quedado de una manera más comprensible. La Big data es inmensa y con
el paso de años será más y más grande cada vez, que viva la información y a darle
un buen uso.