Actualmente las organizaciones vienen manejado sus estrategias comerciales en base a la información depositada en sus bases de datos operacionales, sin embargo estos datos, por lo frío que son, no indican si estas interacciones con el cliente guarda un nivel de afinidad o de satisfacción, actualmente los clientes utilizan las redes sociales para transmitir este sentimiento al mundo, esta nueva fuente de información, sumadas a otras como audios, videos, e imágenes son los nuevos medios de expresión de los clientes y las organizaciones deberán tener la capacidad de almacenar, gestionar y analizar esta ingente cantidad de datos, de naturaleza muy diversa y que se transmite a grandes velocidades, en esto se fundamenta el Big Data Analytics.
11. #ExperienciaAnalítica2015
Servicios
Financieros
Predecir comportamiento
de cliente.
PLA, identificar fraudes
360° vista del Cliente
Estudio de las colas largas
de actividad de
transacciones.
Análisis de los logs de
datos para auditoría interna
y cumplimiento.
Sistemas de
recomendación
Análisis de Entidades
Muchas áreas de oportunidad
13. #ExperienciaAnalítica2015
Big Data se define como el conjunto de
herramientas informáticas destinadas a la
manipulación, gestión y análisis de grandes
volúmenes de datos de todo tipo los cuales no
pueden ser gestionados por las herramientas
informáticas tradicionales.
BIG DATA
16. #ExperienciaAnalítica2015
Hadoop es un sistema de
código abierto que se utiliza
para almacenar, procesar y
analizar grandes volúmenes
de datos
Hadoop es capaz de
almacenar toda clase de
datos: estructurados, no
estructurados,
semiestructurados; archivos
de registro, imágenes, video,
audio, comunicación, etc.
¿Qué es HADOOP?
Gestión Inteligente con Analítica 17
17. #ExperienciaAnalítica2015
Sistema de fichero
distribuido, escalabilidad
y disponibilidad debido a
la replicación de los
datos y tolerancia a
fallos.
Arquitectura:
Gestión Inteligente con Analítica 18
Proceso batch creado
para el proceso distribuido
de los datos. Permite
paralelizar el trabajo sobre
los grandes volúmenes de
datos.
18. #ExperienciaAnalítica2015
Arquitectura de Hadoop
Gestión Inteligente con Analítica 19
Query es enviado
al nodo master
Nodo Master usa el
proceso “Map” para
asignar los sub-job a los
nodos esclavos
Nodos Esclavos pueden
aun asignar a otros nodos
esclavos
Los sub-job son ejecutados
en paralelo en cada nodo en
los cluster contra los datos en
los nodos locales
Los esclavos completan su
trabajo y devuelven los
resultados al nodo maestro
El nodo maestro
“ensambla” los resultados
usan el proceso “Reduce”
Usuario envía un
query via una
interface/aplicación
Datos es dividido
y almacenado en
HDFS
Datos en HDFS
es distribuido en
numerosos
nodos (sistema
tolerante a fallos)
HDFS tiene un
nodo maestro y
numerosos
nodos esclavos
Nodo Maestro
almacena el meta
dato y nodos
esclavos los
bloques de datos
Nodo Maestro y
nodos esclavos/datos
residen en sevidores
commodity
Cada nodo/servidor
ofrece
almacenamiento y
procesamiento local
Social
Feeds
GIS Data
Imagenes
Social
Feeds
World
Events
Document
s, XML
Email,
otros no-
estr.
Logs
Auditoria
Market
Events
Web logs
Data
Fields,
RFID
CCTV
Footage
Name Node &
Job Tracker
(master)
20. ¿Qué es Big Data Analytics?
Gestión Inteligente con Analítica 21
21. #ExperienciaAnalítica2015
Big data analytics is the process of examining big data to
uncover hidden patterns, unknown correlations and other useful
information that can be used to make better decisions.
With big data analytics, data scientists and others can analyze
huge volumes of data that conventional analytics and business
intelligence solutions can't touch.
Big Data Analytics
Gestión Inteligente con Analítica 22
30. #ExperienciaAnalítica2015
¿Cómo se puede aplicar?
• Fraude
• Reclamaciones de seguros
• Solicitud de prestamos
• Cobro de cheque en ventanillas
• Reclutamiento e investigación
• Contratación de funcionarios.
• Investigación de declaraciones.
• Calidad de datos
• Unificación de la cartera de clientes
31. #ExperienciaAnalítica2015
De esa forma…
Mr. Joseph Carbella
55 Church Street
New York, NY 10007
Tel#: 212-693-5312
DOB: 07/08/66
SID#: 068588345
DL#: 544 210 836
ACCT # 2310322
DDA
Registros
Civiles Dep.
32. #ExperienciaAnalítica2015
Mr. Joseph Carbella
55 Church Street
New York, NY 10007
Tel#: 212-693-5312
DOB: 07/08/66
SID#: 068588345
DL#: 544 210 836
ACCT # 2310322
DDA
Mr. Joe Jones
APT 4909
Bethesda, MD 20814
Tel#: 978-365-6631
DOB: 09/07/66
TRUST FUND
Mr. Joe Carbello
1 Bourne St
Clinton MA 01510
TEL#: 978-365-6631
DL#: 544 210 836
DOB: 07/09/66
ACCT #3292322
CREDIT CARDS
Mr. Joey Carbello
555 Church Ave
New York, NY 10070
Tel#: 212-693-5312
DL#: 544 210 836
PPN#: 086588345
ACCT #494202
MORTGAGE Coincidencia Cercana
Coincidencia Exacta
De esa forma…
Registros
Civiles Dep.
Registros
Públicos
Ente
Recaudador
Seguro Social
34. #ExperienciaAnalítica2015
EA les permitirá…
Personas, Asociaciones
políticas, empresas.
Se pueden agregar nuevas
entidades y características
IBM SPSS Única tecnología
comercial de este tipo que
se puede desplegar el
mismo día que se instala.
En Resumen…
36. #ExperienciaAnalítica2015
BI /
Reporting
BI /
Reporting
Exploration /
Visualization
Functional
App
Industry
App
Predictive
Analytics
Content
Analytics
Analytic Applications
IBM Big Data Platform
Systems
Management
Application
Development
Visualization
& Discovery
Accelerators
Information Integration, Data Quality &
Governance
Hadoop
System
Stream
Computing
Data
Warehouse
Volume, Variety
Cost-effectively
process and analyze
any type of data
Velocity
Analyze data-in-motion
to produce insights in
micro-seconds
Visibility
Understand, find, and
navigate federated big
data
Volume
Purpose-built offerings
High-performance
appliances and software
Veracity
Trusted information
Parallel processing for
high-volume integration
Analytics
Analyze, predict and
automate for more
accurate answers
Estrategia de IBM Big Data
37. #ExperienciaAnalítica2015
BI /
Reporting
BI /
Reporting
Exploration /
Visualization
Functional
App
Industry
App
Predictive
Analytics
Content
Analytics
Analytic Applications
IBM Big Data Platform
Systems
Management
Application
Development
Visualization
& Discovery
Accelerators
Information Integration, Data Quality &
Governance
Hadoop
System
Stream
Computing
Master Data Management
Databases & Tools
Data
Warehouse
IBM proporciona una plataforma complete para soportar esta evolución.
Visualization
& Discovery
Hadoop
System
Volume, Variety
• InfoSphere BigInsights
• Pure Data for Hadoop
Velocity
• InfoSphere Streams
Visibility
InfoSphere Data Explorer
Data
Warehouse
Volume
• Pure Data for Analytics
• DB2 BLU
• InfoSphere Warehouse
Veracity
• IBM InfoSphere
Information Server
• Data Quality
Analytics
• Cognos BI (in-memory)
• Cognos Real-Time
• SPSS Modeler
• SPSS Analytic Server
• Social Media Analytics
41. #ExperienciaAnalítica2015
IBM SPSS Collaboration & Deployment
(C&D)
Gestión Inteligente con Analítica 42
▪ Colaborativo
– Comparte y almacene rutas,
modelos o resultados.
– Trabajar con multiples fuentes
de datos (históricas y en
tiempo real)
Automatizado
– Programe modelos analíticos
basado en tiempo o eventos
– Controle procesos analiticos y
auditelos.
– Actualice y reconstruya
modelos para asegurar el
rendimiento.
Despligue
– Implemente analitica con sus
procesos de negocios
– Calificación en tiempo real o
por lotes
42. #ExperienciaAnalítica2015
• Permite aprovechar los datos almacenados en Hadoop
mediante el uso de IBM SPSS Modeler, permitiendo
capacidades de Big Data Analytics.
• Proporciona:
• Soporte para las diversas distribuciones de Hadoop
(InfoSphereBigInsigths, Cloudera, Hortonsworks y Apache)
• Interface que permite incorporar algoritmos estadísticos
diseñados para ir a los datos.
• Una interface familiar que oculta el entorno de big data para
que el analista se enfoque en analizar los datos.
• Una solución escalable a problemas de casi cualquier tamaño.
IBM SPSS Analytic Server
43. #ExperienciaAnalítica2015
IBM SPSS Analytic Server
Gestión Inteligente con Analítica 44
Big Data
Request
Stream File
Modeler Client Modeler Server
IBM SPSS Modeler
IBM SPSS
Analytic Server
Hadoop Job
Analytics
IBM InfoSphere BigInsights
& Other Hadoop Distributions
Relational Database
SQL / UDF
IBM SPSS Analytic Catalyst
Analytic Catalyst
Browser Client
Analytic Catalyst
Tablet Client
44. #ExperienciaAnalítica2015
• Proporciona una plataforma analítica predictiva integrada
y accesible que fue diseñada para big data.
• Distribución de procesamiento analítico en ambientes de
Hadoop con soporte para IBM InfoSphere BigInsights,
Cloudera, Hortonworks y Apache
• Permite a los usuarios acceder a data estructurada y no
estructurada (RDBMS, Hadoop, social media, etc).
IBM SPSS Modeler y Analytic Server
Gestión Inteligente con Analítica 45
47. #ExperienciaAnalítica2015
• Necesidad:
• Evitar los casos de fraude mediante
una aplicación que pueda hacerlo en
tiempo real.
• Manejan información a través de PC,
teléfonos como medios de pago en
miles de sitios web.
• Poder predecir donde podría suceder
fraude antes que…en alguno de los
90MM de navegadores conectados al
sitio en un día dado.
• Situación Actual:
• PayPal maneja filtros de administración de
fraudes: revisión por su monto, origen u
otros factores.
• PayPal (y Amazon) desarrollaron
herramientas que dependen de grandes
conjuntos de datos (IP, información del
navegador, y demás datos técnicos para
refinar los modelos para predecir, identificar
y prevenir actividades fraudulentas.
48. #ExperienciaAnalítica2015
• Firma global de servicios
financieros
estadounidense, sede New
York.
• 42 países, + 1300 oficinas,
+ 60K empleados.
• Corporaciones
multinacionales,
gobiernos, instituciones
financieras y particulares.
• + US$ 300MM en activos
• Hadoop desde 2010
• Usan Hadoop para rastrear toda su
web y bases de datos en busca de
registros que indiquen la posibilidad
de que aparezca cualquier
problema…Los problemas se
descubren en tiempo real y se
dispone de la trazabilidad completa
sobre: quien hizo que, cómo, cuándo
y qué causo el problema.
• Morgan Stanley Smith Barney
(MSSB), creada 2009 y gestiona 1.7
trillones de dólares en activos para
los 4M de clientes.
• Recomienda sus inversiones en
acciones, bonos, y renta fija.
• Informes de analistas, datos públicos y
sociales.
• Todo se emplea en recomendaciones
de comprar y vender accione sobre la
base de las posiciones en tiempo real y
las condiciones del mercado.