SlideShare ist ein Scribd-Unternehmen logo
1 von 44
Hablemos de Big Data Analytics: hablemos de negocios
BDS Somos científicos de datos 
• Business Data Scientists (BDS) se enfoca en monetizar el valor oculto en los datos del negocio, 
descubriendo patrones relevantes a través de modelos de análisis avanzado que identifican planes de 
acción concretos para resolver los retos competitivos de sus clientes. 
• Nace en 2009 con la marca Logyt Discovery, cambiando de marca en 2014 a Business Data Scientists 
para reflejar su enfoque en la ciencia de datos. 
• A través de la aplicación disciplinada de metodologías y prácticas propietarias diseñadas para mantener 
el enfoque en los retos de negocio, sus procesos de integración de datos y de modelación analítica 
permiten desarrollar nuevas reglas de negocio que se despliegan y operan capturando/monetizando el 
valor descubierto en los datos internos y externos de la organización. 
• Ayudamos a nuestros clientes a: 
• Minimizar el tiempo/costo de obtención del dato relevante (información suficiente y económicamente 
disponible) 
• Optimizar la conversión dato-conocimiento 
• Maximizar la tasa de conversión dato-dinero 
• Convertir conocimiento estratégico
No somos revendedores de Software, 
Aunque algunas veces creamos software para una solución específica de 
nuestros clientes 
No somos revendedores de Hardware, 
Aunque hemos y somos capaces de integrar o ser integrados en 
soluciones completas de datos y Analytics con: 
EMC2/Pivotal, HP/HAVeN, IBM/Netezza 
¿Qué no somos? 
3
Big Data: Volumen, Variedad y Velocidad 
Capturistas 
Usuarios 
Máquinas 
4 
Social Media 
Internet of Things
Big Data no tiene sentido sin analytics 
Las tres “V”: grandes volúmenes de información, de 
varios tipos y fuentes, que se acumulan muy 
velozmente 
Permiten descubrir patrones a aprovechar con 
beneficios medibles 
Híper-abundancia de información= escasez de 
atención o de enfoque. Incluso parálisis 
Se requieren metodologías y experiencia para 
vincular capacidades de: 
TIC y cómputo avanzado, 
Análisis estadístico y modelación matemática, 
y 
Pensamiento estratégico para transformación 
organizacional 
5 
Gap Analítico 
Competing on Analytics 
Datos 
Disponibles 
Capacidad 
de Ejecución 
Gap de 
Ejecución 
Capacidad 
de Análisis 
Big Data Era 
2020 
1980 1990 2000 2010
Diferencia entre Business Intelligence y Business Analytics 
Business Analytics (y es el sentido 
que le damos aquí a Big Data 
Analytics) se refiere a las habilidades, 
tecnologías y prácticas para la 
exploración e investigación del 
desempeño pasado de la empresa 
para ganar conocimiento y conducir la 
planeación y ejecución del negocio. 
BA se enfoca en desarrollar nuevos 
aprendizajes y entendimiento del 
negocio basado en los datos, métodos 
estadísticos y de optimización. 
En contraste, Business Intelligence 
tradicionalmente se enfoca en usar un 
conjunto consistente de métricas 
para al mismo tiempo medir el 
desempeño pasado y guiar la 
planeación del negocio. 
6 
Business 
Intelligence
Cross Industry Standard Process for Data Mining (CRISP-DM) 
Concebido en1996: 
•DaimlerChrysler 
•SPSS 
•NCR 
En ese tiempo empieza el auge por la 
minería de datos, Un modelo de proceso 
estándar para cualquier industria, no 
propietario y gratuito, cumpliría con el 
propósito. 
Un año después se crea un consorcio para 
desarrollar este proceso estándar quien en 
2 años y medio se dedicaron a desarrollar 
y refinar lo que hoy en día es el CRISP-DM. 
7
Antes de entender los datos debemos de entender el negocio 
ENTENDIMIENTO DEL NEGOCIO 
¿Para quién producimos valor? 
¿Cuál es nuestra propuesta de valor? 
¿Cómo la entregamos? 
¿Cómo la creamos? 
8
Si no sabes cuál es la pregunta no tiene caso preocuparte por el Big Data 
No sé cuál es la pregunta 
9
Antes de la respuesta necesitamos la pregunta 
No poner el caballo detrás de la 
carreta 
¿Cuál es la pregunta de negocio? 
Las preguntas de negocio se sintetizan en una 
sola: ¿cómo lograr ventaja competitiva? 
Se pueden categorizar en rentabilidad cliente 
(RC), rentabilidad de recursos (RR) y rentabilidad 
de oferta (RO). Ejemplos: 
¿Cómo seleccionar y atraer a los clientes más 
rentables? (RC) 
¿Cómo incrementar el índice de cierre de mi fuerza de 
ventas? (RR) 
¿Cómo seleccionar puntos de venta más rentables? 
(RR) 
¿Cómo seleccionar productos/servicios que 
maximicen la rentabilidad? (RO) 
¿Cómo fijar precios para mi portafolio de 
productos/servicios? (RO) 
10
Lienzo de Osterwalder: Una herramienta para entender el negocio 
El lienzo (canvas) del modelo de 
negocio de Osterwalder es una 
plantilla de gestión estratégica para 
desarrollar o documentar modelos de 
negocio. 
Es un apoyo visual con elementos 
que describen la propuesta de valor 
de la empresa, los clientes, las 
operaciones y las finanzas. 
Esta herramienta ayuda a las 
organizaciones a alinear sus 
recursos, actividades y gente 
ilustrando potenciales desventajas. 
11
¿Cuáles son los dos KPIs de tu industria? 
Banca al menudeo, ejemplos 
Cross Sale 
Attrition 
Fraude 
¿Cuáles son los dos KPIs en los que debes superar a tu 
competencia? 
¿Cuál(es) es(son) la(s) preguntas de negocio 
recurrentes? 
12
Ejercicio 
Una vez definido uno o dos KPIs generemos hipótesis: 
¿Cuáles son las cosa que influyen positivamente en ellos? 
Documentación de hipótesis 
¿Quién la emite? 
¿Cómo se priorizan? 
¿Qué datos necesitamos para contrastarlas?
ETENDIMIENTO DE LOS DATOS 
¿Existen los datos? 
¿Dónde están? 
¿Necesito más datos?
Sé cuál es la pregunta 
Sé la pregunta, 
pero no sé que datos necesito para contestarla 
Sé que datos necesito, 
pero no sé donde encontrarlos 
15
Tipos y fuentes de datos 
16 
No 
estructurado 
Investigación de mercado: 
• Cuanti 
• Cuali 
• CATI 
• Planos 
• Fotografía 
Social Media 
Estructurado 
POS 
SCM-ERP-CRM 
Call Center 
Survey Monkey/Mail Chimp 
INEGI 
Otras fuentes indirectas 
internacionales 
Interno Externo
Ejemplo de fuentes de información para un modelo de localización predictiva 
Contexto 
Infraestructura 
Punto de 
Venta 
Encuestas de 
satisfacción 
¡Más de 4,500 
17 
variables!
Contexto 
Infraestructura 
Punto de 
Venta 
Encuestas de 
satisfacción 
Foursquare 
Con nueva fuente 
¡Posibilidad de hacer 
sentiment analysis! 
18
Intergración de datos 
¿Qué datos han incluido en sus análisis? 
¿Qué datos extras necesitas incorporar para contrastar las hipótesis que has 
generado? 
19
PREPARACIÓN DE LOS 
DATOS 
¿Cómo obtengo los datos? 
¿Me sirven así? 
¿Dónde depositarlos?
Business Intelligence me permite saber qué pasa pero no necesariamente por qué 
Business Intelligence Tradicionalmente un 
sistema de business 
intelligence se diseña 
de arriba a hacia 
abajo. 
Defino que quiero 
saber, extraigo el 
dato, hago el cálculo 
lo cargo en un 
repositorio. 
21 
Reportes 
Tableros de 
Control 
Business Dataware House (BDW) 
Servidor de 
Reportes 
Alertas 
ETL ETL ETL ETL ETL 
ERP CRM HRM SCM Otros
Un Business Dataware House puede ser útil pero no indispensable 
22 
Business Analytics En un mundo ideal, la 
organización cuenta con 
un BDW en el cual existen 
los datos necesarios para 
responder la pregunta de 
negocios. 
Pocas veces sucede y si 
existe no hay el tiempo de 
respuesta requerido 
(síndrome del dueño del 
kínder). 
Los ETL son ejecutados 
manualmente a partir de 
extracciones a modo. 
Modelado con SPPS, SAS, R,… 
Archivo plano 
Queries 
ERP CRM HRM SCM Otros
El sueño es contar con un data lake 
Business Analytics Dejo de preocuparme de 
los ETLs ya que TODOS 
los datos, estructurados y 
no estructurados estarán 
disponibles en el Data 
Lake. 
La posibilidad de revelar 
relaciones relevantes 
entre los datos y no 
previamente teorizadas 
entre los datos se 
materializa. 
Data Lake 
ERP CRM HRM SCM Otros (Ver Data Lake o Data Swamp) 
23 
Modelado con SPPS, SAS, R,… 
ELT ELT ELT ELT ELT
Bases de datos en Big Data 
El Big Data empezó a estresar el desempeño en empresas como Google y Amazon 
haciéndoles evidente que las bases de datos relacionales (SQL) no satisfacían sus 
necesidades. Necesitaban mejor desempeño para atender miles de peticiones sobre 
una cantidad de datos inmensa, compleja, creciente y distribuida entre miles (millones) 
de servidores. 
Necesitaban entonces una nueva concepción de bases de datos, esto es, bases de 
datos no relacionales (NoSQL), y un nueva arquitectura (Hadhoop) para procesar 
eficientemente la información distribuida. 
24 
Bases de datos relacionales Bases de datos no relacionales 
SQL Server, MySQL, Oracle… MongoDB, CouchDB, BigTable…
A9.com, AOL, Booz Allen Hamilton, 
Eharmony, eBay, Facebook, Fox 
Interactive Media, Freebase, IBM, 
ImageShack, ISI, Joost, Last.fm, 
LinkedIn, Meebo, Metaweb, Mitula15, 
The New York Times, Ning, 
Rackspace, StumbleUpon16, Tuenti, 
Twitter, Veoh, Zoosk, 1&1, 
Mercadolibre 
¿Necesito Hadhoop? 
25
MODELACIÓN 
¿Qué técnicas de análisis 
existen? 
¿Cuáles usar? 
26
Sé cuál es la pregunta 
Sé que datos necesito para contestarla 
Sé donde encontrarlos 
Sé dónde encontrarlos, 
pero no sé como procesarlos 
27
Técnicas de análisis predictivo 
Técnicas de regresión Regresión lineal 
Series de tiempo 
Análisis de 
superviviencia 
Modelos elección 
discreta 
Logit 
Probit 
Árboles 
de 
decisión 
Machine learning Redes neuronales 
Modelación 
geoespacial 
Naïve 
Bayes 
k-nearest neighbours 
28
Aplicación de modelación predictiva en gestión de clientes 
¿Qué clientes me conviene retener? 
¿Cuál es el ciclo de vida de un cliente y cómo podemos ampliar su duración/valor? 
¿Qué clientes están por irse y cómo los retengo? 
¿Por qué han comprado y cómo lo han hecho? 
¿Qué comprarán después? 
¿Qué clientes son susceptibles de comprar más 
productos? 
29
Por su volumen de facturación 
(agrupación tradicional) 
• Poco o ningún entendimiento de motivos 
consumo. 
• No permite descubrir ciclos de vida 
• Acciones comerciales similares para 
clientes distintos y planteadas en 
escenario 
Por su comportamiento histórico (base 
para análisis predictivo) 
• Patrones de consumo claramente 
identificados y segmentados 
• Potencial de los clientes medido en 
función de su segmento, no del total 
• Ciclos de vida son evidentes por segmento 
• Acciones individualizadas y proactivas en 
función de modelos predictivos 
Descriptiva Vs Predictiva 
30
Objetivo y los modelos de segmentación 
Campañas iguales a clientes 
parecidos 
Predicción certera de: 
• Up-sale 
• Cross-sale 
• Churn 
• Default 
Cada grupo de clientes tiene que ser significativamente 
distinto que los otros 
Cada cliente dentro de un grupo debe ser significativamente 
similar con los otros miembros del grupo 
de clientes 
31
EVALUACIÓN 
¿Tiene sentido lo que he 
encontrado? 
¿Es aplicable? 
32
Sé cuál es la pregunta 
Sé que datos necesito para contestarla 
Sé donde encontrarlos 
Sé como procesarlos 
¿Tengo la respuesta adecuada? 
33
Evaluación del modelo 
No es indispensable esperar 
eventos futuros para determinar la 
precisión de nuestros modelos. 
El procedimiento cruzado nos 
permite validar con los mismos 
datos que tenemos ahora. 
34 
Datos 
(y1, x1),…(yn, xn) 
Estimación Prueba 
Datos 
entrenamiento. 
Todos los datos 
salvo (yk, xk)) 
Datos de prueba 
(yk, xk)) 
Predicción 
Repetir para cada k
Contrastación del modelo con la realidad 
35 
R2=0.92 Modelo estadístico de pronóstico 
900 
800 
700 
600 
500 
400 
300 
200 
100 
0 
0 100 200 300 400 500 600 700 800 900 
Venta mensual Real 
Mínimo de ventas 
deseado 
Venta pronosticada dada la ubicación (venta mensual promedio)
No sólo debe ser preciso, debe tener sentido económico (de negocio) 
“La producción pesquera explica muy bien 
la venta de cerveza” 
“Pon la próxima cafetería al lado de una 
agencia Bentley” 
36
DESPLIEGUE 
¿Cómo sacar valor de lo aprendido? 
37
Sé cuál es la pregunta 
Sé que datos necesito para contestarla 
Sé donde encontrarlos 
Sé como procesarlos 
Tengo la respuesta adecuada 
¿Cómo sacarle provecho 
a lo aprendido? 
38
Plan de despliegue 
¿Qué procesos de negocio 
serán modificados/implantados? 
¿Qué reglas de negocio serán 
alteradas o introducidas? 
¿En qué tecnologías será 
desplegado? 
¿Qué nuevas habilidades serán 
necesarias? 
¿Cómo manejar el cambio? 
39 
Procesos 
Tecnología 
Gente
Herramienta tecnológica de soporte a compra de calzado 
Sistema de soporte 
predictivo para la compra 
(SSPC) 
• Predice el comportamiento de 
un producto a partir de sus 
características 
• Facilita la labor de recompra 
luego de las dos primeras 
semanas de venta 
40
Modificación en el proceso de decisión inmobiliaria 
Presentación 
de ubicación 
disponible 
Definición de 
infraestructura 
Visita a campo 
y estimación 
de venta 
Caso de 
negocio a 
considerar 
41 
Búsqueda 
proactiva 
en AGEBs 
con mayor 
potencial 
Estimación 
de venta 
preliminar 
Estimación 
de venta 
final con 
certeza de 
entre el 94 
y el 96% 
Proceso 
anterior 
Modificaciones 
al proceso 
Mejora del hit rate (número de tiendas arriba del objetivo) pasó del 62% al 79%
Qué se hizó con 
42 
900 
800 
700 
600 
500 
400 
300 
200 
100 
0 
Modelo estadístico de pronóstico 
Bien ubicadas, 
mal desempeño 
0 100 200 300 400 500 600 700 800 900 
Venta mensual real 
R2=0.92 
Mala ubicación y 
mal desempeño 
Los esfuerzos 
de apoyo no 
eran rentables 
Se aplicaron 
prácticas que 
se pueden 
replicar 
Venta pronosticada dada la ubicación (venta mensual promedio) 
Mínimo de ventas 
deseado
Rueda Test and Learn 
43 
2 
Detalle 
operativo 
de la 
prueba 
3 
Diseño de 
la prueba 
4 
Ejecución y 
evaluación 
5 
Ajuste y 
reglas de 
despliegue 
1 
Crear y 
refinar 
hipótesis 
6 
Despliegue 
Adaptado de Applied Predictive 
Technologies “Test and Learn 
Wheel” 
Biblioteca 
de 
aprendizaj 
e
Big Data Analytics 
La velocidad, variedad y volumen en la que hoy se genera la información puede generar 
un reto abrumador para las empresas que deseen enriquecer su toma de decisiones y 
mejorar sus procesos a través de la analítica predictiva. 
jperezcolin@bdatascience.com 
www.bdatascience.com 
44

Weitere ähnliche Inhalte

Was ist angesagt?

Big data y la inteligencia de negocios
Big data y la inteligencia de negociosBig data y la inteligencia de negocios
Big data y la inteligencia de negocios
nnakasone
 

Was ist angesagt? (20)

Big data y Marketing digital
Big data y Marketing digitalBig data y Marketing digital
Big data y Marketing digital
 
Cómo implementar una solución Big Data
Cómo implementar una solución Big DataCómo implementar una solución Big Data
Cómo implementar una solución Big Data
 
Evolución de Herramientas de BI hacia el Entorno BigData
Evolución de Herramientas de BI hacia el Entorno BigDataEvolución de Herramientas de BI hacia el Entorno BigData
Evolución de Herramientas de BI hacia el Entorno BigData
 
Paradigmas de Procesamiento en Big Data: Arquitecturas y Tecnologías aplicadas
Paradigmas de Procesamiento en Big Data: Arquitecturas y Tecnologías aplicadasParadigmas de Procesamiento en Big Data: Arquitecturas y Tecnologías aplicadas
Paradigmas de Procesamiento en Big Data: Arquitecturas y Tecnologías aplicadas
 
Inteligencia Artificial en negocios
Inteligencia Artificial en negociosInteligencia Artificial en negocios
Inteligencia Artificial en negocios
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nube
 
Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera
 
Inteligencia artificial en las Empresas
Inteligencia artificial en las EmpresasInteligencia artificial en las Empresas
Inteligencia artificial en las Empresas
 
Cómo empezar a implementar proyectos Big Data en tu organización
Cómo empezar a implementar proyectos Big Data en tu organizaciónCómo empezar a implementar proyectos Big Data en tu organización
Cómo empezar a implementar proyectos Big Data en tu organización
 
Presentacion big data y hoteles con tecnologia Microsoft
Presentacion big data y hoteles con tecnologia MicrosoftPresentacion big data y hoteles con tecnologia Microsoft
Presentacion big data y hoteles con tecnologia Microsoft
 
Estado del arte del BI | Jornada Madrid 2014 | UOC
Estado del arte del BI | Jornada Madrid 2014 | UOCEstado del arte del BI | Jornada Madrid 2014 | UOC
Estado del arte del BI | Jornada Madrid 2014 | UOC
 
Big data y la inteligencia de negocios
Big data y la inteligencia de negociosBig data y la inteligencia de negocios
Big data y la inteligencia de negocios
 
Desmitificando un proyecto de Big Data
Desmitificando un proyecto de Big DataDesmitificando un proyecto de Big Data
Desmitificando un proyecto de Big Data
 
¿Cómo afianzar la transformación digital con APIs de datos en tiempo real?
¿Cómo afianzar la transformación digital con APIs de datos en tiempo real?¿Cómo afianzar la transformación digital con APIs de datos en tiempo real?
¿Cómo afianzar la transformación digital con APIs de datos en tiempo real?
 
CRM y Big Data: el nuevo cliente vitaminado
CRM y Big Data: el nuevo cliente vitaminadoCRM y Big Data: el nuevo cliente vitaminado
CRM y Big Data: el nuevo cliente vitaminado
 
Potenciando la data con AI para hacer predicciones
Potenciando la data con AI para hacer prediccionesPotenciando la data con AI para hacer predicciones
Potenciando la data con AI para hacer predicciones
 
Big Data: Presente o Futuro
Big Data: Presente o FuturoBig Data: Presente o Futuro
Big Data: Presente o Futuro
 
Transformación digital en Retail con Google
Transformación digital en Retail con GoogleTransformación digital en Retail con Google
Transformación digital en Retail con Google
 
Unidad 5. inteligencia de negocios
Unidad 5. inteligencia de negociosUnidad 5. inteligencia de negocios
Unidad 5. inteligencia de negocios
 
Big Data Analytics y sus implicaciones en la experiencia de usuario
Big Data Analytics y sus implicaciones en la experiencia de usuarioBig Data Analytics y sus implicaciones en la experiencia de usuario
Big Data Analytics y sus implicaciones en la experiencia de usuario
 

Andere mochten auch

Arquitectura de Sistemas de Bases de datos
Arquitectura de Sistemas de Bases de datosArquitectura de Sistemas de Bases de datos
Arquitectura de Sistemas de Bases de datos
negriz
 
Arquitectura de Datos
Arquitectura de DatosArquitectura de Datos
Arquitectura de Datos
Jazmin Glez.
 
Simplificando el uso de los datos para la era cognitiva - Daniel González
Simplificando el uso de los datos para la era cognitiva - Daniel GonzálezSimplificando el uso de los datos para la era cognitiva - Daniel González
Simplificando el uso de los datos para la era cognitiva - Daniel González
BusinessConnect2017
 

Andere mochten auch (9)

Math2015
Math2015Math2015
Math2015
 
Arquitectura de Sistemas de Bases de datos
Arquitectura de Sistemas de Bases de datosArquitectura de Sistemas de Bases de datos
Arquitectura de Sistemas de Bases de datos
 
The Modern Data Architecture for Advanced Business Intelligence with Hortonwo...
The Modern Data Architecture for Advanced Business Intelligence with Hortonwo...The Modern Data Architecture for Advanced Business Intelligence with Hortonwo...
The Modern Data Architecture for Advanced Business Intelligence with Hortonwo...
 
Arquitectura de Datos
Arquitectura de DatosArquitectura de Datos
Arquitectura de Datos
 
The Value of the Modern Data Architecture with Apache Hadoop and Teradata
The Value of the Modern Data Architecture with Apache Hadoop and Teradata The Value of the Modern Data Architecture with Apache Hadoop and Teradata
The Value of the Modern Data Architecture with Apache Hadoop and Teradata
 
Modern Data Architecture
Modern Data ArchitectureModern Data Architecture
Modern Data Architecture
 
Creating a Modern Data Architecture for Digital Transformation
Creating a Modern Data Architecture for Digital TransformationCreating a Modern Data Architecture for Digital Transformation
Creating a Modern Data Architecture for Digital Transformation
 
Simplificando el uso de los datos para la era cognitiva - Daniel González
Simplificando el uso de los datos para la era cognitiva - Daniel GonzálezSimplificando el uso de los datos para la era cognitiva - Daniel González
Simplificando el uso de los datos para la era cognitiva - Daniel González
 
Big data ppt
Big  data pptBig  data ppt
Big data ppt
 

Ähnlich wie Hablemos de Big Data

Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
perezparga
 
inteligencia de_negocios
inteligencia de_negociosinteligencia de_negocios
inteligencia de_negocios
Edgar Barrios
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
Jorch Mendez
 
Taller De Inteligencia De Negocios
Taller De Inteligencia De NegociosTaller De Inteligencia De Negocios
Taller De Inteligencia De Negocios
romangm
 
Taller De Inteligencia De Negocios
Taller De Inteligencia De NegociosTaller De Inteligencia De Negocios
Taller De Inteligencia De Negocios
UJAP
 

Ähnlich wie Hablemos de Big Data (20)

Big data aplicado el negocio CRISP-DM
Big data aplicado el negocio CRISP-DMBig data aplicado el negocio CRISP-DM
Big data aplicado el negocio CRISP-DM
 
CLASE_1_INTRODUCCION_A_LA_INTELIGENCIA_D.pptx
CLASE_1_INTRODUCCION_A_LA_INTELIGENCIA_D.pptxCLASE_1_INTRODUCCION_A_LA_INTELIGENCIA_D.pptx
CLASE_1_INTRODUCCION_A_LA_INTELIGENCIA_D.pptx
 
Inteligencia de Negocios
Inteligencia de NegociosInteligencia de Negocios
Inteligencia de Negocios
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
inteligencia de_negocios
inteligencia de_negociosinteligencia de_negocios
inteligencia de_negocios
 
Introducción al Business Intelligence y al Big Data
Introducción al Business Intelligence y al Big DataIntroducción al Business Intelligence y al Big Data
Introducción al Business Intelligence y al Big Data
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
 
Taller De Inteligencia De Negocios
Taller De Inteligencia De NegociosTaller De Inteligencia De Negocios
Taller De Inteligencia De Negocios
 
Taller De Inteligencia De Negocios
Taller De Inteligencia De NegociosTaller De Inteligencia De Negocios
Taller De Inteligencia De Negocios
 
Curso : Inteligencia de Negocios - Dia1
Curso : Inteligencia de Negocios - Dia1Curso : Inteligencia de Negocios - Dia1
Curso : Inteligencia de Negocios - Dia1
 
introduccion aministracion industrial con inteligencia de negocios
introduccion aministracion industrial con inteligencia de negociosintroduccion aministracion industrial con inteligencia de negocios
introduccion aministracion industrial con inteligencia de negocios
 
Introduccion BI
Introduccion BIIntroduccion BI
Introduccion BI
 
Sesión 1- Inteligencia de Negocios como herramienta empresarial pptx
Sesión 1- Inteligencia de Negocios como herramienta empresarial pptxSesión 1- Inteligencia de Negocios como herramienta empresarial pptx
Sesión 1- Inteligencia de Negocios como herramienta empresarial pptx
 
Aplicaciones difusas:Introducción a BI
Aplicaciones difusas:Introducción a  BIAplicaciones difusas:Introducción a  BI
Aplicaciones difusas:Introducción a BI
 
Aporte de los datos a la analítica en la transformación digital - (Mariano Mu...
Aporte de los datos a la analítica en la transformación digital - (Mariano Mu...Aporte de los datos a la analítica en la transformación digital - (Mariano Mu...
Aporte de los datos a la analítica en la transformación digital - (Mariano Mu...
 
Actividad 1
Actividad 1Actividad 1
Actividad 1
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big Data
 
Business Intelligence.pptx
Business Intelligence.pptxBusiness Intelligence.pptx
Business Intelligence.pptx
 
Business Intelligence.pptx
Business Intelligence.pptxBusiness Intelligence.pptx
Business Intelligence.pptx
 

Mehr von Business Data Scientists

Mehr von Business Data Scientists (13)

Design Thinking y Agile para SOFOM
Design Thinking y Agile para SOFOMDesign Thinking y Agile para SOFOM
Design Thinking y Agile para SOFOM
 
T shape skills
T shape skillsT shape skills
T shape skills
 
Taller Modelo de negocio
Taller Modelo de negocio Taller Modelo de negocio
Taller Modelo de negocio
 
Machine Learning tendencia en los mercados
Machine Learning tendencia en los mercadosMachine Learning tendencia en los mercados
Machine Learning tendencia en los mercados
 
Economía Nacional Retrovisión y Perspectivas a CP
Economía Nacional Retrovisión y Perspectivas a CPEconomía Nacional Retrovisión y Perspectivas a CP
Economía Nacional Retrovisión y Perspectivas a CP
 
Ley de Benford
Ley de BenfordLey de Benford
Ley de Benford
 
Big Data Analytics for Auditing
Big Data Analytics for AuditingBig Data Analytics for Auditing
Big Data Analytics for Auditing
 
Predictive analytics- customer management
Predictive analytics- customer managementPredictive analytics- customer management
Predictive analytics- customer management
 
Sesión alto desempeño CATMAN 2012 CONMEXICO
Sesión alto desempeño CATMAN 2012 CONMEXICOSesión alto desempeño CATMAN 2012 CONMEXICO
Sesión alto desempeño CATMAN 2012 CONMEXICO
 
CIO Green IT 2011
CIO Green IT 2011CIO Green IT 2011
CIO Green IT 2011
 
Category management mexico 2011
Category management mexico 2011Category management mexico 2011
Category management mexico 2011
 
Alineación de conceptos CRM
Alineación de conceptos CRMAlineación de conceptos CRM
Alineación de conceptos CRM
 
TI commodity o estratégico
TI commodity o estratégicoTI commodity o estratégico
TI commodity o estratégico
 

Kürzlich hochgeladen

Kürzlich hochgeladen (20)

presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitectura
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdfINFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajal
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 

Hablemos de Big Data

  • 1. Hablemos de Big Data Analytics: hablemos de negocios
  • 2. BDS Somos científicos de datos • Business Data Scientists (BDS) se enfoca en monetizar el valor oculto en los datos del negocio, descubriendo patrones relevantes a través de modelos de análisis avanzado que identifican planes de acción concretos para resolver los retos competitivos de sus clientes. • Nace en 2009 con la marca Logyt Discovery, cambiando de marca en 2014 a Business Data Scientists para reflejar su enfoque en la ciencia de datos. • A través de la aplicación disciplinada de metodologías y prácticas propietarias diseñadas para mantener el enfoque en los retos de negocio, sus procesos de integración de datos y de modelación analítica permiten desarrollar nuevas reglas de negocio que se despliegan y operan capturando/monetizando el valor descubierto en los datos internos y externos de la organización. • Ayudamos a nuestros clientes a: • Minimizar el tiempo/costo de obtención del dato relevante (información suficiente y económicamente disponible) • Optimizar la conversión dato-conocimiento • Maximizar la tasa de conversión dato-dinero • Convertir conocimiento estratégico
  • 3. No somos revendedores de Software, Aunque algunas veces creamos software para una solución específica de nuestros clientes No somos revendedores de Hardware, Aunque hemos y somos capaces de integrar o ser integrados en soluciones completas de datos y Analytics con: EMC2/Pivotal, HP/HAVeN, IBM/Netezza ¿Qué no somos? 3
  • 4. Big Data: Volumen, Variedad y Velocidad Capturistas Usuarios Máquinas 4 Social Media Internet of Things
  • 5. Big Data no tiene sentido sin analytics Las tres “V”: grandes volúmenes de información, de varios tipos y fuentes, que se acumulan muy velozmente Permiten descubrir patrones a aprovechar con beneficios medibles Híper-abundancia de información= escasez de atención o de enfoque. Incluso parálisis Se requieren metodologías y experiencia para vincular capacidades de: TIC y cómputo avanzado, Análisis estadístico y modelación matemática, y Pensamiento estratégico para transformación organizacional 5 Gap Analítico Competing on Analytics Datos Disponibles Capacidad de Ejecución Gap de Ejecución Capacidad de Análisis Big Data Era 2020 1980 1990 2000 2010
  • 6. Diferencia entre Business Intelligence y Business Analytics Business Analytics (y es el sentido que le damos aquí a Big Data Analytics) se refiere a las habilidades, tecnologías y prácticas para la exploración e investigación del desempeño pasado de la empresa para ganar conocimiento y conducir la planeación y ejecución del negocio. BA se enfoca en desarrollar nuevos aprendizajes y entendimiento del negocio basado en los datos, métodos estadísticos y de optimización. En contraste, Business Intelligence tradicionalmente se enfoca en usar un conjunto consistente de métricas para al mismo tiempo medir el desempeño pasado y guiar la planeación del negocio. 6 Business Intelligence
  • 7. Cross Industry Standard Process for Data Mining (CRISP-DM) Concebido en1996: •DaimlerChrysler •SPSS •NCR En ese tiempo empieza el auge por la minería de datos, Un modelo de proceso estándar para cualquier industria, no propietario y gratuito, cumpliría con el propósito. Un año después se crea un consorcio para desarrollar este proceso estándar quien en 2 años y medio se dedicaron a desarrollar y refinar lo que hoy en día es el CRISP-DM. 7
  • 8. Antes de entender los datos debemos de entender el negocio ENTENDIMIENTO DEL NEGOCIO ¿Para quién producimos valor? ¿Cuál es nuestra propuesta de valor? ¿Cómo la entregamos? ¿Cómo la creamos? 8
  • 9. Si no sabes cuál es la pregunta no tiene caso preocuparte por el Big Data No sé cuál es la pregunta 9
  • 10. Antes de la respuesta necesitamos la pregunta No poner el caballo detrás de la carreta ¿Cuál es la pregunta de negocio? Las preguntas de negocio se sintetizan en una sola: ¿cómo lograr ventaja competitiva? Se pueden categorizar en rentabilidad cliente (RC), rentabilidad de recursos (RR) y rentabilidad de oferta (RO). Ejemplos: ¿Cómo seleccionar y atraer a los clientes más rentables? (RC) ¿Cómo incrementar el índice de cierre de mi fuerza de ventas? (RR) ¿Cómo seleccionar puntos de venta más rentables? (RR) ¿Cómo seleccionar productos/servicios que maximicen la rentabilidad? (RO) ¿Cómo fijar precios para mi portafolio de productos/servicios? (RO) 10
  • 11. Lienzo de Osterwalder: Una herramienta para entender el negocio El lienzo (canvas) del modelo de negocio de Osterwalder es una plantilla de gestión estratégica para desarrollar o documentar modelos de negocio. Es un apoyo visual con elementos que describen la propuesta de valor de la empresa, los clientes, las operaciones y las finanzas. Esta herramienta ayuda a las organizaciones a alinear sus recursos, actividades y gente ilustrando potenciales desventajas. 11
  • 12. ¿Cuáles son los dos KPIs de tu industria? Banca al menudeo, ejemplos Cross Sale Attrition Fraude ¿Cuáles son los dos KPIs en los que debes superar a tu competencia? ¿Cuál(es) es(son) la(s) preguntas de negocio recurrentes? 12
  • 13. Ejercicio Una vez definido uno o dos KPIs generemos hipótesis: ¿Cuáles son las cosa que influyen positivamente en ellos? Documentación de hipótesis ¿Quién la emite? ¿Cómo se priorizan? ¿Qué datos necesitamos para contrastarlas?
  • 14. ETENDIMIENTO DE LOS DATOS ¿Existen los datos? ¿Dónde están? ¿Necesito más datos?
  • 15. Sé cuál es la pregunta Sé la pregunta, pero no sé que datos necesito para contestarla Sé que datos necesito, pero no sé donde encontrarlos 15
  • 16. Tipos y fuentes de datos 16 No estructurado Investigación de mercado: • Cuanti • Cuali • CATI • Planos • Fotografía Social Media Estructurado POS SCM-ERP-CRM Call Center Survey Monkey/Mail Chimp INEGI Otras fuentes indirectas internacionales Interno Externo
  • 17. Ejemplo de fuentes de información para un modelo de localización predictiva Contexto Infraestructura Punto de Venta Encuestas de satisfacción ¡Más de 4,500 17 variables!
  • 18. Contexto Infraestructura Punto de Venta Encuestas de satisfacción Foursquare Con nueva fuente ¡Posibilidad de hacer sentiment analysis! 18
  • 19. Intergración de datos ¿Qué datos han incluido en sus análisis? ¿Qué datos extras necesitas incorporar para contrastar las hipótesis que has generado? 19
  • 20. PREPARACIÓN DE LOS DATOS ¿Cómo obtengo los datos? ¿Me sirven así? ¿Dónde depositarlos?
  • 21. Business Intelligence me permite saber qué pasa pero no necesariamente por qué Business Intelligence Tradicionalmente un sistema de business intelligence se diseña de arriba a hacia abajo. Defino que quiero saber, extraigo el dato, hago el cálculo lo cargo en un repositorio. 21 Reportes Tableros de Control Business Dataware House (BDW) Servidor de Reportes Alertas ETL ETL ETL ETL ETL ERP CRM HRM SCM Otros
  • 22. Un Business Dataware House puede ser útil pero no indispensable 22 Business Analytics En un mundo ideal, la organización cuenta con un BDW en el cual existen los datos necesarios para responder la pregunta de negocios. Pocas veces sucede y si existe no hay el tiempo de respuesta requerido (síndrome del dueño del kínder). Los ETL son ejecutados manualmente a partir de extracciones a modo. Modelado con SPPS, SAS, R,… Archivo plano Queries ERP CRM HRM SCM Otros
  • 23. El sueño es contar con un data lake Business Analytics Dejo de preocuparme de los ETLs ya que TODOS los datos, estructurados y no estructurados estarán disponibles en el Data Lake. La posibilidad de revelar relaciones relevantes entre los datos y no previamente teorizadas entre los datos se materializa. Data Lake ERP CRM HRM SCM Otros (Ver Data Lake o Data Swamp) 23 Modelado con SPPS, SAS, R,… ELT ELT ELT ELT ELT
  • 24. Bases de datos en Big Data El Big Data empezó a estresar el desempeño en empresas como Google y Amazon haciéndoles evidente que las bases de datos relacionales (SQL) no satisfacían sus necesidades. Necesitaban mejor desempeño para atender miles de peticiones sobre una cantidad de datos inmensa, compleja, creciente y distribuida entre miles (millones) de servidores. Necesitaban entonces una nueva concepción de bases de datos, esto es, bases de datos no relacionales (NoSQL), y un nueva arquitectura (Hadhoop) para procesar eficientemente la información distribuida. 24 Bases de datos relacionales Bases de datos no relacionales SQL Server, MySQL, Oracle… MongoDB, CouchDB, BigTable…
  • 25. A9.com, AOL, Booz Allen Hamilton, Eharmony, eBay, Facebook, Fox Interactive Media, Freebase, IBM, ImageShack, ISI, Joost, Last.fm, LinkedIn, Meebo, Metaweb, Mitula15, The New York Times, Ning, Rackspace, StumbleUpon16, Tuenti, Twitter, Veoh, Zoosk, 1&1, Mercadolibre ¿Necesito Hadhoop? 25
  • 26. MODELACIÓN ¿Qué técnicas de análisis existen? ¿Cuáles usar? 26
  • 27. Sé cuál es la pregunta Sé que datos necesito para contestarla Sé donde encontrarlos Sé dónde encontrarlos, pero no sé como procesarlos 27
  • 28. Técnicas de análisis predictivo Técnicas de regresión Regresión lineal Series de tiempo Análisis de superviviencia Modelos elección discreta Logit Probit Árboles de decisión Machine learning Redes neuronales Modelación geoespacial Naïve Bayes k-nearest neighbours 28
  • 29. Aplicación de modelación predictiva en gestión de clientes ¿Qué clientes me conviene retener? ¿Cuál es el ciclo de vida de un cliente y cómo podemos ampliar su duración/valor? ¿Qué clientes están por irse y cómo los retengo? ¿Por qué han comprado y cómo lo han hecho? ¿Qué comprarán después? ¿Qué clientes son susceptibles de comprar más productos? 29
  • 30. Por su volumen de facturación (agrupación tradicional) • Poco o ningún entendimiento de motivos consumo. • No permite descubrir ciclos de vida • Acciones comerciales similares para clientes distintos y planteadas en escenario Por su comportamiento histórico (base para análisis predictivo) • Patrones de consumo claramente identificados y segmentados • Potencial de los clientes medido en función de su segmento, no del total • Ciclos de vida son evidentes por segmento • Acciones individualizadas y proactivas en función de modelos predictivos Descriptiva Vs Predictiva 30
  • 31. Objetivo y los modelos de segmentación Campañas iguales a clientes parecidos Predicción certera de: • Up-sale • Cross-sale • Churn • Default Cada grupo de clientes tiene que ser significativamente distinto que los otros Cada cliente dentro de un grupo debe ser significativamente similar con los otros miembros del grupo de clientes 31
  • 32. EVALUACIÓN ¿Tiene sentido lo que he encontrado? ¿Es aplicable? 32
  • 33. Sé cuál es la pregunta Sé que datos necesito para contestarla Sé donde encontrarlos Sé como procesarlos ¿Tengo la respuesta adecuada? 33
  • 34. Evaluación del modelo No es indispensable esperar eventos futuros para determinar la precisión de nuestros modelos. El procedimiento cruzado nos permite validar con los mismos datos que tenemos ahora. 34 Datos (y1, x1),…(yn, xn) Estimación Prueba Datos entrenamiento. Todos los datos salvo (yk, xk)) Datos de prueba (yk, xk)) Predicción Repetir para cada k
  • 35. Contrastación del modelo con la realidad 35 R2=0.92 Modelo estadístico de pronóstico 900 800 700 600 500 400 300 200 100 0 0 100 200 300 400 500 600 700 800 900 Venta mensual Real Mínimo de ventas deseado Venta pronosticada dada la ubicación (venta mensual promedio)
  • 36. No sólo debe ser preciso, debe tener sentido económico (de negocio) “La producción pesquera explica muy bien la venta de cerveza” “Pon la próxima cafetería al lado de una agencia Bentley” 36
  • 37. DESPLIEGUE ¿Cómo sacar valor de lo aprendido? 37
  • 38. Sé cuál es la pregunta Sé que datos necesito para contestarla Sé donde encontrarlos Sé como procesarlos Tengo la respuesta adecuada ¿Cómo sacarle provecho a lo aprendido? 38
  • 39. Plan de despliegue ¿Qué procesos de negocio serán modificados/implantados? ¿Qué reglas de negocio serán alteradas o introducidas? ¿En qué tecnologías será desplegado? ¿Qué nuevas habilidades serán necesarias? ¿Cómo manejar el cambio? 39 Procesos Tecnología Gente
  • 40. Herramienta tecnológica de soporte a compra de calzado Sistema de soporte predictivo para la compra (SSPC) • Predice el comportamiento de un producto a partir de sus características • Facilita la labor de recompra luego de las dos primeras semanas de venta 40
  • 41. Modificación en el proceso de decisión inmobiliaria Presentación de ubicación disponible Definición de infraestructura Visita a campo y estimación de venta Caso de negocio a considerar 41 Búsqueda proactiva en AGEBs con mayor potencial Estimación de venta preliminar Estimación de venta final con certeza de entre el 94 y el 96% Proceso anterior Modificaciones al proceso Mejora del hit rate (número de tiendas arriba del objetivo) pasó del 62% al 79%
  • 42. Qué se hizó con 42 900 800 700 600 500 400 300 200 100 0 Modelo estadístico de pronóstico Bien ubicadas, mal desempeño 0 100 200 300 400 500 600 700 800 900 Venta mensual real R2=0.92 Mala ubicación y mal desempeño Los esfuerzos de apoyo no eran rentables Se aplicaron prácticas que se pueden replicar Venta pronosticada dada la ubicación (venta mensual promedio) Mínimo de ventas deseado
  • 43. Rueda Test and Learn 43 2 Detalle operativo de la prueba 3 Diseño de la prueba 4 Ejecución y evaluación 5 Ajuste y reglas de despliegue 1 Crear y refinar hipótesis 6 Despliegue Adaptado de Applied Predictive Technologies “Test and Learn Wheel” Biblioteca de aprendizaj e
  • 44. Big Data Analytics La velocidad, variedad y volumen en la que hoy se genera la información puede generar un reto abrumador para las empresas que deseen enriquecer su toma de decisiones y mejorar sus procesos a través de la analítica predictiva. jperezcolin@bdatascience.com www.bdatascience.com 44

Hinweis der Redaktion

  1. Soy un economista, tecnólogo y académico centrado en ayudar a las empresas, los ejecutivos y los empresarios a hacer frente a retos de negocio a través estrategias pragmáticas de análisis y operación. Hoy soy socio de Business Data Scientists (BDS) empresa dedicada a invertir y desarrollar en empresas especializadas en Big Data Analytics en la región. Las empresas de BDS se enfoca en ayudar a sus clientes en obtener beneficios económicos de la información oculta en los datos de las empresas a través de metodologías y tecnologías de la ciencia de datos. Nuestros clientes son empresas globales de bienes de consumo envasados ​​(CPG), empresas en los sectores de telecomunicaciones y finanzas, entre otras. Soy consejero editorial de la revista InformationWeek México. He colaborado con la revista en el diseño y la ejecución del premio 50 Empresas más Innovadoras. También soy miembro fundador de la Asociación de Gestión de Desarrollo de Productos de México PDMA y consejero independiente de la empresa Praxis. He dado consultoría a Oracle y Microsoft ayudándoles a entender y servir mejor a sus clientes clave, a través de prácticas de alineación estratégica de las tecnologías de información a los negocios.. Fui coordinador del Centro de Estudios Económicos de la Universidad de las Américas -Puebla. Había sido profesor visitante de Dirección de Tecnología de Información en el PAD Escuela de Negocios, Perú e INALDE Business School, Colombia . Sostuve la posición de CIO del IPADE Business Shool y fui profesor de Entorno Económico de la misma escuela durante 3 años. Hoy soy profesor en el Master en Internet Business (MIB ) del ISDI, una red académica y profesional para las empresas digitales en México y España.
  2. El crecimiento exponencial en la generación de datos se puede explicar en el surgimiento sucesivo de tres generadores de datos: Desde la entrada de los mainframes (granes computadoras centrales) a las empresas y hasta la popularización del cómputo personal (inclusive) los generadores de datos fueron predominantemente capturistas Con la entrada de la web, acelerado por el Web 2.0 y potenciado por el cómputo móvil, son los datos que generan los usuarios los de mayor crecimiento Ahora las máquinas empiezan a hablar con otras máquinas, lo que producirá muchos más datos de los que podremos almacenar y analizar Un exabyte es una unidad de medida de almacenamiento de datos cuyo símbolo es el 'EB', equivale a 1018 bytes 1 EB = 103 Petabyte (PB) = 106 Terabyte (TB) 15 TB es el contenido total de la Biblioteca del Congreso de los Estados Unidos. Fuentes: Wikipedia; Data, data everywhere: A special report on managing information, The Economist 27 de febrero 2010; Patrick Schwerdtfeger What is Big Data? Big Data Explained (Hadoop & MapReduce)
  3. Retos: Aprovechar inversiones en infraestructura de TI Integrar fuentes distintas de datos del negocio para tomar decisiones equilibradas Dar sentido estratégico a los esfuerzos de recolección, análisis y aplicación de datos Maximizar la conversión de estos esfuerzos en rentabilidad: monetizar el valor de los datos del negocio
  4. Business Analytics (BA) hace uso extensivo e intensivo de datos, análisis estadístico y cuantitativo y modelaje explicativo y predictivo. Por lo tanto está más relacionado con la ciencia administrativa. La analítica se usa tanto como insumo para las decisiones humanas o para ser usada en procesos automatizados. Business Intelligence es consulta (querying), On-line Analytical Processing (OLAP), reporteo, y alertas. En otras palabras, querying, reporteo, OLAP y las herramientas de alertas pueden contestar preguntas como qué es lo que pasó, cuánto, qué tan frecuente, dónde está el problema y qué acciones son necesarias. BA puede contestar preguntas como por qué esta pasando, qué si estas tendencias continúan, qué es lo que puede pasar después (esto es, predecir) y qué es lo mejor que puede pasar (esto es, optimizar).
  5. CRISP-DM , de Cross Industry Standard Process for Data Mining. Se trata de un modelo de proceso de minería de datos que describe los enfoques comunes que utilizan los expertos en minería de datos. Encuestas realizadas en 2002, 2004 y 2007 muestran que es la principal metodología utilizada para esta tarea. El único otro estándar de data mining nombrado en estas encuestas era el SEMMA. No obstante, 3-4 veces más personas reportaron optar por CRISP-DM. Una revisión y crítica de los modelos de minería de datos en 2009 llamó a CRISP-DM el "estándar de facto para el desarrollo de la minería de datos y los proyectos de descubrimiento de conocimiento“. CRISP-DM divide el proceso de minería de datos en seis fases principales Las flechas en el diagrama indican las dependencias más importantes y frecuentes entre fases. El círculo exterior en el diagrama simboliza la naturaleza cíclica de la minería de datos en sí. Un proceso de minería de datos continua después del despliegue de una solución. Las lecciones aprendidas durante el proceso pueden provocar nuevas preguntas de negocio, a menudo más centradas y posteriores procesos de minería de datos se beneficiarán de la experiencia de los anteriores. Fuente:ibm.com
  6. Acrónimos de abajo hacia arriba: ERP. Los sistemas de planificación de recursos empresariales, o ERP (por sus siglas en inglés, Enterprise Resource Planning) son sistemas de información gerenciales que integran y manejan muchos de los negocios asociados con las operaciones de producción y de los aspectos de distribución de una compañía en la producción de bienes o servicios. CRM. Software para la administración de la relación con los clientes o CRM(por sus siglas en inglés, Customer Resource Management). Sistemas informáticos de apoyo a la gestión de las relaciones con los clientes, en el mercadeo, la venta y el servicio post-venta. HRM. Los sistemas de gestión de recursos humanos, o HRM (por sus siglas en inglés, Human Resource Management) son los sistemas de información que integran y gestionan la atracción, selección, capacitación, remuneración y retención del capital humano. SCM. La administración de redes de suministro (en inglés, Supply chain management, SCM) es el sistema que gestiona el proceso de planificación, puesta en ejecución y control de las operaciones de la red de suministro con el propósito de satisfacer las necesidades del cliente con tanta eficacia como sea posible. ETL. Extract, Transform and Load (Extraer, transformar y cargar en castellano, frecuentemente abreviado a ETL) es el proceso que permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio. Business Intelligence. Se denomina inteligencia empresarial, inteligencia de negocios o BI (del inglés business intelligence) al conjunto de estrategias y llaves enfocadas a la administración y administración de conocimiento sobre el medio, a través del procesamiento de los datos existentes en una organización o empresa. Fuente: Wikipedia
  7. Según algunas estimaciones, Google puede contar a la fecha con más de 2 millones de servidores alrededor del mundo. El número oficial es un secreto industrial. SQL no es el tipo de bases de datos, en este caso relacionales. SQL se refiere a una de las maneras en las que se accede a los datos en bases de datos relacionales. SQL no es usado para bases de datos no relacionales, por eso se sí se usa indistintamente NoSQL para llamar a las bases de datos no relacionales. Apache Hadoop es un framework de software que soporta aplicaciones distribuidas bajo una licencia libre.[1] Permite a las aplicaciones trabajar con miles de nodos y petabytes de datos. Hadoop se inspiró en los documentos Google para MapReduce y Google File System (GFS). Fuentes: http://slashdot.org/topic/bi/sql-vs-nosql-which-is-better/ http://es.wikipedia.org/wiki/Hadoop
  8. Muy probablemente tu empresa no necesita Hadhoop o bases de datos no relacionales. Y lo más importante: no es indispensable para Analytics.
  9. http://web.anglia.ac.uk/numbers/graphsCharts.html
  10. Problema. Empresa líder de venta al menudeo de zapatos tenis pierde consistentemente margen bruto debido mala predicción de la rotación de modelos no resurtibles que lo lleva a perder ventas por pedir de menos o hacer descuentos por pedir de más. Solución. Modelo predictivo para: Sistema de soporte predictivo de compra (SSPC) (mostrado en la lámina) Modelo de sembrado (assortment por tienda) Modelo de descuentos y regreso a Centro de Distribución Modelo de predicción de ventas Índice de éxito de las tiendas Tecnología y procesos analíticos: Se extrajeron los datos de SAP R/3 mediante querys de SQL Server para generar tablas planas CSV al máximo nivel de detalle, se cargaron y prepararon en Netezza y se analizaron en SPSS a diferentes niveles dependiendo del análisis y modelación requerido. Cross Industry Standard Process for Data Mining (CRISP-DM). Modelos de series de tiempo, modelos multiplicativos de desestacionalización, modelo multivariado de árbol de decisión y regresiones lineales múltiples. IBM SPSS, IBM Netezza, MS Visual Basic y MS Excel Beneficios: Aumento en poder de negociación sobre Nike y Puma. Predicciones con más del 90% de certeza. Mejora de margen bruto
  11. Problema. En una gran cadena de cafeterías no se estaba llegando al objetivo de negocio (hit rate) en un porcentaje relevante de ubicaciones. Solución. Modelo de localización predictiva y nuevo proceso inmobiliario al incorporar los resultados del modelo. El proceso inmobiliario era totalmente reactivo, esto es, esperaban que los profesionales inmobiliarios trajeran a la mesa locales disponibles con el inherente conflicto de intereses (el buscador decía que era una muy buena ubicación). En el nuevo proceso se establece un listado ordenado (de mayor venta potencial a menor) de Áreas Geostadísticas Básicas sobre el que se solicita a los profesionales inmobiliarios a hacer la búsqueda. El modelo genera un pronóstico de ventas son más de 94% de certeza. El nuevo proceso incorpora no sólo la demanda disponible sino la venta esperada de acuerdo a la infraestructura. Beneficio. El modelo mejoró en casis 17 puntos porcentuales el hit ratedesplegar mejorando la certeza del caso de negocio al mejorar el pronóstico de ventas hasta alcanzar más del 94%. Área Geoestadística Básica (AGEB). Subdivisión de los municipios o delegaciones que conforman el país, utilizada por primera vez en el X Censo General de Población y Vivienda 1980. Su utilidad radica en permitir la formación de unidades primarias de muestreo y la organización de la información estadística. Tiene tres atributos fundamentales: a) es perfectamente reconocible en el terreno por estar delimitada por rasgos topográficos identificables y perdurables; b) por lo general es homogénea en cuanto a sus características geográficas, económicas y sociales; c) su extensión es tal que puede ser recorrida por una sola persona. Las AGEB se clasifican en más y menos urbanizadas, dependiendo de su densidad de viviendas.