SlideShare ist ein Scribd-Unternehmen logo
1 von 87
Downloaden Sie, um offline zu lesen
METODOS CUANTITATIVOS
EDA :: Dejad que la DATA hable.
John Tukey.
1.915 – 2.000
1.977
EDA para...

Sugerir hipótesis respecto a las causas
de un fenómeno observado.

Apoyar (mejorar) la selección de
herramientas y técnicas estadísticas a
usar.

Mejorar la recolección de datos.
Kit EDA-Tukey

Lápices de cuatro colores

Papel milimetrado.
ELEMENTOS
DEL ANALISIS
DE DATOS
1. Presentación gráfica de los datos.
2. Permitir diferentes puntos de vista
de la data.
3. Búsqueda de simplicidad
La fase exploratoria del análisis de los datos
va ANTES de la fase confirmatoria.
El mundo es complejo,
dinámico,
multidimensional.
El papel es estático y
plano.
¿Cómo vamos a
representar la rica
experiencia visual del
mundo en la simple
planicie?”
Edward Tufte
1.942
Francis Anscombe
1.918 – 2.001
TECNICAS
PARA
EXPLORAR
DATOS
Evaluación de Servicio
Calificación de servicio de 197
asesores de ventas de Zona C
(Colombia, Venezuela, Ecuador y Perú). 2.014
Calificación de servicio de 197
asesores de ventas de Zona C
(Colombia, Venezuela, Ecuador y Perú). 2.014
TABLA
CallificaciónServicio
Concesionarios
CalificaciónServicio
Concesionarios
mínimo
máximo
CallificaciónServicio
Concesionarios
mínimo
máximo
Trujillo 1-PER
47,8
Callao 2-PER 83,3
CalificaciónServicio
Concesionarios
Caracas 2-VEN
CalificaciónServicio
Concesionarios
Callao 2-PER
83,3
Trujillo 1-PER
47,8
MINIMO
MAXIMO
MEDIANA
Caracas 2-VEN
Concesionarios
)
Barranquilla 2-COL
64,7
CallificaciónServicios
Concesionarios
)
Barranquilla 2-COL
64,7
CallificaciónServicios
PRIMER
CUARTIL
CalificaciónServicio
Concesionarios
Guayaquil 2-ECU
CalificaciónServicio
Concesionarios
Guayaquil 2-ECU
TERCER
CUARTIL
5 NUMEROS CLAVES
MINIMO
MAXIMO
MEDIANA
PRIMER
CUARTIL
TERCER
CUARTIL
CalificaciónServicio
mínimo
máximo
primer cuartil
mediana
tercer cuartil
Callao 2-PER
Guayaquil 2-ECU
Caracas 2-VEN
Barranquilla 2-COL
Trujillo 1-PER
BOX PLOT
47,8
64,7
73,2
76,7
83,3
¿Cuál boxplot refleja mejor la data representada
en los siguientes 5 números?
Mínimo: 62 Primer cuartil: 66.25 Mediana 72,
Tercer cuartil: 75.50 y Máximo: 89
58 71 80 23 62
67 82 71 62 82
82 72 63 65
Calificación de Servicio en concesionarios
Colombia – Mayo 2.015
23
58
62
62
63
65
67
71
71
72
80
82
82
82
STEM AND LEAF DISPLAY
Calificación Servicio – Renault Colombia
Mayo 2.015
Calificación Servicio – Renault Colombia
Mayo 2.015
SCATTER PLOT MATRIX
% %
%
Desempleo, Crecimiento PIB y Confianza Empresarial
2.007 – 2.014
TALLER
Edades grupo
Box Plot en excel
Este bloque superior desaparece igual que se hizo con el segundo bloque (de abajo hacia
arriba): Quitar border, relleno y en “barras de error-más opciones”: Menos y %100
EDA :: Dejad que la DATA hable.
Jorge Eduardo Ardila – Sonia Ardila
@datelligence - @soniaardila1
jea@datelligence.com – sap@datelligence.com
Análisis Explotatorio de Datos: Dejad que la data hable.

Weitere ähnliche Inhalte

Andere mochten auch

Que es la encuadernacion
Que es la encuadernacionQue es la encuadernacion
Que es la encuadernacionxAmaya159
 
-El comienzo del final-
-El comienzo del final--El comienzo del final-
-El comienzo del final-Mica Ibañez
 
acceso a la uni
acceso a la uniacceso a la uni
acceso a la uniangelafcr
 
Adrian astete flores 8696 4
Adrian astete flores 8696 4Adrian astete flores 8696 4
Adrian astete flores 8696 4Adrian Astete
 
Diapositivas de tics
Diapositivas de ticsDiapositivas de tics
Diapositivas de ticsEvelin Rincon
 
Presentación tema 3
Presentación tema 3Presentación tema 3
Presentación tema 3mariolagbm
 
Perifericos de entrada y salida de datos
Perifericos de entrada y salida de datosPerifericos de entrada y salida de datos
Perifericos de entrada y salida de datossebasariel
 
Productos y servicios
Productos y serviciosProductos y servicios
Productos y serviciosmilokiller1
 
Segunda parcial jose gomez
Segunda parcial jose gomezSegunda parcial jose gomez
Segunda parcial jose gomezJose Gomez
 
Diferencias entre blog y wiki
Diferencias entre blog y wikiDiferencias entre blog y wiki
Diferencias entre blog y wikiCarol&Lina
 
JAIME DANIEL GOMEZ
JAIME DANIEL GOMEZJAIME DANIEL GOMEZ
JAIME DANIEL GOMEZjaimar06
 
Tatiana power point
Tatiana power pointTatiana power point
Tatiana power point7921955
 

Andere mochten auch (20)

Que es la encuadernacion
Que es la encuadernacionQue es la encuadernacion
Que es la encuadernacion
 
Revista digital
Revista digitalRevista digital
Revista digital
 
Presentacion
PresentacionPresentacion
Presentacion
 
-El comienzo del final-
-El comienzo del final--El comienzo del final-
-El comienzo del final-
 
acceso a la uni
acceso a la uniacceso a la uni
acceso a la uni
 
Adrian astete flores 8696 4
Adrian astete flores 8696 4Adrian astete flores 8696 4
Adrian astete flores 8696 4
 
Exc2
Exc2Exc2
Exc2
 
Brasil
BrasilBrasil
Brasil
 
Diapositivas de tics
Diapositivas de ticsDiapositivas de tics
Diapositivas de tics
 
Presentación tema 3
Presentación tema 3Presentación tema 3
Presentación tema 3
 
Perifericos de entrada y salida de datos
Perifericos de entrada y salida de datosPerifericos de entrada y salida de datos
Perifericos de entrada y salida de datos
 
#22 Del
#22 Del#22 Del
#22 Del
 
Productos y servicios
Productos y serviciosProductos y servicios
Productos y servicios
 
Retencion en la fuente
Retencion en la fuenteRetencion en la fuente
Retencion en la fuente
 
Segunda parcial jose gomez
Segunda parcial jose gomezSegunda parcial jose gomez
Segunda parcial jose gomez
 
Diferencias entre blog y wiki
Diferencias entre blog y wikiDiferencias entre blog y wiki
Diferencias entre blog y wiki
 
Rafael orozco
Rafael orozcoRafael orozco
Rafael orozco
 
JAIME DANIEL GOMEZ
JAIME DANIEL GOMEZJAIME DANIEL GOMEZ
JAIME DANIEL GOMEZ
 
Tatiana power point
Tatiana power pointTatiana power point
Tatiana power point
 
E-Catalogue
E-CatalogueE-Catalogue
E-Catalogue
 

Mehr von Big Data Colombia

An introduction to deep reinforcement learning
An introduction to deep reinforcement learningAn introduction to deep reinforcement learning
An introduction to deep reinforcement learningBig Data Colombia
 
Machine learning applied in health
Machine learning applied in healthMachine learning applied in health
Machine learning applied in healthBig Data Colombia
 
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern Recognition
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern RecognitionWhose Balance Sheet is this? Neural Networks for Banks’ Pattern Recognition
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern RecognitionBig Data Colombia
 
Analysis of your own Facebook friends’ data structure through graphs
Analysis of your own Facebook friends’ data structure through graphsAnalysis of your own Facebook friends’ data structure through graphs
Analysis of your own Facebook friends’ data structure through graphsBig Data Colombia
 
Lo datos cuentan su historia
Lo datos cuentan su historiaLo datos cuentan su historia
Lo datos cuentan su historiaBig Data Colombia
 
Entornos Naturalmente Inteligentes
Entornos Naturalmente InteligentesEntornos Naturalmente Inteligentes
Entornos Naturalmente InteligentesBig Data Colombia
 
Modelamiento predictivo y medicina
Modelamiento predictivo y medicinaModelamiento predictivo y medicina
Modelamiento predictivo y medicinaBig Data Colombia
 
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al Mes
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al MesAyudando a los Viajeros usando 500 millones de Reseñas Hoteleras al Mes
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al MesBig Data Colombia
 
Deep learning: el renacimiento de las redes neuronales
Deep learning: el renacimiento de las redes neuronalesDeep learning: el renacimiento de las redes neuronales
Deep learning: el renacimiento de las redes neuronalesBig Data Colombia
 
Cloud computing: Trends and Challenges
Cloud computing: Trends and ChallengesCloud computing: Trends and Challenges
Cloud computing: Trends and ChallengesBig Data Colombia
 
Kaggle: Coupon Purchase Prediction
Kaggle: Coupon Purchase PredictionKaggle: Coupon Purchase Prediction
Kaggle: Coupon Purchase PredictionBig Data Colombia
 
Introducción al Datawarehousing
Introducción al DatawarehousingIntroducción al Datawarehousing
Introducción al DatawarehousingBig Data Colombia
 
Salud, dinero, amor y big data
Salud, dinero, amor y big dataSalud, dinero, amor y big data
Salud, dinero, amor y big dataBig Data Colombia
 
Business Analytics: ¡La culpa es del BIG data!
Business Analytics: ¡La culpa es del BIG data!Business Analytics: ¡La culpa es del BIG data!
Business Analytics: ¡La culpa es del BIG data!Big Data Colombia
 

Mehr von Big Data Colombia (19)

An introduction to deep reinforcement learning
An introduction to deep reinforcement learningAn introduction to deep reinforcement learning
An introduction to deep reinforcement learning
 
Machine learning applied in health
Machine learning applied in healthMachine learning applied in health
Machine learning applied in health
 
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern Recognition
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern RecognitionWhose Balance Sheet is this? Neural Networks for Banks’ Pattern Recognition
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern Recognition
 
Analysis of your own Facebook friends’ data structure through graphs
Analysis of your own Facebook friends’ data structure through graphsAnalysis of your own Facebook friends’ data structure through graphs
Analysis of your own Facebook friends’ data structure through graphs
 
Lo datos cuentan su historia
Lo datos cuentan su historiaLo datos cuentan su historia
Lo datos cuentan su historia
 
Entornos Naturalmente Inteligentes
Entornos Naturalmente InteligentesEntornos Naturalmente Inteligentes
Entornos Naturalmente Inteligentes
 
Modelamiento predictivo y medicina
Modelamiento predictivo y medicinaModelamiento predictivo y medicina
Modelamiento predictivo y medicina
 
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al Mes
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al MesAyudando a los Viajeros usando 500 millones de Reseñas Hoteleras al Mes
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al Mes
 
Deep learning: el renacimiento de las redes neuronales
Deep learning: el renacimiento de las redes neuronalesDeep learning: el renacimiento de las redes neuronales
Deep learning: el renacimiento de las redes neuronales
 
IPython & Jupyter
IPython & JupyterIPython & Jupyter
IPython & Jupyter
 
Cloud computing: Trends and Challenges
Cloud computing: Trends and ChallengesCloud computing: Trends and Challenges
Cloud computing: Trends and Challenges
 
Kaggle: Coupon Purchase Prediction
Kaggle: Coupon Purchase PredictionKaggle: Coupon Purchase Prediction
Kaggle: Coupon Purchase Prediction
 
Machine learning y Kaggle
Machine learning y KaggleMachine learning y Kaggle
Machine learning y Kaggle
 
Fraud Analytics
Fraud AnalyticsFraud Analytics
Fraud Analytics
 
Data crunching con Spark
Data crunching con SparkData crunching con Spark
Data crunching con Spark
 
Introducción al Datawarehousing
Introducción al DatawarehousingIntroducción al Datawarehousing
Introducción al Datawarehousing
 
Big Data para mortales
Big Data para mortalesBig Data para mortales
Big Data para mortales
 
Salud, dinero, amor y big data
Salud, dinero, amor y big dataSalud, dinero, amor y big data
Salud, dinero, amor y big data
 
Business Analytics: ¡La culpa es del BIG data!
Business Analytics: ¡La culpa es del BIG data!Business Analytics: ¡La culpa es del BIG data!
Business Analytics: ¡La culpa es del BIG data!
 

Kürzlich hochgeladen

Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfJulian Lamprea
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 

Kürzlich hochgeladen (10)

Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 

Análisis Explotatorio de Datos: Dejad que la data hable.