SlideShare una empresa de Scribd logo
1 de 9
CURSO DE VISUALIZACIÓN DE
DATOS Y STORYTELLING
PRÁCTICA: Aplicando la Ciencia de Datos en una
organización.
ALUMNO: Manuel Alejandro Godoy Rodríguez
ÍNDICE
INTRODUCCIÓN..................................................................................................................................3
CLASIFICACIÓN DE LOS ARCHIVOS (DATA SETS)....................................................................................3
DATOS RELEVANTES DE LOS DATA SETS ...............................................................................................3
ANÁLISIS DE DATOS DE LA LIBRERÍA IZTACCIHUATL: RATINGS Y RECOMENDACIONES .........................4
ANÁLISIS DE DATOS DE LOS LIBROS MÁS VENDIDOS EN 2010 ............................................................5
COMPARACIÓN DE DATOS DE LA LIBRERÍA IZTACCIHUATL Y LIBROS MÁS VENDIDOS ..........................6
PREDICCIONES PARA LA TOMA DE DECISIONES ....................................................................................8
CONCLUSIONES..................................................................................................................................9
INTRODUCCIÓN
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido desarrollar
un proyecto basado en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez
desarrollarunamejorestrategiaenla tomadedecisiones. Paraellosecuentanconlossiguientesarchivos:
 El archivo “books” contiene los datos generales de cada libro existente en la librería y además
menciona el promedio de clasificación de cada libro de acuerdo,a las votaciones y compras del
cliente.
 El archivo “top_books” contiene el top 20 de los libros más vendidos, de acuerdo, a una
clasificación general.
 El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del sitio
web de la librería.
 El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio
web sobre libros para leer.
CLASIFICACIÓN DE LOS ARCHIVOS (DATA SETS)
Revisando el contenido de los archivos, se observa que proceden de dos sets de datos distintos:
1. El inventario de la librería Iztaccihuatl (books.csv), así como los ratings (ratings.csv) y
recomendaciones de su sitio web (to_read.csv).
2. Un listadogeneral (top_books.csv) de los20 librosmás vendidosporgénero.No se especificala
procedenciade estelistado,perodado queconcentramásde 23millonesdeventas yquealgunos
títulosnose encuentranenelinventariode lalibreríaIztaccihuatl,se asumeque esunareferencia
externa.
DATOS RELEVANTES DE LOS DATA SETS
El setde datos de lalibreríaIztaccihuatl nocontiene datosde ventas.Laretroalimentaciónde losclientes
con laque se cuentasonlosratingsylacantidadde recomendacionesenel sitioweb.Se proponegraficar
un scatter chart para determinar si hay una correlación entre los libros más recomendados y los libros
mejor evaluados.
El listado general de librosmás vendidos sí incluye estadísticas de ventas globales,por lo cual se puede
obtener la composición estática (pie chart) de los siguientes datos para el 2010 (año de generación del
archivo):
 Las ventassegúnlaclasificacióndelproducto,paraconocerquécategoríacuentaconmayores
ventas.
 Las ventas de acuerdo con el año de publicación del libro, para determinar si el año de
publicación está correlacionado con altas ventas.
ANÁLISIS DE DATOS DE LA LIBRERÍA IZTACCIHUATL: RATINGS Y RECOMENDACIONES
Como se comentó previamente,la retroalimentaciónde los clientes de la librería Iztaccihuatl que están
disponibles son los ratings y la cantidad de recomendaciones en el sitio web. Una primera pregunta es
determinar si hay una correlación entre la cantidad de recomendaciones y el valor de las calificaciones
(ratings) otorgadas. Para ello podemos graficar los pares de cantidad de recomendaciones y ratings de
cada libro en un scatter chart:
GRÁFICA 1. – Correlación entre libros mejor evaluados y libros más recomendados.
Tenemosentonces811 puntosgraficadosenunplanocartesiano,endonde eleje X corresponde al rating
promedio y el eje Y a la cantidad de recomendaciones del sitio. De acuerdo con esta gráfica podemos
establecer 3 rangos:
 Los libros con un rating de 2.8 a 3.39 se encuentran en un margen de 1 a 137
recomendaciones.
 Los libroscon 3.4 a 4.19 cuentan con 1 a 1352 recomendaciones,aunque lagranmayoría de
estos libros no pasan de 400 recomendaciones.
 Los librosconunrankingsuperiora4.2 cuentanconmayor probabilidadde tenermásde 600
recomendaciones, especialmente aquellos con un ranking superior a 4.42.
Tanto el rango inferior (<3.39) como el rango superior (>4.2) pueden ayudar a predecir de manera
temprana la cantidad de recomendaciones -pocas o muchas- que tendrá un libro enel sitio. En el rango
de 3.4 a 4.19 hay mayor incertidumbre.
ANÁLISIS DE DATOS DE LOS LIBROS MÁS VENDIDOS EN 2010
Revisando el archivo “top books”, podemos agrupar los libros más vendidos de acuerdo con su
clasificación.El siguiente pie chart agrupa lasventas(entérminosmonetarios,node unidadesvendidas)
según su clasificación. Podemos identificar 5 categorías que concentran más del 75% de las ventas
incluidas en el set de datos:
 Ficción Literaria y General
 Crimen, Thriller y Aventura
 Comida y Bebida
 Ficción Juvenil
 Autobiografía: las artes
GRÁFICA 2. – Libros más vendidos de acuerdo con su clasificación.
También se puede graficar un pie chart de acuerdo con el año de publicación, para determinar el
porcentaje de libros más vendidos que han sido publicados recientemente:
GRÁFICA 3. – Libros más vendidos de acuerdo con su año de publicación
De acuerdocon estas dosgráficas,podemosobservarque hay 5 categorías que concentranmás del 75%
de lasventas,yque un80% de las ventascorrespondenalibrospublicadosen2010, esdecir,librosrecién
publicados en el momento de generar la estadística.
COMPARACIÓN DE DATOS DE LA LIBRERÍA IZTACCIHUATL Y LIBROS MÁS VENDIDOS
Desafortunadamente losdatosdel inventariode Iztaccihuatl no incluyendatosdel númerode ventasola
categoría a la que pertenecen los libros, sin embargo, es posible tomar los libros más populares
(considerando la cantidad de recomendaciones y el rating) e investigar a qué categoría pertenecen.
Para este ejercicio,se propone multiplicarlacantidad de recomendacionesporel rating promedio,para
calcular un índice de popularidad. Con este índice se pueden seleccionar los 40 libros más populares,
asignarles una clasificación de acuerdo con las categorías de “top_books” y comparar los resultados:
TABLA 1. – Libros más populares en el inventario de la librería Iztaccihuatl
Tomando los 40 libros con mayor popularidad (cantidad de recomendaciones x rating promedio) y
agrupándolos de acuerdo con su clasificación (género) encontramos que un 87% de los libros más
populares pertenecen a las siguientes categorías:
 Ciencia ficción y fantasía.
 Ficción juvenil.
 Ficción literaria y general.
GRÁFICA 4. – Libros más populares por género en la librería Iztaccihuatl
De estas3categorías,dosde ellastambiénregistranaltasventasde acuerdoconel listadode “top_books”
de 2010: Ficción Juvenil y Ficción Literaria y General.
PREDICCIONES PARA LA TOMA DE DECISIONES
De acuerdo con los hallazgos antes mencionados, es posible predecir que:
1. Loslibrosconunratingmenora3.4 tendránpocasrecomendacionesenelsitioweb.Sinembargo,
es necesario determinar si esto se refleja también en pocas ventas.
2. Los libros con un rating mayor a 4.42 cuentan con altas probabilidades de tener muchas
recomendacionesenel sitioweb.De igual manera,esnecesariodeterminarsi estaalta cantidad
de recomendaciones se refleja en muchas ventas, el cual es un dato que no aparece en el
inventario de Iztaccihuatl.
3. De acuerdo con los datos de “top_books”, hay 3 categorías con alto volumen de ventas que no
figuranentre lasmáspopularesdel sitiowebde Iztaccihuatl.Esmuyposible que estascategorías
representenunafuenteimportantede ingresos, porlocual la libreríadeberíaconsiderarlaspara
su próxima planeación de inventarios, ventas y publicidad:
o Crimen, Thriller y Aventura
o Comida y Bebida
o Autobiografía: las artes
4. También de acuerdo con los datos de “top_books”, los libros más vendidos son aquellos recién
editados,porlo que la libreríaIztaccihuatl puede tomaren cuentaeste dato para su planeación,
especialmente paralibrosenlas categorías identificadascomomás popularesdentrode su sitio
web, y las categorías más vendidas de acuerdo al listado global de “top book”.
CONCLUSIONES
De acuerdo con los datos podemos observar que las categorías más populares de la librería Iztaccihuatl
representan a un público joven, ya que un 87% de los libros más populares se clasifican dentro de:
 Ciencia ficción y fantasía.
 Ficción juvenil.
 Ficción literaria y general.
Dado que estosdatos estánrelacionadoscon lasrecomendacionesdel sitioweb,esnormal que algunas
categorías, especialmente la ciencia ficción, estén sobrerrepresentadas, por lo cual es necesario que la
libreríaIztaccihuatl comience aregistrarcomo se traducenestosratings y recomendacionesenventas,e
incluso trate de capitalizar este interés, a través de publicidad, descuentos, o alguna otra estrategia
comercial.
Por otrolado,de acuerdo con losdatosdel archivo“topbooks”,hayotrascategorías que generanunalto
volumende ventasy que no figuranentre los librosmáspopularesdel sitiode la libreríaIztaccihuatl ,las
cuales son:
 Crimen, Thriller y Aventura
 Comida y Bebida
 Autobiografía: las artes
EstascategoríasrepresentanunaoportunidadparaIztaccihuatl,quepodríaofrecerunaselecciónde libros
reciénpublicados, que sonlosque más altasventas registrande acuerdo con el archivo de “top_books”,
y medir el éxitoque tengan,para así buscar ampliar su mercado, más allá de los lectores jóvenes. Esta
selección puede ser tan amplia o reducida como se quiera, dependiendo del nivel de riesgo que sea
aceptable para la librería.
En resumen,lalibreríaIztaccihuatl tiene dosoportunidadesenpuerta.Una enlo que se refiere asu base
actual de clientes,parapodercapitalizarel interésde lascategoríasmáspopularesensusitioweb,yotra
enlas categoríasque más se venden a nivel general y que Iztaccihuatl no está cubriendo actualmente.

Más contenido relacionado

La actualidad más candente

Proyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big dataProyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big dataMarcoPoloSanchez1
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.HugoCastro854432
 
Caso de estudio librería iztaccíhuatl
Caso de estudio librería iztaccíhuatlCaso de estudio librería iztaccíhuatl
Caso de estudio librería iztaccíhuatlFraniel Ricoveri
 
Bigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlBigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlPaola Quiroz Alvarez
 
Trabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por paresTrabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por paresFrancoGotuzzo
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónDiego Farfan
 
Proyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosProyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosRebecaHernandez59
 
Proyecto individual
Proyecto individualProyecto individual
Proyecto individualFernandoss2
 
Tarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datosTarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datosOlgaMaraGarzaSilva
 
Aplicación de La ciencia de datos en una Organización
Aplicación de La ciencia de datos en una OrganizaciónAplicación de La ciencia de datos en una Organización
Aplicación de La ciencia de datos en una OrganizaciónFernando Aguada
 
Actividad individual big data
Actividad individual big dataActividad individual big data
Actividad individual big datacnino6
 
PRESENTACIÓN DIGITAL INFOMETRIA
PRESENTACIÓN DIGITAL INFOMETRIA PRESENTACIÓN DIGITAL INFOMETRIA
PRESENTACIÓN DIGITAL INFOMETRIA Alvaro Hernandez
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónMariaTeresaSnchezSan
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datosAsael Bravo
 
Proy eval de pares Jhardena Yauri
Proy eval de pares Jhardena YauriProy eval de pares Jhardena Yauri
Proy eval de pares Jhardena YauriJhardenaYauri
 
Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.LeonardoGutierrezDal
 
Practica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datosPractica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datosAngelGalindoQuintero
 
datos secundarios
datos secundarios datos secundarios
datos secundarios Karla Parra
 

La actualidad más candente (19)

Proyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big dataProyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big data
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.
 
Caso de estudio librería iztaccíhuatl
Caso de estudio librería iztaccíhuatlCaso de estudio librería iztaccíhuatl
Caso de estudio librería iztaccíhuatl
 
Bigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlBigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria Iztaccihuatl
 
Trabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por paresTrabajo de ciencia de datos evaluado por pares
Trabajo de ciencia de datos evaluado por pares
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Proyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datosProyecto individual - Introducción a la ciencia de datos
Proyecto individual - Introducción a la ciencia de datos
 
Proyecto individual
Proyecto individualProyecto individual
Proyecto individual
 
Tarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datosTarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datos
 
Aplicación de La ciencia de datos en una Organización
Aplicación de La ciencia de datos en una OrganizaciónAplicación de La ciencia de datos en una Organización
Aplicación de La ciencia de datos en una Organización
 
Actividad individual big data
Actividad individual big dataActividad individual big data
Actividad individual big data
 
Curso
CursoCurso
Curso
 
PRESENTACIÓN DIGITAL INFOMETRIA
PRESENTACIÓN DIGITAL INFOMETRIA PRESENTACIÓN DIGITAL INFOMETRIA
PRESENTACIÓN DIGITAL INFOMETRIA
 
Utilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organizaciónUtilizando la ciencia de datos en una organización
Utilizando la ciencia de datos en una organización
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Proy eval de pares Jhardena Yauri
Proy eval de pares Jhardena YauriProy eval de pares Jhardena Yauri
Proy eval de pares Jhardena Yauri
 
Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.Practica con evaluación entre pares. Ciencia de Datos.
Practica con evaluación entre pares. Ciencia de Datos.
 
Practica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datosPractica de metodologías para proyectos de ciencia de datos
Practica de metodologías para proyectos de ciencia de datos
 
datos secundarios
datos secundarios datos secundarios
datos secundarios
 

Similar a Practica magr

Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Paola Quiroz Alvarez
 
3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdf3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdfJuan José Triviño
 
Proyecto Carlos Lugo
Proyecto Carlos LugoProyecto Carlos Lugo
Proyecto Carlos LugoCarlos Lugo
 
Visualizacion de datos y storytelling
Visualizacion de datos y storytellingVisualizacion de datos y storytelling
Visualizacion de datos y storytellingFernando Aguada
 
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio LibreríaProyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio LibreríaCamiloGonzlezBarrero
 
La ciencia de_datos
La ciencia de_datosLa ciencia de_datos
La ciencia de_datosCarly Cortiz
 
Práctica de evaluación entre pares
Práctica de evaluación entre paresPráctica de evaluación entre pares
Práctica de evaluación entre paresSofía Ardila
 
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaProyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaJosé Ignacio Mamani Murga
 
Utilizando la Ciencia de Datos en una Organización.
Utilizando la Ciencia de Datos en una Organización.Utilizando la Ciencia de Datos en una Organización.
Utilizando la Ciencia de Datos en una Organización.Gisela Ramoneda Rumí
 
Ejercicio 1 Data Science
Ejercicio 1   Data ScienceEjercicio 1   Data Science
Ejercicio 1 Data ScienceDiaNa López
 
3. Métricas tradicionales de la publicación científica
3. Métricas tradicionales de la publicación científica3. Métricas tradicionales de la publicación científica
3. Métricas tradicionales de la publicación científicaNieves Gonzalez
 

Similar a Practica magr (20)

Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
Bigdata visualizacion caso libreria iztaccihuatl- paola quiroz
 
3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdf3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdf
 
Tarea camilo sanhueza
Tarea camilo sanhuezaTarea camilo sanhueza
Tarea camilo sanhueza
 
Proyecto Carlos Lugo
Proyecto Carlos LugoProyecto Carlos Lugo
Proyecto Carlos Lugo
 
Proyecto 001 v1
Proyecto 001 v1Proyecto 001 v1
Proyecto 001 v1
 
Visualizacion de datos y storytelling
Visualizacion de datos y storytellingVisualizacion de datos y storytelling
Visualizacion de datos y storytelling
 
Tarea 1 ciencia de datos
Tarea 1    ciencia de datosTarea 1    ciencia de datos
Tarea 1 ciencia de datos
 
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio LibreríaProyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
Proyecto Introducción a la Ciencia de Datos - Caso de Estudio Librería
 
Ev pares
Ev paresEv pares
Ev pares
 
Edx
EdxEdx
Edx
 
Trabajo entre pares
Trabajo entre paresTrabajo entre pares
Trabajo entre pares
 
La ciencia de_datos
La ciencia de_datosLa ciencia de_datos
La ciencia de_datos
 
Práctica de evaluación entre pares
Práctica de evaluación entre paresPráctica de evaluación entre pares
Práctica de evaluación entre pares
 
rh.docx
rh.docxrh.docx
rh.docx
 
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani MurgaProyecto individual evaluado por pares - José Ignacio Mamani Murga
Proyecto individual evaluado por pares - José Ignacio Mamani Murga
 
Utilizando la Ciencia de Datos en una Organización.
Utilizando la Ciencia de Datos en una Organización.Utilizando la Ciencia de Datos en una Organización.
Utilizando la Ciencia de Datos en una Organización.
 
TRABAJO CURSO.docx
TRABAJO CURSO.docxTRABAJO CURSO.docx
TRABAJO CURSO.docx
 
Ejercicio 1 Data Science
Ejercicio 1   Data ScienceEjercicio 1   Data Science
Ejercicio 1 Data Science
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
3. Métricas tradicionales de la publicación científica
3. Métricas tradicionales de la publicación científica3. Métricas tradicionales de la publicación científica
3. Métricas tradicionales de la publicación científica
 

Último

EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptxJEFFERSONMEDRANOCHAV
 
data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfLizRamirez182254
 
REGISTRO CONTABLE DE CONTABILIDAD 2022..
REGISTRO CONTABLE DE CONTABILIDAD 2022..REGISTRO CONTABLE DE CONTABILIDAD 2022..
REGISTRO CONTABLE DE CONTABILIDAD 2022..KerlynRuizPinedo
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...JC Díaz Herrera
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoBESTTech1
 
aine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónaine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónJhon Jimenez
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1alfredo130306
 
Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024OBSERVATORIOREGIONAL
 
Anclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclajeAnclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclajeklebersky23
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxMarioKing10
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...claudioluna1121
 
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀LALVAREZD
 
Unidad 6 estadística 2011 TABLA DE FRECUENCIA
Unidad 6 estadística 2011  TABLA DE FRECUENCIAUnidad 6 estadística 2011  TABLA DE FRECUENCIA
Unidad 6 estadística 2011 TABLA DE FRECUENCIAEduardo Ferreira
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoRaúl Figueroa
 
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,EmmanuelDelJessGonza
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxlm8322074
 
Las familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfLas familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfJC Díaz Herrera
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxfatimacamilainjantem
 
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANASanyahelmont
 
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdf
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdfSEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdf
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdfsmilagrossmedina23
 

Último (20)

EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdf
 
REGISTRO CONTABLE DE CONTABILIDAD 2022..
REGISTRO CONTABLE DE CONTABILIDAD 2022..REGISTRO CONTABLE DE CONTABILIDAD 2022..
REGISTRO CONTABLE DE CONTABILIDAD 2022..
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
aine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónaine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificación
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024
 
Anclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclajeAnclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclaje
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptx
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
 
Unidad 6 estadística 2011 TABLA DE FRECUENCIA
Unidad 6 estadística 2011  TABLA DE FRECUENCIAUnidad 6 estadística 2011  TABLA DE FRECUENCIA
Unidad 6 estadística 2011 TABLA DE FRECUENCIA
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
 
Las familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfLas familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdf
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
 
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
 
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdf
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdfSEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdf
SEMANA II - EQUIPOS, INSTRUMENTOS Y MATERIALES TOPOGRAFICOS.pdf
 

Practica magr

  • 1. CURSO DE VISUALIZACIÓN DE DATOS Y STORYTELLING PRÁCTICA: Aplicando la Ciencia de Datos en una organización. ALUMNO: Manuel Alejandro Godoy Rodríguez
  • 2. ÍNDICE INTRODUCCIÓN..................................................................................................................................3 CLASIFICACIÓN DE LOS ARCHIVOS (DATA SETS)....................................................................................3 DATOS RELEVANTES DE LOS DATA SETS ...............................................................................................3 ANÁLISIS DE DATOS DE LA LIBRERÍA IZTACCIHUATL: RATINGS Y RECOMENDACIONES .........................4 ANÁLISIS DE DATOS DE LOS LIBROS MÁS VENDIDOS EN 2010 ............................................................5 COMPARACIÓN DE DATOS DE LA LIBRERÍA IZTACCIHUATL Y LIBROS MÁS VENDIDOS ..........................6 PREDICCIONES PARA LA TOMA DE DECISIONES ....................................................................................8 CONCLUSIONES..................................................................................................................................9
  • 3. INTRODUCCIÓN La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha decidido desarrollar un proyecto basado en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollarunamejorestrategiaenla tomadedecisiones. Paraellosecuentanconlossiguientesarchivos:  El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona el promedio de clasificación de cada libro de acuerdo,a las votaciones y compras del cliente.  El archivo “top_books” contiene el top 20 de los libros más vendidos, de acuerdo, a una clasificación general.  El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del sitio web de la librería.  El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web sobre libros para leer. CLASIFICACIÓN DE LOS ARCHIVOS (DATA SETS) Revisando el contenido de los archivos, se observa que proceden de dos sets de datos distintos: 1. El inventario de la librería Iztaccihuatl (books.csv), así como los ratings (ratings.csv) y recomendaciones de su sitio web (to_read.csv). 2. Un listadogeneral (top_books.csv) de los20 librosmás vendidosporgénero.No se especificala procedenciade estelistado,perodado queconcentramásde 23millonesdeventas yquealgunos títulosnose encuentranenelinventariode lalibreríaIztaccihuatl,se asumeque esunareferencia externa. DATOS RELEVANTES DE LOS DATA SETS El setde datos de lalibreríaIztaccihuatl nocontiene datosde ventas.Laretroalimentaciónde losclientes con laque se cuentasonlosratingsylacantidadde recomendacionesenel sitioweb.Se proponegraficar un scatter chart para determinar si hay una correlación entre los libros más recomendados y los libros mejor evaluados. El listado general de librosmás vendidos sí incluye estadísticas de ventas globales,por lo cual se puede obtener la composición estática (pie chart) de los siguientes datos para el 2010 (año de generación del archivo):  Las ventassegúnlaclasificacióndelproducto,paraconocerquécategoríacuentaconmayores ventas.
  • 4.  Las ventas de acuerdo con el año de publicación del libro, para determinar si el año de publicación está correlacionado con altas ventas. ANÁLISIS DE DATOS DE LA LIBRERÍA IZTACCIHUATL: RATINGS Y RECOMENDACIONES Como se comentó previamente,la retroalimentaciónde los clientes de la librería Iztaccihuatl que están disponibles son los ratings y la cantidad de recomendaciones en el sitio web. Una primera pregunta es determinar si hay una correlación entre la cantidad de recomendaciones y el valor de las calificaciones (ratings) otorgadas. Para ello podemos graficar los pares de cantidad de recomendaciones y ratings de cada libro en un scatter chart: GRÁFICA 1. – Correlación entre libros mejor evaluados y libros más recomendados. Tenemosentonces811 puntosgraficadosenunplanocartesiano,endonde eleje X corresponde al rating promedio y el eje Y a la cantidad de recomendaciones del sitio. De acuerdo con esta gráfica podemos establecer 3 rangos:  Los libros con un rating de 2.8 a 3.39 se encuentran en un margen de 1 a 137 recomendaciones.  Los libroscon 3.4 a 4.19 cuentan con 1 a 1352 recomendaciones,aunque lagranmayoría de estos libros no pasan de 400 recomendaciones.
  • 5.  Los librosconunrankingsuperiora4.2 cuentanconmayor probabilidadde tenermásde 600 recomendaciones, especialmente aquellos con un ranking superior a 4.42. Tanto el rango inferior (<3.39) como el rango superior (>4.2) pueden ayudar a predecir de manera temprana la cantidad de recomendaciones -pocas o muchas- que tendrá un libro enel sitio. En el rango de 3.4 a 4.19 hay mayor incertidumbre. ANÁLISIS DE DATOS DE LOS LIBROS MÁS VENDIDOS EN 2010 Revisando el archivo “top books”, podemos agrupar los libros más vendidos de acuerdo con su clasificación.El siguiente pie chart agrupa lasventas(entérminosmonetarios,node unidadesvendidas) según su clasificación. Podemos identificar 5 categorías que concentran más del 75% de las ventas incluidas en el set de datos:  Ficción Literaria y General  Crimen, Thriller y Aventura  Comida y Bebida  Ficción Juvenil  Autobiografía: las artes GRÁFICA 2. – Libros más vendidos de acuerdo con su clasificación.
  • 6. También se puede graficar un pie chart de acuerdo con el año de publicación, para determinar el porcentaje de libros más vendidos que han sido publicados recientemente: GRÁFICA 3. – Libros más vendidos de acuerdo con su año de publicación De acuerdocon estas dosgráficas,podemosobservarque hay 5 categorías que concentranmás del 75% de lasventas,yque un80% de las ventascorrespondenalibrospublicadosen2010, esdecir,librosrecién publicados en el momento de generar la estadística. COMPARACIÓN DE DATOS DE LA LIBRERÍA IZTACCIHUATL Y LIBROS MÁS VENDIDOS Desafortunadamente losdatosdel inventariode Iztaccihuatl no incluyendatosdel númerode ventasola categoría a la que pertenecen los libros, sin embargo, es posible tomar los libros más populares (considerando la cantidad de recomendaciones y el rating) e investigar a qué categoría pertenecen. Para este ejercicio,se propone multiplicarlacantidad de recomendacionesporel rating promedio,para calcular un índice de popularidad. Con este índice se pueden seleccionar los 40 libros más populares, asignarles una clasificación de acuerdo con las categorías de “top_books” y comparar los resultados:
  • 7. TABLA 1. – Libros más populares en el inventario de la librería Iztaccihuatl Tomando los 40 libros con mayor popularidad (cantidad de recomendaciones x rating promedio) y agrupándolos de acuerdo con su clasificación (género) encontramos que un 87% de los libros más populares pertenecen a las siguientes categorías:  Ciencia ficción y fantasía.  Ficción juvenil.  Ficción literaria y general. GRÁFICA 4. – Libros más populares por género en la librería Iztaccihuatl
  • 8. De estas3categorías,dosde ellastambiénregistranaltasventasde acuerdoconel listadode “top_books” de 2010: Ficción Juvenil y Ficción Literaria y General. PREDICCIONES PARA LA TOMA DE DECISIONES De acuerdo con los hallazgos antes mencionados, es posible predecir que: 1. Loslibrosconunratingmenora3.4 tendránpocasrecomendacionesenelsitioweb.Sinembargo, es necesario determinar si esto se refleja también en pocas ventas. 2. Los libros con un rating mayor a 4.42 cuentan con altas probabilidades de tener muchas recomendacionesenel sitioweb.De igual manera,esnecesariodeterminarsi estaalta cantidad de recomendaciones se refleja en muchas ventas, el cual es un dato que no aparece en el inventario de Iztaccihuatl. 3. De acuerdo con los datos de “top_books”, hay 3 categorías con alto volumen de ventas que no figuranentre lasmáspopularesdel sitiowebde Iztaccihuatl.Esmuyposible que estascategorías representenunafuenteimportantede ingresos, porlocual la libreríadeberíaconsiderarlaspara su próxima planeación de inventarios, ventas y publicidad: o Crimen, Thriller y Aventura o Comida y Bebida o Autobiografía: las artes 4. También de acuerdo con los datos de “top_books”, los libros más vendidos son aquellos recién editados,porlo que la libreríaIztaccihuatl puede tomaren cuentaeste dato para su planeación, especialmente paralibrosenlas categorías identificadascomomás popularesdentrode su sitio web, y las categorías más vendidas de acuerdo al listado global de “top book”.
  • 9. CONCLUSIONES De acuerdo con los datos podemos observar que las categorías más populares de la librería Iztaccihuatl representan a un público joven, ya que un 87% de los libros más populares se clasifican dentro de:  Ciencia ficción y fantasía.  Ficción juvenil.  Ficción literaria y general. Dado que estosdatos estánrelacionadoscon lasrecomendacionesdel sitioweb,esnormal que algunas categorías, especialmente la ciencia ficción, estén sobrerrepresentadas, por lo cual es necesario que la libreríaIztaccihuatl comience aregistrarcomo se traducenestosratings y recomendacionesenventas,e incluso trate de capitalizar este interés, a través de publicidad, descuentos, o alguna otra estrategia comercial. Por otrolado,de acuerdo con losdatosdel archivo“topbooks”,hayotrascategorías que generanunalto volumende ventasy que no figuranentre los librosmáspopularesdel sitiode la libreríaIztaccihuatl ,las cuales son:  Crimen, Thriller y Aventura  Comida y Bebida  Autobiografía: las artes EstascategoríasrepresentanunaoportunidadparaIztaccihuatl,quepodríaofrecerunaselecciónde libros reciénpublicados, que sonlosque más altasventas registrande acuerdo con el archivo de “top_books”, y medir el éxitoque tengan,para así buscar ampliar su mercado, más allá de los lectores jóvenes. Esta selección puede ser tan amplia o reducida como se quiera, dependiendo del nivel de riesgo que sea aceptable para la librería. En resumen,lalibreríaIztaccihuatl tiene dosoportunidadesenpuerta.Una enlo que se refiere asu base actual de clientes,parapodercapitalizarel interésde lascategoríasmáspopularesensusitioweb,yotra enlas categoríasque más se venden a nivel general y que Iztaccihuatl no está cubriendo actualmente.