SlideShare ist ein Scribd-Unternehmen logo
1 von 22
Downloaden Sie, um offline zu lesen
Minería de datos
● Introducción
● KDD: Proceso de Extracción de conocimiento
● Procesos de un proyecto de minería de datos
● Técnicas de minería de datos
● Ciclo de un Proyecto de Minería de Datos
Índice
De donde venimos y hacia dónde
vamos
● La minería de datos (DM, Data Mining) consiste en la
extracción no trivial de información que reside de
manera implícita en los datos. Dicha información era
previamente desconocida y podrá resultar útil para
algún proceso. En otras palabras, la minería de datos
prepara, sondea y explora los datos para sacar la
información oculta en ellos.
¿Qué es la Minería de Datos?
Fuente: wikipedia
● Deducir conocimiento examinando los datos y realizando
predicciones
○ «examinar datos» examinar ejemplos de hechos conocidos
sobre «casos» utilizando sus atributos – «variables»
○ «conocimiento»: Patrones, Clusters, Reglas, Árboles de
Decisión, Redes Neuronales, Reglas de Asociación,….
● OLAP: Análisis orientado al modelo
● DM: Análisis orientado al dato
● Nombres alternativos: Análisis Predictivo
¿Qué es la Minería de Datos?
● La minería de datos (es la etapa de análisis de "Knowledge Discovery in
Databases" o KDD)
● Proceso de detectar la información procesable de los conjuntos
grandes de datos.
● Utiliza el análisis matemático para deducir los patrones y tendencias
que existen en los datos.
● Estos patrones no se pueden detectar mediante la exploración
tradicional de los datos porque las relaciones son demasiado complejas o
porque hay demasiado datos.
● Estos patrones y tendencias se pueden recopilar y definir como un
modelo de minería de datos.
¿Qué es la Minería de Datos?
KDD: Proceso de Extracción de
conocimiento
Como muestra la figura, las etapas del proceso KDD se
dividen en 5 fases y son:
1. Selección de datos
2. Preprocesamiento
3. Transformación
4. Data Mining
5. Interpretación y Evaluación
Como muestra la figura anterior, las etapas del proceso KDD se dividen en 5 fases y son:
1. Selección de datos. En esta etapa se determinan las fuentes de datos y el tipo de información
a utilizar. Es la etapa donde los datos relevantes para el análisis son extraídos desde la o las
fuentes de datos.
2. Preprocesamiento. Esta etapa consiste en la preparación y limpieza de los datos extraídos
desde las distintas fuentes de datos en una forma manejable, necesaria para las fases
posteriores. En esta etapa se utilizan diversas estrategias para manejar datos faltantes o en
blanco, datos inconsistentes o que están fuera de rango, obteniéndose al final una estructura de
datos adecuada para su posterior transformación.
3. Transformación. Consiste en el tratamiento preliminar de los datos, transformación y
generación de nuevas variables a partir de las ya existentes con una estructura de datos
apropiada. Aquí se realizan operaciones de agregación o normalización, consolidando los
datos de una forma necesaria para la fase siguiente.
4. Data Mining. Es la fase de modelamiento propiamente tal, en donde métodos inteligentes son
aplicados con el objetivo de extraer patrones previamente desconocidos, válidos, nuevos,
potencialmente útiles y comprensibles y que están contenidos u “ocultos” en los datos.
5. Interpretación y Evaluación. Se identifican los patrones obtenidos y que son realmente
interesantes, basándose en algunas medidas y se realiza una evaluación de los resultados
obtenidos.
KDD: Proceso de Extracción de
conocimiento
Un proyecto de minería de datos tiene varias fases
necesarias que son, esencialmente:
● Comprensión del negocio y del problema que se quiere
resolver.
● Determinación, obtención y limpieza de los datos
necesarios.
● Creación de modelos matemáticos.
● Validación, comunicación, etc. de los resultados
obtenidos.
● Integración, si procede, de los resultados en un
sistema transaccional o similar.
Procesos de un proyecto de minería
de datos
● La relación entre todas estas fases sólo es
lineal sobre el papel. En realidad, es mucho
más compleja y esconde toda una jerarquía
de subfases. A través de la experiencia
acumulada en proyectos de minería de
datos se han ido desarrollando
metodologías que permiten gestionar esta
complejidad de una manera más o menos
uniforme.
Procesos de un proyecto de minería
de datos
● Generación de Recomendaciones
○ ¿Qué productos o servicios deberíamos de ofrecer a nuestros
clientes?
● Detección de anomalías
○ Detección de fraude
● Análisis de Rotación
○ ¿Qué clientes son más proclives de irse a la competencia?
● Gestión de Riesgos
○ ¿Debería de concederse el crédito?
● Segmentación de clientes
○ Clasificación de nuestros clientes
● Anuncios Orientados
○ Personalización de anuncios, contenido,…
Procesos de un proyecto de minería
de datos
● Previsión
○ ¿Cuánto venderemos el próximo semestre?
● Clasificación
○ Se asigna una categoría a cada caso. Cada caso tiene un conjunto de
atributos uno de ellos es el atributo clase.
○ Se busca un modelo que describa el atributo clase como una función de los
atributos de salida
● Agrupación
○ También conocido como segmentación
○ Identifica grupos naturales basándose en un conjunto de atributos
● Asociación
○ También conocido como análisis de cesta de la compra
● Regresión
○ Similar a clasificación pero con el objetivo de buscar patrones para determinar
un valor numérico
○ Ej.: Predicción de la velocidad del viento basada en temperatura presión de
aire y humedad
Procesos de un proyecto de minería
de datos
Las técnicas de la minería de datos provienen
de la Inteligencia artificial y de la estadística,
dichas técnicas, no son más que algoritmos,
más o menos sofisticados que se aplican sobre
un conjunto de datos para obtener unos
resultados.
Técnicas de minería de datos
Las técnicas más representativas son
● Redes neuronales
● Árboles de decisión
● Modelos estadísticos
● Agrupamiento o Clustering
● Algoritmos supervisados (o predictivos)
● Algoritmos no supervisados (o del descubrimiento
del conocimiento)
Técnicas de minería de datos
Redes neuronales
Son un paradigma de aprendizaje y procesamiento
automático inspirado en la forma en que funciona el
sistema nervioso de los animales. Se trata de un sistema
de interconexión de neuronas en una red que colabora
para producir un estímulo de salida. Algunos ejemplos de
red neuronal son:
● El Perceptrón
● El Perceptrón multicapa.
● Los Mapas Autoorganizados, también conocidos como
redes de Kohonen.
Técnicas de minería de datos
Árboles de decisión
Un árbol de decisión es un modelo de predicción utilizado
en el ámbito de la inteligencia artificial, dada una base de
datos se construyen estos diagramas de construcciones
lógicas, muy similares a los sistemas de predicción
basados en reglas, que sirven para representar y
categorizar una serie de condiciones que suceden de
forma sucesiva, para la resolución de un problema.
Ejemplos:
● Algoritmo ID3.
● Algoritmo C4.5.
Técnicas de minería de datos
Modelos estadísticos
● Es una expresión simbólica en forma de
igualdad o ecuación que se emplea en todos
los diseños experimentales y en la regresión
para indicar los diferentes factores que
modifican la variable de respuesta.
Técnicas de minería de datos
Agrupamiento o Clustering
Es un procedimiento de agrupación de una serie de
vectores según criterios habitualmente de distancia; se
tratará de disponer los vectores de entrada de forma que
estén más cercanos aquellos que tengan características
comunes.
Ejemplos:
● Algoritmo K-means.
● Algoritmo K-medoids.
Técnicas de minería de datos
Según el objetivo del análisis de los datos, los
algoritmos utilizados se clasifican en supervisados y
no supervisados (Weiss y Indurkhya, 1998):
● Algoritmos supervisados (o predictivos)
○ Predicen un dato (o un conjunto de ellos)
desconocido a priori, a partir de otros conocidos.
● Algoritmos no supervisados (o del descubrimiento del
conocimiento)
○ Se descubren patrones y tendencias en los datos.
Técnicas de minería de datos
Técnicas de minería de datos
Ejemplo
Comprador potencial de bicis:
Provincia Ciudad Edad Coche Distancia trabajo Bici
Ciclo de un Proyecto de Minería de
Datos
GRACIAS POR SU ATENCIÓN
info@alianzo.com
www.alianzo.com

Weitere ähnliche Inhalte

Was ist angesagt?

Mapa conceptual big data
Mapa conceptual big dataMapa conceptual big data
Mapa conceptual big dataHéctor Medina
 
AUDITORIA DE BASE DE DATOS
AUDITORIA DE BASE DE DATOSAUDITORIA DE BASE DE DATOS
AUDITORIA DE BASE DE DATOSGRECIAGALLEGOS
 
Modelo de sistema de informacion
Modelo de sistema de informacionModelo de sistema de informacion
Modelo de sistema de informaciongrupoinformaticauts
 
Manejador de Base de Datos
Manejador de Base de Datos Manejador de Base de Datos
Manejador de Base de Datos Brenda Medina
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Ris Fernandez
 
Propuesta De Empresa. Estructura Y OrganizacióN Tic
Propuesta De Empresa. Estructura Y OrganizacióN TicPropuesta De Empresa. Estructura Y OrganizacióN Tic
Propuesta De Empresa. Estructura Y OrganizacióN TicOriol Recasens
 
Mapa Conceptual del Concepto de BigData
Mapa Conceptual del Concepto de BigDataMapa Conceptual del Concepto de BigData
Mapa Conceptual del Concepto de BigDataJosé Rosales
 
Tipos de Modelos de Datos : Ventajas y Desventajas
Tipos de Modelos de Datos : Ventajas y DesventajasTipos de Modelos de Datos : Ventajas y Desventajas
Tipos de Modelos de Datos : Ventajas y DesventajasJuanMiguelCustodioMo
 
Analista de sistema
Analista de sistemaAnalista de sistema
Analista de sistema21040883
 
IMPLEMENTACION DE UNA BASE DE DATOS
IMPLEMENTACION DE UNA BASE DE DATOS IMPLEMENTACION DE UNA BASE DE DATOS
IMPLEMENTACION DE UNA BASE DE DATOS Paul steven Quiñonez
 
Diagramas de clases y actividades
Diagramas de clases y actividadesDiagramas de clases y actividades
Diagramas de clases y actividadesTerryJoss
 
Trabajo ciclo de vida del software
Trabajo ciclo de vida del softwareTrabajo ciclo de vida del software
Trabajo ciclo de vida del softwareagtagt
 
Metodologia merise
Metodologia meriseMetodologia merise
Metodologia merisejosuecruz90
 
Las 7 fases de kendal & kendall
Las 7 fases de kendal & kendallLas 7 fases de kendal & kendall
Las 7 fases de kendal & kendalldavidmonar
 

Was ist angesagt? (20)

Mapa conceptual big data
Mapa conceptual big dataMapa conceptual big data
Mapa conceptual big data
 
AUDITORIA DE BASE DE DATOS
AUDITORIA DE BASE DE DATOSAUDITORIA DE BASE DE DATOS
AUDITORIA DE BASE DE DATOS
 
Diagramas de-flujo-de-datos01
Diagramas de-flujo-de-datos01Diagramas de-flujo-de-datos01
Diagramas de-flujo-de-datos01
 
Modelo de sistema de informacion
Modelo de sistema de informacionModelo de sistema de informacion
Modelo de sistema de informacion
 
Manejador de Base de Datos
Manejador de Base de Datos Manejador de Base de Datos
Manejador de Base de Datos
 
Tipos de sistemas de información
Tipos de sistemas de informaciónTipos de sistemas de información
Tipos de sistemas de información
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion
 
Propuesta De Empresa. Estructura Y OrganizacióN Tic
Propuesta De Empresa. Estructura Y OrganizacióN TicPropuesta De Empresa. Estructura Y OrganizacióN Tic
Propuesta De Empresa. Estructura Y OrganizacióN Tic
 
Mapa Conceptual del Concepto de BigData
Mapa Conceptual del Concepto de BigDataMapa Conceptual del Concepto de BigData
Mapa Conceptual del Concepto de BigData
 
Metodologia estructurada
Metodologia estructuradaMetodologia estructurada
Metodologia estructurada
 
Tipos de Modelos de Datos : Ventajas y Desventajas
Tipos de Modelos de Datos : Ventajas y DesventajasTipos de Modelos de Datos : Ventajas y Desventajas
Tipos de Modelos de Datos : Ventajas y Desventajas
 
Analista de sistema
Analista de sistemaAnalista de sistema
Analista de sistema
 
Componentes de un sistema de Información
Componentes de un sistema de Información Componentes de un sistema de Información
Componentes de un sistema de Información
 
IMPLEMENTACION DE UNA BASE DE DATOS
IMPLEMENTACION DE UNA BASE DE DATOS IMPLEMENTACION DE UNA BASE DE DATOS
IMPLEMENTACION DE UNA BASE DE DATOS
 
Diagramas de clases y actividades
Diagramas de clases y actividadesDiagramas de clases y actividades
Diagramas de clases y actividades
 
Data mart
Data martData mart
Data mart
 
Trabajo ciclo de vida del software
Trabajo ciclo de vida del softwareTrabajo ciclo de vida del software
Trabajo ciclo de vida del software
 
Metodologia merise
Metodologia meriseMetodologia merise
Metodologia merise
 
Ingenieria de software
Ingenieria de softwareIngenieria de software
Ingenieria de software
 
Las 7 fases de kendal & kendall
Las 7 fases de kendal & kendallLas 7 fases de kendal & kendall
Las 7 fases de kendal & kendall
 

Andere mochten auch

Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSlalopg
 
Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosmajitol
 
Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Alexander Jimenez
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textosJesús Tramullas
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I ufrj
 
Minería de Datos
Minería de DatosMinería de Datos
Minería de Datosasuoc
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics Spain
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes socialesMaría Muñoz Parra
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datosdataminingperu
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentaciónedmaga
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos04071977
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosMaría Inés Cahuana Lázaro
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datoselsemieni
 
Mineria de datos secuenciales
Mineria de datos secuencialesMineria de datos secuenciales
Mineria de datos secuencialesMarilyn Jaramillo
 
Fundamentos de Data Mining con R
Fundamentos de Data Mining con RFundamentos de Data Mining con R
Fundamentos de Data Mining con RSoftware Guru
 
Soluciones de Big Data en el Entorno Analítico de SAS
Soluciones de Big Data en el Entorno Analítico de SASSoluciones de Big Data en el Entorno Analítico de SAS
Soluciones de Big Data en el Entorno Analítico de SASDMC Perú
 

Andere mochten auch (20)

Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
 
Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datos
 
Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 
Minería de Datos
Minería de DatosMinería de Datos
Minería de Datos
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes sociales
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos secuenciales
Mineria de datos secuencialesMineria de datos secuenciales
Mineria de datos secuenciales
 
Fundamentos de Data Mining con R
Fundamentos de Data Mining con RFundamentos de Data Mining con R
Fundamentos de Data Mining con R
 
Soluciones de Big Data en el Entorno Analítico de SAS
Soluciones de Big Data en el Entorno Analítico de SASSoluciones de Big Data en el Entorno Analítico de SAS
Soluciones de Big Data en el Entorno Analítico de SAS
 

Ähnlich wie Minería de datos (20)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kdd
 
Data Mining Parte 1.pptx
Data Mining Parte 1.pptxData Mining Parte 1.pptx
Data Mining Parte 1.pptx
 
Parte1
Parte1Parte1
Parte1
 
La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD
 
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxIntroduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Data science. todo lo que necesitas saber
Data science. todo lo que necesitas saberData science. todo lo que necesitas saber
Data science. todo lo que necesitas saber
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Tecnicas de minería de datos
Tecnicas de minería de datosTecnicas de minería de datos
Tecnicas de minería de datos
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
 
SEMANA4_APUNTE_S4.pdf
SEMANA4_APUNTE_S4.pdfSEMANA4_APUNTE_S4.pdf
SEMANA4_APUNTE_S4.pdf
 
La Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLa Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica Predictiva
 

Mehr von Alianzo Networks

Informe candidatos elecciones vascas 2016
Informe candidatos elecciones vascas 2016Informe candidatos elecciones vascas 2016
Informe candidatos elecciones vascas 2016Alianzo Networks
 
Informe diputados España en social media 2016
Informe diputados España en social media 2016Informe diputados España en social media 2016
Informe diputados España en social media 2016Alianzo Networks
 
Informe atención al cliente banca española
Informe atención al cliente banca españolaInforme atención al cliente banca española
Informe atención al cliente banca españolaAlianzo Networks
 
Informe Menciones Rankia Banca España - Noviembre 2015
Informe Menciones Rankia Banca España - Noviembre 2015Informe Menciones Rankia Banca España - Noviembre 2015
Informe Menciones Rankia Banca España - Noviembre 2015Alianzo Networks
 
Informe Menciones Banca España, Noviembre 2015
Informe Menciones Banca España, Noviembre 2015Informe Menciones Banca España, Noviembre 2015
Informe Menciones Banca España, Noviembre 2015Alianzo Networks
 
Informe Engagement Banca España Octubre 2015
Informe Engagement Banca España Octubre 2015Informe Engagement Banca España Octubre 2015
Informe Engagement Banca España Octubre 2015Alianzo Networks
 
Informe Banca México en Social Media
Informe Banca México en Social MediaInforme Banca México en Social Media
Informe Banca México en Social MediaAlianzo Networks
 
Informe Cervezas Convencionales España en Social Media
Informe Cervezas Convencionales España en Social MediaInforme Cervezas Convencionales España en Social Media
Informe Cervezas Convencionales España en Social MediaAlianzo Networks
 
10 Mayores Ciudades Españolas en Social Media
10 Mayores Ciudades Españolas en Social Media10 Mayores Ciudades Españolas en Social Media
10 Mayores Ciudades Españolas en Social MediaAlianzo Networks
 
Banca convencional España 2015 marzo
Banca convencional España 2015 marzoBanca convencional España 2015 marzo
Banca convencional España 2015 marzoAlianzo Networks
 
Automoción España en Social Media - Febrero 2015
Automoción España en Social Media - Febrero 2015Automoción España en Social Media - Febrero 2015
Automoción España en Social Media - Febrero 2015Alianzo Networks
 
Energy Industry - October 2014
Energy Industry -  October 2014Energy Industry -  October 2014
Energy Industry - October 2014Alianzo Networks
 
Informe de Periódicos Españoles
Informe de Periódicos EspañolesInforme de Periódicos Españoles
Informe de Periódicos EspañolesAlianzo Networks
 
Special Report: European Banks
Special Report: European BanksSpecial Report: European Banks
Special Report: European BanksAlianzo Networks
 
Informe sobre bancos españoles en social media
Informe sobre bancos españoles en social mediaInforme sobre bancos españoles en social media
Informe sobre bancos españoles en social mediaAlianzo Networks
 
Oficinas de turismo españolas en social media
Oficinas de turismo españolas en social mediaOficinas de turismo españolas en social media
Oficinas de turismo españolas en social mediaAlianzo Networks
 
Restaurantes españoles que mejor lo hacen en medios sociales
Restaurantes españoles que mejor lo hacen en medios socialesRestaurantes españoles que mejor lo hacen en medios sociales
Restaurantes españoles que mejor lo hacen en medios socialesAlianzo Networks
 

Mehr von Alianzo Networks (20)

Informe candidatos elecciones vascas 2016
Informe candidatos elecciones vascas 2016Informe candidatos elecciones vascas 2016
Informe candidatos elecciones vascas 2016
 
Informe diputados España en social media 2016
Informe diputados España en social media 2016Informe diputados España en social media 2016
Informe diputados España en social media 2016
 
Informe atención al cliente banca española
Informe atención al cliente banca españolaInforme atención al cliente banca española
Informe atención al cliente banca española
 
Informe Menciones Rankia Banca España - Noviembre 2015
Informe Menciones Rankia Banca España - Noviembre 2015Informe Menciones Rankia Banca España - Noviembre 2015
Informe Menciones Rankia Banca España - Noviembre 2015
 
Informe Menciones Banca España, Noviembre 2015
Informe Menciones Banca España, Noviembre 2015Informe Menciones Banca España, Noviembre 2015
Informe Menciones Banca España, Noviembre 2015
 
Informe Engagement Banca España Octubre 2015
Informe Engagement Banca España Octubre 2015Informe Engagement Banca España Octubre 2015
Informe Engagement Banca España Octubre 2015
 
Informe Banca México en Social Media
Informe Banca México en Social MediaInforme Banca México en Social Media
Informe Banca México en Social Media
 
Informe Cervezas Convencionales España en Social Media
Informe Cervezas Convencionales España en Social MediaInforme Cervezas Convencionales España en Social Media
Informe Cervezas Convencionales España en Social Media
 
10 Mayores Ciudades Españolas en Social Media
10 Mayores Ciudades Españolas en Social Media10 Mayores Ciudades Españolas en Social Media
10 Mayores Ciudades Españolas en Social Media
 
Banca convencional España 2015 marzo
Banca convencional España 2015 marzoBanca convencional España 2015 marzo
Banca convencional España 2015 marzo
 
Automoción España en Social Media - Febrero 2015
Automoción España en Social Media - Febrero 2015Automoción España en Social Media - Febrero 2015
Automoción España en Social Media - Febrero 2015
 
Energy Industry - October 2014
Energy Industry -  October 2014Energy Industry -  October 2014
Energy Industry - October 2014
 
Informe de Periódicos Españoles
Informe de Periódicos EspañolesInforme de Periódicos Españoles
Informe de Periódicos Españoles
 
Special Report: European Banks
Special Report: European BanksSpecial Report: European Banks
Special Report: European Banks
 
Informe sobre bancos españoles en social media
Informe sobre bancos españoles en social mediaInforme sobre bancos españoles en social media
Informe sobre bancos españoles en social media
 
Oficinas de turismo españolas en social media
Oficinas de turismo españolas en social mediaOficinas de turismo españolas en social media
Oficinas de turismo españolas en social media
 
Restaurantes españoles que mejor lo hacen en medios sociales
Restaurantes españoles que mejor lo hacen en medios socialesRestaurantes españoles que mejor lo hacen en medios sociales
Restaurantes españoles que mejor lo hacen en medios sociales
 
Sistemas distribuidos
Sistemas distribuidosSistemas distribuidos
Sistemas distribuidos
 
NLP
NLPNLP
NLP
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 

Minería de datos

  • 2. ● Introducción ● KDD: Proceso de Extracción de conocimiento ● Procesos de un proyecto de minería de datos ● Técnicas de minería de datos ● Ciclo de un Proyecto de Minería de Datos Índice
  • 3. De donde venimos y hacia dónde vamos
  • 4. ● La minería de datos (DM, Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos. ¿Qué es la Minería de Datos? Fuente: wikipedia
  • 5. ● Deducir conocimiento examinando los datos y realizando predicciones ○ «examinar datos» examinar ejemplos de hechos conocidos sobre «casos» utilizando sus atributos – «variables» ○ «conocimiento»: Patrones, Clusters, Reglas, Árboles de Decisión, Redes Neuronales, Reglas de Asociación,…. ● OLAP: Análisis orientado al modelo ● DM: Análisis orientado al dato ● Nombres alternativos: Análisis Predictivo ¿Qué es la Minería de Datos?
  • 6. ● La minería de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) ● Proceso de detectar la información procesable de los conjuntos grandes de datos. ● Utiliza el análisis matemático para deducir los patrones y tendencias que existen en los datos. ● Estos patrones no se pueden detectar mediante la exploración tradicional de los datos porque las relaciones son demasiado complejas o porque hay demasiado datos. ● Estos patrones y tendencias se pueden recopilar y definir como un modelo de minería de datos. ¿Qué es la Minería de Datos?
  • 7. KDD: Proceso de Extracción de conocimiento Como muestra la figura, las etapas del proceso KDD se dividen en 5 fases y son: 1. Selección de datos 2. Preprocesamiento 3. Transformación 4. Data Mining 5. Interpretación y Evaluación
  • 8. Como muestra la figura anterior, las etapas del proceso KDD se dividen en 5 fases y son: 1. Selección de datos. En esta etapa se determinan las fuentes de datos y el tipo de información a utilizar. Es la etapa donde los datos relevantes para el análisis son extraídos desde la o las fuentes de datos. 2. Preprocesamiento. Esta etapa consiste en la preparación y limpieza de los datos extraídos desde las distintas fuentes de datos en una forma manejable, necesaria para las fases posteriores. En esta etapa se utilizan diversas estrategias para manejar datos faltantes o en blanco, datos inconsistentes o que están fuera de rango, obteniéndose al final una estructura de datos adecuada para su posterior transformación. 3. Transformación. Consiste en el tratamiento preliminar de los datos, transformación y generación de nuevas variables a partir de las ya existentes con una estructura de datos apropiada. Aquí se realizan operaciones de agregación o normalización, consolidando los datos de una forma necesaria para la fase siguiente. 4. Data Mining. Es la fase de modelamiento propiamente tal, en donde métodos inteligentes son aplicados con el objetivo de extraer patrones previamente desconocidos, válidos, nuevos, potencialmente útiles y comprensibles y que están contenidos u “ocultos” en los datos. 5. Interpretación y Evaluación. Se identifican los patrones obtenidos y que son realmente interesantes, basándose en algunas medidas y se realiza una evaluación de los resultados obtenidos. KDD: Proceso de Extracción de conocimiento
  • 9. Un proyecto de minería de datos tiene varias fases necesarias que son, esencialmente: ● Comprensión del negocio y del problema que se quiere resolver. ● Determinación, obtención y limpieza de los datos necesarios. ● Creación de modelos matemáticos. ● Validación, comunicación, etc. de los resultados obtenidos. ● Integración, si procede, de los resultados en un sistema transaccional o similar. Procesos de un proyecto de minería de datos
  • 10. ● La relación entre todas estas fases sólo es lineal sobre el papel. En realidad, es mucho más compleja y esconde toda una jerarquía de subfases. A través de la experiencia acumulada en proyectos de minería de datos se han ido desarrollando metodologías que permiten gestionar esta complejidad de una manera más o menos uniforme. Procesos de un proyecto de minería de datos
  • 11. ● Generación de Recomendaciones ○ ¿Qué productos o servicios deberíamos de ofrecer a nuestros clientes? ● Detección de anomalías ○ Detección de fraude ● Análisis de Rotación ○ ¿Qué clientes son más proclives de irse a la competencia? ● Gestión de Riesgos ○ ¿Debería de concederse el crédito? ● Segmentación de clientes ○ Clasificación de nuestros clientes ● Anuncios Orientados ○ Personalización de anuncios, contenido,… Procesos de un proyecto de minería de datos
  • 12. ● Previsión ○ ¿Cuánto venderemos el próximo semestre? ● Clasificación ○ Se asigna una categoría a cada caso. Cada caso tiene un conjunto de atributos uno de ellos es el atributo clase. ○ Se busca un modelo que describa el atributo clase como una función de los atributos de salida ● Agrupación ○ También conocido como segmentación ○ Identifica grupos naturales basándose en un conjunto de atributos ● Asociación ○ También conocido como análisis de cesta de la compra ● Regresión ○ Similar a clasificación pero con el objetivo de buscar patrones para determinar un valor numérico ○ Ej.: Predicción de la velocidad del viento basada en temperatura presión de aire y humedad Procesos de un proyecto de minería de datos
  • 13. Las técnicas de la minería de datos provienen de la Inteligencia artificial y de la estadística, dichas técnicas, no son más que algoritmos, más o menos sofisticados que se aplican sobre un conjunto de datos para obtener unos resultados. Técnicas de minería de datos
  • 14. Las técnicas más representativas son ● Redes neuronales ● Árboles de decisión ● Modelos estadísticos ● Agrupamiento o Clustering ● Algoritmos supervisados (o predictivos) ● Algoritmos no supervisados (o del descubrimiento del conocimiento) Técnicas de minería de datos
  • 15. Redes neuronales Son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un estímulo de salida. Algunos ejemplos de red neuronal son: ● El Perceptrón ● El Perceptrón multicapa. ● Los Mapas Autoorganizados, también conocidos como redes de Kohonen. Técnicas de minería de datos
  • 16. Árboles de decisión Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial, dada una base de datos se construyen estos diagramas de construcciones lógicas, muy similares a los sistemas de predicción basados en reglas, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolución de un problema. Ejemplos: ● Algoritmo ID3. ● Algoritmo C4.5. Técnicas de minería de datos
  • 17. Modelos estadísticos ● Es una expresión simbólica en forma de igualdad o ecuación que se emplea en todos los diseños experimentales y en la regresión para indicar los diferentes factores que modifican la variable de respuesta. Técnicas de minería de datos
  • 18. Agrupamiento o Clustering Es un procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia; se tratará de disponer los vectores de entrada de forma que estén más cercanos aquellos que tengan características comunes. Ejemplos: ● Algoritmo K-means. ● Algoritmo K-medoids. Técnicas de minería de datos
  • 19. Según el objetivo del análisis de los datos, los algoritmos utilizados se clasifican en supervisados y no supervisados (Weiss y Indurkhya, 1998): ● Algoritmos supervisados (o predictivos) ○ Predicen un dato (o un conjunto de ellos) desconocido a priori, a partir de otros conocidos. ● Algoritmos no supervisados (o del descubrimiento del conocimiento) ○ Se descubren patrones y tendencias en los datos. Técnicas de minería de datos
  • 20. Técnicas de minería de datos Ejemplo Comprador potencial de bicis: Provincia Ciudad Edad Coche Distancia trabajo Bici
  • 21. Ciclo de un Proyecto de Minería de Datos
  • 22. GRACIAS POR SU ATENCIÓN info@alianzo.com www.alianzo.com