SlideShare ist ein Scribd-Unternehmen logo
1 von 28
Downloaden Sie, um offline zu lesen
Aplicaciones de minería de
          datos

                Por:
    M.C. Leopoldo González Rosas
         www.cnys.com.mx
   campodeEncinos.wordpress.com
Agenda
• Presentación
• Motivación
• ¿qué es minería de datos?
  – Disciplinas involucradas
• Aplicaciones
  – Bibliotecas
  – Universidades
  – otras
• ¿cómo funciona?
  – Arquitectura de inteligencia de negocios
Agenda (cont.)
  – Metodología: El proceso de descubrimiento de
    conocimiento en bases de datos (KDD)
  – Recolección/preparación de datos
  – Algoritmos
  – Modelo predictivo y su interpretación
  – Utilizando los resultados
     • Toma de decisiones
     • Sistemas operacionales
• Software de minería de datos
• Minería de datos y ética
• Conclusión
Presentación
 Yo:
   Formación académica:
         Licenciatura en Ciencias de la computación – BUAP FCC
         Maestría en Ciencias con especialidad en Ingeniería en Sistemas - UDLAP
   Experiencia profesional
        CNyS S.C. - Consultoría (BI, BD, PM, desarrollo de software)
        gedas VW (BI, preventas, consultoría, LP)
        BBVA Bancomer (BI, LP)
        SFA Puebla (soporte técnico BD)
   Experiencia académica
     Programación
     Bases de datos / Inteligencia de negocios
     Universidades: UDLAP, UPAEP, BUAP
   Áreas de interés
     Bases de datos e inteligencia de negocios
     Desarrollo de software
     Proceso de enseñanza - aprendizaje
Motivación
• “Knowing is not enough; we must apply.
  Willing is not enough; we must do.”.
  Goethe
 Generamos datos de manera exponencial
   Era de información
 Obtener el conocimiento
  oculto en esos datos
   Datos  información  conocimiento
 Competir en este mundo de
  negocios globalizado
¿qué es minería de datos?
• Minería LA PREDICCION PARAproceso por el cual
      USAR
           de datos es el MEJORAR Y GANAR EN LOS
  generamos un modelo que sirva para la
                       NEGOCIOS
  predicción,
  – este modelo se genera a partir de datos
    aplicándoles algún algoritmo que construye el
    modelo.
• El modelo se evalúa para saber que tan
  certero será respecto a sus predicciones y
  posteriormente
• se utiliza para predecir el comportamiento
  de cualquier dato nuevo
¿qué es minería de datos? (cont.)
• Es la extracción de información
  implícita, previamente desconocida y
  potencialmente útil a partir de datos
  [Witten I.H. et al, 2011]
• Es una disciplina joven y de rápido
  crecimiento, conocida como KDD, …
  DM como la evolución de TI. [Han J. et
  al, 2012]
• Es la extracción automatizada de
  información escondida a partir de
  (grandes) bases de datos. Te permite
  ser proactivo. Prospectivo en lugar de
  retrospectivo[Thearling K.]
Minería de datos - disciplinas
ejemplo: reglas if-then
if tasaProducciónLagrimas = reducida
  then recomendacion = ninguna
Else
   if edad=joven and astigmatismo=no
   then recomendación = suaves
ejemplo: árbol de decisión
Aplicación en bibliotecas MBA
ID          PRODUCTOS

OCT-1   1   QA      QB

OCT-1   2   QC      QD

OCT-1   3   QE      QA

OCT-1   4   QB      QC

OCT-1   5   QD      QE   QA

OCT-2   6   QB      QC

OCT-2   7   QD      QE

OCT-2   8   QA      QB

OCT-2   9   QC      QA   QB

OCT-2   10 QC       QA   QB

OCT-2   11 QC       QA   QB

OCT-2   12 QC       QD   QE
Aplicación en bibliotecas DT
Aplicación en universidades
Aplicación universidades
Otras aplicaciones
• Marketing
• Predicción de ventas, precios, acciones e índices
  financieros.
• Detección de fraudes en tarjetas de crédito
• Clasificación y filtrado de documentos, e-mails y
  noticias.
• Análisis de llamadas en Centros de atención
  telefónica.
• Clasificación automática de Quejas y
  Sugerencias de Clientes.
Arquitectura de inteligencia de
             negocios
• Software del sistema (system software)
  – Sistemas operativos, DBMS, compiladores
• Software de aplicación (app software)
  – Operacional
    • OLTP y batch
    • Office, nomina, ventas, ERP
  – Para la toma de decisiones -> inteligencia
    de negocios
Arquitectura
Metodología: KDD
Metodología (cont.)
1) Establecer de manera precisa el problema a resolver
    - No gastes dinero, antes de comprar un software
       primero establece que es lo que quieres resolver
2) Exploración inicial
    -preparación y limpieza de datos
    -transformaciones de datos
    - Probar con estadística descriptiva para conocer datos
3) Construcción del modelo y validación
    - Probar algunos modelos y elegir el mejor para el
       problema que se está resolviendo
4) Liberación
    - Una vez construido el modelo se puede usar muchas
       veces
    - Los árboles de decisión son fáciles de liberar
Recolección/preparación de datos

• Extraer, transformar, cargar
  – Posiblemente ya existe un almacén de datos
• Limpieza / calidad de datos
• Transformaciones para la minería
  – “Discretizar” (ejemplo: E B R M)
• Muestra(s) -> vistas minables
  – Cómo se obtiene
  – Tamaño de la muestra
Algoritmos de minería de datos
• Clasificación – predicen una o más variables discretas,
  basandose en los otros atributos en el conjunto de datos.
  Ejemplo: árboles de decisión
• Regresion – predice una o más variables continuas, como
  perdida o ganancia, basandose en los otros atributos en el
  conjunto de datos.
• Segmentación – divide datos en grupos o clusters de
  articulos que tienen propiedades similares.
• Asociación - encuentran correlaciones entre los diferentes
  atributos de un conjunto de datos. Sirven para crear reglas
  de asociación por ejemplo para MBA.
• Análisis de secuencia – encuentra secuencias frecuentes o
  episodios en datos, como en un flujo de rutas Web.
Modelo predictivo y su interpretación



If temperatura = agradable then humedad = normal
Utilizando los resultados
• Se recorre el modelo cada vez que se desea
  predecir
  – Por ejemplo para decidir a quien otorgarle un
    apoyo adicional
  – Por ejemplo para decidir si se le presta o no
    dinero a alguien
• El modelo se puede usar para calificar a los
  datos de los sistemas operacionales para:
  – Por ejemplo: identificar “Preferentes”
  – Por ejemplo: identificar “ evasores fiscales”
Software de DM
•   Weka y pentaho
•   Rapid Miner
•   Microsoft SQL Server 2008 R2
•   sas enterprise miner
•   IBM spss
•   Oracle data mining
Minería de datos y ética
•Es difícil hacer que los datos sean “anónimos”
   – 85% de la gente puede ser identificada por su
     C.P., fecha de nacimiento y genero
•La minería de datos se usa para discriminar
  •Ejemplo: aplicación de prestamos: usar información como sexo,
  religión o raza no es ético
•La situación etica depende de la aplicación
  •Ejemplo: la misma información esta bien en aplicaciones medicas
•Los atributos pueden contener información
problematica
  –Ejemplo: el CP se puede correlacionar con la raza
Conclusiones
• Minería de datos se ha venido estudiando e
  investigando pero no se esta aplicando en los
  diversos problemas de nuestro país
  – Educación, salud, el campo, eliminar la pobreza
• Mientras tenemos científicos trabajando en este
  tema, debemos preparar a las personas que lo
  aplicarán. (astrónomos y astronautas)
• Es una tecnología que ya está al alcance de todo
  el mundo
• ¿Y el e-commerce? ¿Y la nube? ¿y las iPads? …
GRACIAS POR SU ATENCIÓN




  lgr811@cnys.com.mx
   lgr811@yahoo.com
Bibliografía
• campodeEncinos.wordpress.com
• http://catarina.udlap.mx/u_dl_a/tales/documentos/msp/gonzalez
  _r_l/
• http://www.uppuebla.edu.mx/Revista/revista10.pdf
• http://hmi.ucsd.edu/pdf/HMI_2009_ConsumerReport_Dec9_2009
  .pdf
• http://www.cs.waikato.ac.nz/~ml/weka/book.html
• Mark Hall, Eibe Frank, Geoffrey Holmes, Bernhard Pfahringer,
  Peter Reutemann, Ian H. Witten (2009); The WEKA Data Mining
  Software: An Update; SIGKDD Explorations, Volume 11, Issue 1
• Kiron D. et al. Analytics:the widening divide – how companies are
  achieving competitive advantage through analytics. MIT
  Sloan/IBM research report fall 2011
• http://www.kdnuggets.com/software/suites.html
• http://ccita2010.utmetropolitana.edu.mx/recursos/Recursos_digit
  ales.pdf

Weitere ähnliche Inhalte

Was ist angesagt?

Modelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicacionesModelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicacionesÁngel M. Felicísimo
 
 Diagramas uml de sistema de cajero automático
 Diagramas uml de sistema de cajero automático Diagramas uml de sistema de cajero automático
 Diagramas uml de sistema de cajero automáticoItzel656131
 
¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?Scoremind
 
Analisis y diseño de sistema bibliotecario
Analisis y diseño de sistema bibliotecarioAnalisis y diseño de sistema bibliotecario
Analisis y diseño de sistema bibliotecarioJose Guzman
 
Cuadro comparativo metodos
Cuadro comparativo metodosCuadro comparativo metodos
Cuadro comparativo metodosivansierra20
 
Bases de Datos (ACID, Reglas de Codd e Integridad de datos)
Bases de Datos (ACID, Reglas de Codd e Integridad de datos)Bases de Datos (ACID, Reglas de Codd e Integridad de datos)
Bases de Datos (ACID, Reglas de Codd e Integridad de datos)Walter Herrera
 
Planificación Auditoria Informática
Planificación Auditoria InformáticaPlanificación Auditoria Informática
Planificación Auditoria InformáticaLuis Eduardo Aponte
 
Taller práctico de Analítica Predictiva con Rapid Miner
Taller práctico de Analítica Predictiva  con Rapid MinerTaller práctico de Analítica Predictiva  con Rapid Miner
Taller práctico de Analítica Predictiva con Rapid MinerLPI ONG
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos04071977
 
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGIEjemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGIAbel Alejandro Coronado Iruegas
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentaciónedmaga
 
Presentacion de BI asignacion 5
Presentacion de BI asignacion 5Presentacion de BI asignacion 5
Presentacion de BI asignacion 5siusma
 
Ejemplo guion plan estratégico empresa recambios
Ejemplo guion plan estratégico empresa recambiosEjemplo guion plan estratégico empresa recambios
Ejemplo guion plan estratégico empresa recambiosJuan Pedro Cabrera
 
Cadena de valor Software y Sistemas Informáticos Mundial y Argentina
Cadena de valor Software y Sistemas Informáticos Mundial y ArgentinaCadena de valor Software y Sistemas Informáticos Mundial y Argentina
Cadena de valor Software y Sistemas Informáticos Mundial y Argentinawspagnolo
 

Was ist angesagt? (20)

Modelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicacionesModelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicaciones
 
 Diagramas uml de sistema de cajero automático
 Diagramas uml de sistema de cajero automático Diagramas uml de sistema de cajero automático
 Diagramas uml de sistema de cajero automático
 
¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?
 
Analisis y diseño de sistema bibliotecario
Analisis y diseño de sistema bibliotecarioAnalisis y diseño de sistema bibliotecario
Analisis y diseño de sistema bibliotecario
 
Cuadro comparativo metodos
Cuadro comparativo metodosCuadro comparativo metodos
Cuadro comparativo metodos
 
Bases de Datos (ACID, Reglas de Codd e Integridad de datos)
Bases de Datos (ACID, Reglas de Codd e Integridad de datos)Bases de Datos (ACID, Reglas de Codd e Integridad de datos)
Bases de Datos (ACID, Reglas de Codd e Integridad de datos)
 
Planificación Auditoria Informática
Planificación Auditoria InformáticaPlanificación Auditoria Informática
Planificación Auditoria Informática
 
Big Data
Big DataBig Data
Big Data
 
Taller práctico de Analítica Predictiva con Rapid Miner
Taller práctico de Analítica Predictiva  con Rapid MinerTaller práctico de Analítica Predictiva  con Rapid Miner
Taller práctico de Analítica Predictiva con Rapid Miner
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGIEjemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
 
Metodología de auditoría informática
Metodología de auditoría informáticaMetodología de auditoría informática
Metodología de auditoría informática
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Sistema sap
Sistema sapSistema sap
Sistema sap
 
Presentacion de BI asignacion 5
Presentacion de BI asignacion 5Presentacion de BI asignacion 5
Presentacion de BI asignacion 5
 
Ejemplo guion plan estratégico empresa recambios
Ejemplo guion plan estratégico empresa recambiosEjemplo guion plan estratégico empresa recambios
Ejemplo guion plan estratégico empresa recambios
 
Clases de Sistemas de Información en las Empresas
Clases de Sistemas de Información en las EmpresasClases de Sistemas de Información en las Empresas
Clases de Sistemas de Información en las Empresas
 
Linea de Tiempo Big Data
Linea de Tiempo Big DataLinea de Tiempo Big Data
Linea de Tiempo Big Data
 
metodología crystal clear
 metodología crystal clear metodología crystal clear
metodología crystal clear
 
Cadena de valor Software y Sistemas Informáticos Mundial y Argentina
Cadena de valor Software y Sistemas Informáticos Mundial y ArgentinaCadena de valor Software y Sistemas Informáticos Mundial y Argentina
Cadena de valor Software y Sistemas Informáticos Mundial y Argentina
 

Andere mochten auch

Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSlalopg
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datoselsemieni
 
Mineria de datos secuenciales
Mineria de datos secuencialesMineria de datos secuenciales
Mineria de datos secuencialesMarilyn Jaramillo
 
Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosmajitol
 
Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Alexander Jimenez
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textosJesús Tramullas
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisMundo Contact
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I ufrj
 
Open Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpen Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpenAnalytics Spain
 
Minería de Datos
Minería de DatosMinería de Datos
Minería de Datosasuoc
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics Spain
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes socialesMaría Muñoz Parra
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datosdataminingperu
 
Ejemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en WekaEjemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en WekaRaquel Solano
 

Andere mochten auch (20)

Aplicaciones de la mineria de datos
Aplicaciones de la mineria de datosAplicaciones de la mineria de datos
Aplicaciones de la mineria de datos
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos secuenciales
Mineria de datos secuencialesMineria de datos secuenciales
Mineria de datos secuenciales
 
Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datos
 
Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 
Open Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpen Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con Knime
 
Datos mineria chilena cesco
Datos mineria chilena cescoDatos mineria chilena cesco
Datos mineria chilena cesco
 
Minería de Datos
Minería de DatosMinería de Datos
Minería de Datos
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes sociales
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
Ejemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en WekaEjemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en Weka
 

Ähnlich wie aplicaciones de minería de datos

Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data MiningAndres Eyherabide
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Facultad de Informática UCM
 
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Joaquín Borrego-Díaz
 
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Pentaho
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analyticsamdia
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de DatosLuisAzofeifa6
 
Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Pedro Contreras Flores
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdfDarnelyC
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresUniversidad Nacional del Nordeste
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouseEduardo Castro
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azureEduardo Castro
 
La Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLa Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLPI ONG
 
Charla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasCharla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasFelipe Vera (Prodigio Consultores)
 
Minería de Datos - Unidad 1
Minería de Datos - Unidad 1Minería de Datos - Unidad 1
Minería de Datos - Unidad 1Pedro Aaron
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big DataICEMD
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptxJuanCarlosRomanPerez1
 

Ähnlich wie aplicaciones de minería de datos (20)

Data Mining Parte 1.pptx
Data Mining Parte 1.pptxData Mining Parte 1.pptx
Data Mining Parte 1.pptx
 
Data Mining
Data MiningData Mining
Data Mining
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
 
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
 
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Business intelligence (bi) y big data0
Business intelligence (bi) y big data0
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdf
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
La Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLa Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica Predictiva
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Charla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasCharla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecas
 
Session01.pptx
Session01.pptxSession01.pptx
Session01.pptx
 
Minería de Datos - Unidad 1
Minería de Datos - Unidad 1Minería de Datos - Unidad 1
Minería de Datos - Unidad 1
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big Data
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx
 

aplicaciones de minería de datos

  • 1. Aplicaciones de minería de datos Por: M.C. Leopoldo González Rosas www.cnys.com.mx campodeEncinos.wordpress.com
  • 2. Agenda • Presentación • Motivación • ¿qué es minería de datos? – Disciplinas involucradas • Aplicaciones – Bibliotecas – Universidades – otras • ¿cómo funciona? – Arquitectura de inteligencia de negocios
  • 3. Agenda (cont.) – Metodología: El proceso de descubrimiento de conocimiento en bases de datos (KDD) – Recolección/preparación de datos – Algoritmos – Modelo predictivo y su interpretación – Utilizando los resultados • Toma de decisiones • Sistemas operacionales • Software de minería de datos • Minería de datos y ética • Conclusión
  • 4. Presentación  Yo:  Formación académica:  Licenciatura en Ciencias de la computación – BUAP FCC  Maestría en Ciencias con especialidad en Ingeniería en Sistemas - UDLAP  Experiencia profesional  CNyS S.C. - Consultoría (BI, BD, PM, desarrollo de software)  gedas VW (BI, preventas, consultoría, LP)  BBVA Bancomer (BI, LP)  SFA Puebla (soporte técnico BD)  Experiencia académica  Programación  Bases de datos / Inteligencia de negocios  Universidades: UDLAP, UPAEP, BUAP  Áreas de interés  Bases de datos e inteligencia de negocios  Desarrollo de software  Proceso de enseñanza - aprendizaje
  • 5. Motivación • “Knowing is not enough; we must apply. Willing is not enough; we must do.”. Goethe  Generamos datos de manera exponencial  Era de información  Obtener el conocimiento oculto en esos datos  Datos  información  conocimiento  Competir en este mundo de negocios globalizado
  • 6. ¿qué es minería de datos? • Minería LA PREDICCION PARAproceso por el cual USAR de datos es el MEJORAR Y GANAR EN LOS generamos un modelo que sirva para la NEGOCIOS predicción, – este modelo se genera a partir de datos aplicándoles algún algoritmo que construye el modelo. • El modelo se evalúa para saber que tan certero será respecto a sus predicciones y posteriormente • se utiliza para predecir el comportamiento de cualquier dato nuevo
  • 7. ¿qué es minería de datos? (cont.) • Es la extracción de información implícita, previamente desconocida y potencialmente útil a partir de datos [Witten I.H. et al, 2011] • Es una disciplina joven y de rápido crecimiento, conocida como KDD, … DM como la evolución de TI. [Han J. et al, 2012] • Es la extracción automatizada de información escondida a partir de (grandes) bases de datos. Te permite ser proactivo. Prospectivo en lugar de retrospectivo[Thearling K.]
  • 8. Minería de datos - disciplinas
  • 9. ejemplo: reglas if-then if tasaProducciónLagrimas = reducida then recomendacion = ninguna Else if edad=joven and astigmatismo=no then recomendación = suaves
  • 10. ejemplo: árbol de decisión
  • 11. Aplicación en bibliotecas MBA ID PRODUCTOS OCT-1 1 QA QB OCT-1 2 QC QD OCT-1 3 QE QA OCT-1 4 QB QC OCT-1 5 QD QE QA OCT-2 6 QB QC OCT-2 7 QD QE OCT-2 8 QA QB OCT-2 9 QC QA QB OCT-2 10 QC QA QB OCT-2 11 QC QA QB OCT-2 12 QC QD QE
  • 15. Otras aplicaciones • Marketing • Predicción de ventas, precios, acciones e índices financieros. • Detección de fraudes en tarjetas de crédito • Clasificación y filtrado de documentos, e-mails y noticias. • Análisis de llamadas en Centros de atención telefónica. • Clasificación automática de Quejas y Sugerencias de Clientes.
  • 16. Arquitectura de inteligencia de negocios • Software del sistema (system software) – Sistemas operativos, DBMS, compiladores • Software de aplicación (app software) – Operacional • OLTP y batch • Office, nomina, ventas, ERP – Para la toma de decisiones -> inteligencia de negocios
  • 19. Metodología (cont.) 1) Establecer de manera precisa el problema a resolver - No gastes dinero, antes de comprar un software primero establece que es lo que quieres resolver 2) Exploración inicial -preparación y limpieza de datos -transformaciones de datos - Probar con estadística descriptiva para conocer datos 3) Construcción del modelo y validación - Probar algunos modelos y elegir el mejor para el problema que se está resolviendo 4) Liberación - Una vez construido el modelo se puede usar muchas veces - Los árboles de decisión son fáciles de liberar
  • 20. Recolección/preparación de datos • Extraer, transformar, cargar – Posiblemente ya existe un almacén de datos • Limpieza / calidad de datos • Transformaciones para la minería – “Discretizar” (ejemplo: E B R M) • Muestra(s) -> vistas minables – Cómo se obtiene – Tamaño de la muestra
  • 21. Algoritmos de minería de datos • Clasificación – predicen una o más variables discretas, basandose en los otros atributos en el conjunto de datos. Ejemplo: árboles de decisión • Regresion – predice una o más variables continuas, como perdida o ganancia, basandose en los otros atributos en el conjunto de datos. • Segmentación – divide datos en grupos o clusters de articulos que tienen propiedades similares. • Asociación - encuentran correlaciones entre los diferentes atributos de un conjunto de datos. Sirven para crear reglas de asociación por ejemplo para MBA. • Análisis de secuencia – encuentra secuencias frecuentes o episodios en datos, como en un flujo de rutas Web.
  • 22. Modelo predictivo y su interpretación If temperatura = agradable then humedad = normal
  • 23. Utilizando los resultados • Se recorre el modelo cada vez que se desea predecir – Por ejemplo para decidir a quien otorgarle un apoyo adicional – Por ejemplo para decidir si se le presta o no dinero a alguien • El modelo se puede usar para calificar a los datos de los sistemas operacionales para: – Por ejemplo: identificar “Preferentes” – Por ejemplo: identificar “ evasores fiscales”
  • 24. Software de DM • Weka y pentaho • Rapid Miner • Microsoft SQL Server 2008 R2 • sas enterprise miner • IBM spss • Oracle data mining
  • 25. Minería de datos y ética •Es difícil hacer que los datos sean “anónimos” – 85% de la gente puede ser identificada por su C.P., fecha de nacimiento y genero •La minería de datos se usa para discriminar •Ejemplo: aplicación de prestamos: usar información como sexo, religión o raza no es ético •La situación etica depende de la aplicación •Ejemplo: la misma información esta bien en aplicaciones medicas •Los atributos pueden contener información problematica –Ejemplo: el CP se puede correlacionar con la raza
  • 26. Conclusiones • Minería de datos se ha venido estudiando e investigando pero no se esta aplicando en los diversos problemas de nuestro país – Educación, salud, el campo, eliminar la pobreza • Mientras tenemos científicos trabajando en este tema, debemos preparar a las personas que lo aplicarán. (astrónomos y astronautas) • Es una tecnología que ya está al alcance de todo el mundo • ¿Y el e-commerce? ¿Y la nube? ¿y las iPads? …
  • 27. GRACIAS POR SU ATENCIÓN lgr811@cnys.com.mx lgr811@yahoo.com
  • 28. Bibliografía • campodeEncinos.wordpress.com • http://catarina.udlap.mx/u_dl_a/tales/documentos/msp/gonzalez _r_l/ • http://www.uppuebla.edu.mx/Revista/revista10.pdf • http://hmi.ucsd.edu/pdf/HMI_2009_ConsumerReport_Dec9_2009 .pdf • http://www.cs.waikato.ac.nz/~ml/weka/book.html • Mark Hall, Eibe Frank, Geoffrey Holmes, Bernhard Pfahringer, Peter Reutemann, Ian H. Witten (2009); The WEKA Data Mining Software: An Update; SIGKDD Explorations, Volume 11, Issue 1 • Kiron D. et al. Analytics:the widening divide – how companies are achieving competitive advantage through analytics. MIT Sloan/IBM research report fall 2011 • http://www.kdnuggets.com/software/suites.html • http://ccita2010.utmetropolitana.edu.mx/recursos/Recursos_digit ales.pdf