CRISP-DM es un estándar para la metodología de minería de datos desarrollado en 1996. Consiste en seis fases principales para proyectos de minería de datos: comprensión del negocio, comprensión de los datos, preparación de los datos, modelado, evaluación e implantación. El objetivo es organizar el proceso de minería de datos de una manera sistemática y replicable.
2. Qué es CRISP-DM Cross Industry Standard Processfor Data Mining
3. CRISP-DM El CRISP-DM fue concebido a finales de 1996 DaimlerChrysler SPSS (entonces ISL) NCR
4. CRISP-DM, está dividida en 4 niveles de abstracción organizados de forma jerárquica en tareas que van desde el nivel más general, hasta los casos más específicos y organiza eldesarrollo de un proyecto de Data Mining, en una serie de seis fases
6. Fases Comprensión del Negocio Comprensión de los Datos Preparación de los Datos Implantación Datos Modelado Evaluación
7. Comprensión del Negocio Comprensión de los Datos Preparación de los Datos Modelado Evaluación Implantación Determinar objetivos del negocio Background Objetivos del negocio Criterios de éxito del negocio Valoración de la situación Inventario de recursos Requisitos, supuestos y restricciones Riesgos y contingencias Costes y beneficios Determinar los objetivos de DM Metas de Data Mining Criterios de éxito de DM
8. Comprensión del Negocio Comprensión de los Datos Preparación de los Datos Modelado Evaluación Implantación Recolectar los datos iniciales Reporte de recolección Descripción de los datos Reporte de descripción Exploración de los datos Reporte de exploración Verificar la calidad de los datos Reporte de calidad
9. Comprensión del Negocio Comprensión de los Datos Preparación de los Datos Modelado Evaluación Implantación Selección Inclusión Exclusión Dataset Descripción Limpieza Reporte de calidad Estructuración Derivación de atributos Generación de registros Integración Unificación Formateo Reporte de calidad
10. Comprensión del Negocio Comprensión de los Datos Preparación de los Datos Modelado Evaluación Implantación Seleccionar técnica de modelado Técnica seleccionada Supuestos del modelo Generar el plan de prueba Plan de pruebas Construir el modelo Seteo de parámetros Modelo Descripción del modelo Evaluar el modelo Revisión de los parametros
11. Comprensión del Negocio Comprensión de los Datos Preparación de los Datos Modelado Evaluación Implantación Evaluar los resultados Valoración de los resultados Modelos aprobados Revisión del proceso Determinar próximos pasos Técnica modelada Listado de acciones
12. Comprensión del Negocio Comprensión de los Datos Preparación de los Datos Modelado Evaluación Implantación Plan de implantación Plan de monitoreo y mantención Informa final Modelos aprobados Revisión del proyecto Documentación de experiencias