SlideShare ist ein Scribd-Unternehmen logo
1 von 13
Aplicación de minería de datos a
WEKA
Juan P. Sandoval
Armando Tapia
Rolando Valenzuela
Gerardo Zapata
Introducción
•

Weka es un software programado en Java que está orientado a la
extracción de conocimientos desde bases de datos con grandes
cantidades de información.

•

La implementación de los esquemas de aprendizaje son los recursos
más valiosos de WEKA. Las herramientas para el preprocesamiento de
datos, llamados filtros, WEKA centra su atención en los algoritmos de
clasificación y filtro, sin embargo, también incluye la implementación de
algoritmos para el aprendizaje de reglas de asociación y el
agrupamiento de datos (clustering).
Descubrimiento del software
•
•
•

•

En 1993, la Universidad de Waikato de Nueva Zelanda inició el
desarrollo de la versión original de Weka (en TCL/TK y C).
En 1997, se decidió reescribir el código en Java incluyendo
implementaciones de algoritmos de modelado.
En 2005, Weka recibe de SIGKDD2 3 (Special Interest Group on
Knowledge Discovery and Data Mining) el galardón "Data Mining and
Knowledge Discovery Service".
En 2006, Pentaho Corporation adquirió una licencia exclusiva para
usar Weka para Inteligencia de negocio (Business Intelligence), dando
lugar al componente de minería de datos y análisis predictivo del
paquete de software Pentaho Business Intelligence.
Descripción Del Software
• El paquete Weka contiene una colección de herramientas de
visualización y algoritmos para análisis de datos y modelado
predictivo, unidos a una interfaz gráfica de usuario para
acceder fácilmente a sus funcionalidades. La versión original
de Weka fue un front-end enTCL/TK para modelar algoritmos
implementados en otros lenguajes de programación, más
unas utilidades para pre procesamiento de datos
desarrolladas en C para hacer experimentos de aprendizaje
automático.
Operaciones del software
Razones a favor de Weka
•Está disponible libremente bajo la licencia pública general de
GNU.
•Es muy portable porque está completamente implementado en
Java y puede correr en casi cualquier plataforma.
•Contiene una extensa colección de técnicas para
preprocesamiento de datos y modelado.
•Es fácil de utilizar por un principiante gracias a su interfaz
gráfica de usuario.
Interfaz del usuario
La interfaz del usuario
• Simple CLI
• Simple CLI es la abreviatura de Simple
Command-Line Interface (Interfaz Simple de
Línea de Comandos); se trata de una consola
que permite acceder a todas las opciones de
Weka desde línea de comandos.
• Explorer
• La interfaz Explorer (Explorador) dispone de varios
paneles que dan acceso a los componentes
principales del banco de trabajo:
• "Preprocess“
• "Classify“
• "Associate"
• "Cluster“
• "Selectedattributes"
• Experimenter
• La interfaz Experimenter (Experimentador)
permite la comparación sistemática de una
ejecución de los algoritmos predictivos de
Weka sobre una colección de conjuntos de
datos.
• Knowledge Flow
• KnowledgeFlow (Flujo de Conocimiento) es
una interfaz que soporta esencialmente las
mismas funciones que el Explorer pero con
una interfaz que permite "arrastrar y soltar".
Una ventaja es que ofrece soporte para el
aprendizaje incremental.
Ejercicio
• El fichero contiene una serie de filas, cada una
de las cuales contiene un conjunto de factores
meteorológicos de un determinado día y nos
indica si se ha podido jugar o no al tenis.
Nuestro objetivo será crear un árbol de
decisión que nos ayude a predecir si, por
ejemplo, hoy vamos a poder jugar al tenis.
Weka
Weka

Weitere ähnliche Inhalte

Was ist angesagt?

Auditoria y centro de procesamiento de datos
Auditoria y centro de procesamiento de datosAuditoria y centro de procesamiento de datos
Auditoria y centro de procesamiento de datosadolfo1608
 
Estándares de Auditoria en sistemas
Estándares de Auditoria en sistemas  Estándares de Auditoria en sistemas
Estándares de Auditoria en sistemas Nanet Martinez
 
Planificación de proyectos de software
Planificación de proyectos de softwarePlanificación de proyectos de software
Planificación de proyectos de softwarehrubenleiva21
 
AUDITORIA INFORMÁTICA
AUDITORIA INFORMÁTICAAUDITORIA INFORMÁTICA
AUDITORIA INFORMÁTICAinnovasisc
 
Análisis y diseño de sistemas estructurado
Análisis y diseño de sistemas estructuradoAnálisis y diseño de sistemas estructurado
Análisis y diseño de sistemas estructuradojr_palaciosg
 
Auditoria en informática
Auditoria en informáticaAuditoria en informática
Auditoria en informáticalederzon
 
Ingeniería inversa y reingeniería de software
Ingeniería inversa y reingeniería de softwareIngeniería inversa y reingeniería de software
Ingeniería inversa y reingeniería de softwareMoises Medina
 
DocumentacióN De Un Sistema De InformacióN
DocumentacióN De Un Sistema De InformacióNDocumentacióN De Un Sistema De InformacióN
DocumentacióN De Un Sistema De InformacióNFernanda Garza
 
El ciclo de vida del desarrollo de los sistemas de información
El ciclo de vida del desarrollo de los sistemas de informaciónEl ciclo de vida del desarrollo de los sistemas de información
El ciclo de vida del desarrollo de los sistemas de informaciónJose Daniel Pacheco Mejia
 
Sistemas Operativos Gestion de procesos
Sistemas Operativos Gestion de procesosSistemas Operativos Gestion de procesos
Sistemas Operativos Gestion de procesosChiNo Sosa Erazo
 
2.4 Listas de control de Acceso - IPv6
2.4 Listas de control de Acceso - IPv62.4 Listas de control de Acceso - IPv6
2.4 Listas de control de Acceso - IPv6David Narváez
 

Was ist angesagt? (20)

Auditoria de RED AREA LOCAL
Auditoria de RED AREA LOCALAuditoria de RED AREA LOCAL
Auditoria de RED AREA LOCAL
 
Auditoria informatica
Auditoria informaticaAuditoria informatica
Auditoria informatica
 
Estimación de Proyectos de Software
Estimación de Proyectos de SoftwareEstimación de Proyectos de Software
Estimación de Proyectos de Software
 
Auditoria y centro de procesamiento de datos
Auditoria y centro de procesamiento de datosAuditoria y centro de procesamiento de datos
Auditoria y centro de procesamiento de datos
 
AUDITORIA INFORMATICA 1
AUDITORIA INFORMATICA 1AUDITORIA INFORMATICA 1
AUDITORIA INFORMATICA 1
 
Estándares de Auditoria en sistemas
Estándares de Auditoria en sistemas  Estándares de Auditoria en sistemas
Estándares de Auditoria en sistemas
 
Auditoría de redes
Auditoría de redesAuditoría de redes
Auditoría de redes
 
Planificación de proyectos de software
Planificación de proyectos de softwarePlanificación de proyectos de software
Planificación de proyectos de software
 
Arquitectura de sistemas distribuidos
Arquitectura de sistemas distribuidosArquitectura de sistemas distribuidos
Arquitectura de sistemas distribuidos
 
SQLite
SQLiteSQLite
SQLite
 
AUDITORIA INFORMÁTICA
AUDITORIA INFORMÁTICAAUDITORIA INFORMÁTICA
AUDITORIA INFORMÁTICA
 
Análisis y diseño de sistemas estructurado
Análisis y diseño de sistemas estructuradoAnálisis y diseño de sistemas estructurado
Análisis y diseño de sistemas estructurado
 
Auditoria en informática
Auditoria en informáticaAuditoria en informática
Auditoria en informática
 
Proceso unificado
Proceso unificadoProceso unificado
Proceso unificado
 
Ingeniería inversa y reingeniería de software
Ingeniería inversa y reingeniería de softwareIngeniería inversa y reingeniería de software
Ingeniería inversa y reingeniería de software
 
DocumentacióN De Un Sistema De InformacióN
DocumentacióN De Un Sistema De InformacióNDocumentacióN De Un Sistema De InformacióN
DocumentacióN De Un Sistema De InformacióN
 
El ciclo de vida del desarrollo de los sistemas de información
El ciclo de vida del desarrollo de los sistemas de informaciónEl ciclo de vida del desarrollo de los sistemas de información
El ciclo de vida del desarrollo de los sistemas de información
 
Weka
WekaWeka
Weka
 
Sistemas Operativos Gestion de procesos
Sistemas Operativos Gestion de procesosSistemas Operativos Gestion de procesos
Sistemas Operativos Gestion de procesos
 
2.4 Listas de control de Acceso - IPv6
2.4 Listas de control de Acceso - IPv62.4 Listas de control de Acceso - IPv6
2.4 Listas de control de Acceso - IPv6
 

Ähnlich wie Weka

Desarrollo aplicaciones windows c#
Desarrollo aplicaciones windows c#Desarrollo aplicaciones windows c#
Desarrollo aplicaciones windows c#Roger Campos
 
Introducción a Scala
Introducción a ScalaIntroducción a Scala
Introducción a Scalajose diaz
 
Mi lenguaje de programación de preferencia
Mi lenguaje de programación de preferenciaMi lenguaje de programación de preferencia
Mi lenguaje de programación de preferenciaglfloresgilberto
 
CÓDIGOS ABIERTOS.pptx
CÓDIGOS ABIERTOS.pptxCÓDIGOS ABIERTOS.pptx
CÓDIGOS ABIERTOS.pptxBritneyCano
 
Gestión de Recursos Computacionales en el Cloud para Actividades Educativas
Gestión de Recursos Computacionales en el Cloud para Actividades EducativasGestión de Recursos Computacionales en el Cloud para Actividades Educativas
Gestión de Recursos Computacionales en el Cloud para Actividades EducativasGermán Moltó
 
Meetup DigitalOcean Cloud Native architecture
Meetup DigitalOcean Cloud Native architectureMeetup DigitalOcean Cloud Native architecture
Meetup DigitalOcean Cloud Native architectureDomingo Suarez Torres
 
herramientas tecnológicas
herramientas tecnológicasherramientas tecnológicas
herramientas tecnológicasGerardo Linares
 
Abf leccion 02
Abf leccion 02Abf leccion 02
Abf leccion 02victdiazm
 
Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)
Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)
Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)Marco Antonio Ordoñez Valverde
 
Dev ops with Data
Dev ops with DataDev ops with Data
Dev ops with Datannakasone
 
1 fundamentos java
1 fundamentos java1 fundamentos java
1 fundamentos javaayreonmx
 
Sistemas gestores de base de datos (sgbd)
Sistemas gestores de base de datos (sgbd)Sistemas gestores de base de datos (sgbd)
Sistemas gestores de base de datos (sgbd)Henry Cumbicus Rivera
 
PRIMERA PRESENTACION JAVA
PRIMERA PRESENTACION JAVAPRIMERA PRESENTACION JAVA
PRIMERA PRESENTACION JAVANoralma Yanez
 
Mi Lenguaje de Programacion de Preferencia
Mi Lenguaje de Programacion de PreferenciaMi Lenguaje de Programacion de Preferencia
Mi Lenguaje de Programacion de PreferenciaNelson Rivera
 

Ähnlich wie Weka (20)

JAVA.pptx
JAVA.pptxJAVA.pptx
JAVA.pptx
 
Desarrollo aplicaciones windows c#
Desarrollo aplicaciones windows c#Desarrollo aplicaciones windows c#
Desarrollo aplicaciones windows c#
 
Introducción a Scala
Introducción a ScalaIntroducción a Scala
Introducción a Scala
 
Mi lenguaje de programación de preferencia
Mi lenguaje de programación de preferenciaMi lenguaje de programación de preferencia
Mi lenguaje de programación de preferencia
 
CÓDIGOS ABIERTOS.pptx
CÓDIGOS ABIERTOS.pptxCÓDIGOS ABIERTOS.pptx
CÓDIGOS ABIERTOS.pptx
 
Gestión de Recursos Computacionales en el Cloud para Actividades Educativas
Gestión de Recursos Computacionales en el Cloud para Actividades EducativasGestión de Recursos Computacionales en el Cloud para Actividades Educativas
Gestión de Recursos Computacionales en el Cloud para Actividades Educativas
 
Meetup DigitalOcean Cloud Native architecture
Meetup DigitalOcean Cloud Native architectureMeetup DigitalOcean Cloud Native architecture
Meetup DigitalOcean Cloud Native architecture
 
herramientas tecnológicas
herramientas tecnológicasherramientas tecnológicas
herramientas tecnológicas
 
Abf leccion 02
Abf leccion 02Abf leccion 02
Abf leccion 02
 
Introduccion Java.ppt
Introduccion Java.pptIntroduccion Java.ppt
Introduccion Java.ppt
 
Lenguaje Java
Lenguaje JavaLenguaje Java
Lenguaje Java
 
Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)
Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)
Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)
 
Dev ops with Data
Dev ops with DataDev ops with Data
Dev ops with Data
 
Practica 8 Wireshark
Practica 8 WiresharkPractica 8 Wireshark
Practica 8 Wireshark
 
1 fundamentos java
1 fundamentos java1 fundamentos java
1 fundamentos java
 
Sistemas gestores de base de datos (sgbd)
Sistemas gestores de base de datos (sgbd)Sistemas gestores de base de datos (sgbd)
Sistemas gestores de base de datos (sgbd)
 
PRIMERA PRESENTACION JAVA
PRIMERA PRESENTACION JAVAPRIMERA PRESENTACION JAVA
PRIMERA PRESENTACION JAVA
 
Lenguaje Java
Lenguaje JavaLenguaje Java
Lenguaje Java
 
Programación
ProgramaciónProgramación
Programación
 
Mi Lenguaje de Programacion de Preferencia
Mi Lenguaje de Programacion de PreferenciaMi Lenguaje de Programacion de Preferencia
Mi Lenguaje de Programacion de Preferencia
 

Weka

  • 1. Aplicación de minería de datos a WEKA Juan P. Sandoval Armando Tapia Rolando Valenzuela Gerardo Zapata
  • 2. Introducción • Weka es un software programado en Java que está orientado a la extracción de conocimientos desde bases de datos con grandes cantidades de información. • La implementación de los esquemas de aprendizaje son los recursos más valiosos de WEKA. Las herramientas para el preprocesamiento de datos, llamados filtros, WEKA centra su atención en los algoritmos de clasificación y filtro, sin embargo, también incluye la implementación de algoritmos para el aprendizaje de reglas de asociación y el agrupamiento de datos (clustering).
  • 3. Descubrimiento del software • • • • En 1993, la Universidad de Waikato de Nueva Zelanda inició el desarrollo de la versión original de Weka (en TCL/TK y C). En 1997, se decidió reescribir el código en Java incluyendo implementaciones de algoritmos de modelado. En 2005, Weka recibe de SIGKDD2 3 (Special Interest Group on Knowledge Discovery and Data Mining) el galardón "Data Mining and Knowledge Discovery Service". En 2006, Pentaho Corporation adquirió una licencia exclusiva para usar Weka para Inteligencia de negocio (Business Intelligence), dando lugar al componente de minería de datos y análisis predictivo del paquete de software Pentaho Business Intelligence.
  • 4. Descripción Del Software • El paquete Weka contiene una colección de herramientas de visualización y algoritmos para análisis de datos y modelado predictivo, unidos a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades. La versión original de Weka fue un front-end enTCL/TK para modelar algoritmos implementados en otros lenguajes de programación, más unas utilidades para pre procesamiento de datos desarrolladas en C para hacer experimentos de aprendizaje automático.
  • 5. Operaciones del software Razones a favor de Weka •Está disponible libremente bajo la licencia pública general de GNU. •Es muy portable porque está completamente implementado en Java y puede correr en casi cualquier plataforma. •Contiene una extensa colección de técnicas para preprocesamiento de datos y modelado. •Es fácil de utilizar por un principiante gracias a su interfaz gráfica de usuario.
  • 7. La interfaz del usuario • Simple CLI • Simple CLI es la abreviatura de Simple Command-Line Interface (Interfaz Simple de Línea de Comandos); se trata de una consola que permite acceder a todas las opciones de Weka desde línea de comandos.
  • 8. • Explorer • La interfaz Explorer (Explorador) dispone de varios paneles que dan acceso a los componentes principales del banco de trabajo: • "Preprocess“ • "Classify“ • "Associate" • "Cluster“ • "Selectedattributes"
  • 9. • Experimenter • La interfaz Experimenter (Experimentador) permite la comparación sistemática de una ejecución de los algoritmos predictivos de Weka sobre una colección de conjuntos de datos.
  • 10. • Knowledge Flow • KnowledgeFlow (Flujo de Conocimiento) es una interfaz que soporta esencialmente las mismas funciones que el Explorer pero con una interfaz que permite "arrastrar y soltar". Una ventaja es que ofrece soporte para el aprendizaje incremental.
  • 11. Ejercicio • El fichero contiene una serie de filas, cada una de las cuales contiene un conjunto de factores meteorológicos de un determinado día y nos indica si se ha podido jugar o no al tenis. Nuestro objetivo será crear un árbol de decisión que nos ayude a predecir si, por ejemplo, hoy vamos a poder jugar al tenis.