SlideShare ist ein Scribd-Unternehmen logo
1 von 16
En este caso se trata de predecir el tipo de medicamento que se

    debe administrar a un paciente con una enfermedad determinada
    según distintos parámetros/variables. Las variables que se recogen
    en los historiales clínicos de cada paciente son:
       Age: Edad
       Sex: Sexo
       BP (Blood Pressure): Tensión sanguínea.
       Cholesterol: nivel de colesterol.
       Na: Nivel de sodio en la sangre.
       K: Nivel de potasio en la sangre.

    Hay cinco tratamientos posibles: DrugA, DrugB, DrugC, DrugX,

    DrugY. los datos del medicamento idóneo para muchos pacientes
    se han tomade de cuatro hospitales.
Una vez inicializado el weka procedemos a
cargar el proyecto de la siguiente manera:
Aquí analizamos cuantos atributos tenemos y
de que tipo son:
En la grafica anterior nos podemos dar cuenta que
tenemos 7 atributos y en la parte derecha de la
pantalla podemos ver el tipo de atributo y los
componentes que tiene.
Lo mismo podemos hacer con todas las variables
para poder darnos cuenta.
En la pantalla nos muestra los parámetros a
escoger para poder generar el árbol de
clasificación.
En este caso tomamos el J48, en test options
damos clic en la pestaña Use training set y por
último damos clic en start y podemos darnos
cuenta que nos da una tabla de resultados.
=== Run information ===
Scheme: weka.classifiers.trees.J48 -C 0.25 -M 2
Relation: DRUG1n
Instances: 200
Attributes: 7
       Age
       Sex
       BP
       Cholesterol
       Na
       K
       Drug
Test mode: evaluate on training data
=== Classifier model (full training set) ===
J48 pruned tree
------------------
K <= 0.055221
| K <= 0.037124: drugY (56.0)
| K > 0.037124
| | Na <= 0.685143
| | | BP = HIGH
| | | | Na <= 0.656371: drugA (6.0)
| | | | Na > 0.656371: drugY (2.0/1.0)
| | | BP = LOW
| | | | Sex = F: drugC (3.0)
| | | | Sex = M: drugX (4.0/1.0)
| | | BP = NORMAL: drugX (11.0/1.0)
| | Na > 0.685143: drugY (33.0/2.0)
K > 0.055221
| BP = HIGH
| | Age <= 50: drugA (17.0)
| | Age > 50: drugB (15.0)
| BP = LOW
| | Cholesterol = HIGH: drugC (14.0/1.0)
| | Cholesterol = NORMAL: drugX (13.0)
| BP = NORMAL: drugX (26.0)
Number of Leaves :              12
Size of the tree :              21

Time taken to build model: 0.02 seconds
=== Evaluation on training set ===
=== Summary ===
Correctly Classified Instances      194     97 %
Incorrectly Classified Instances     6      3%
Kappa statistic              0.9568
Mean absolute error              0.0199
Root mean squared error             0.0997
Relative absolute error          7.1292 %
Root relative squared error        26.749 %
Total Number of Instances          200
=== Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F-Measure Class
 0.967 0.028 0.967 0.967 0.967 drugY
 1    0.005 0.941 1      0.97 drugC
 0.963 0.014 0.963 0.963 0.963 drugX
 1    0    1   1     1   drugA
 0.938 0     1    0.938 0.968 drugB
=== Confusion Matrix ===
a b c d e <-- classified as
88 1 2 0 0 | a = drugY
0 16 0 0 0 | b = drugC
2 0 52 0 0 | c = drugX
0 0 0 23 0 | d = drugA
1 0 0 0 15 | e = drugB
Como podemos observar weka nos informa en
primer lugar de algunos parámetros del dataset.
A continuación nos muestra de manera textual
el modelo aprendido. Por ultimo nos incluye
información sobre la evaluación del modelo. En
este problema. Además podemos conocer más
detalles de la distribución de los ejemplos por
clase en la matriz de confusión.
Luego realizamos clic derecho en el link que nos
dio en el momento de que pinchamos start y
nos ubicamos en la parte que dice visualize tree
Nos presenta una nueva pantalla con el árbol.
Como podemos observar, el árbol tiene
 bastantes reglas. Podemos ver cuál es el
 acierto de este árbol respecto a los datos de
 entrenamiento. Sin embargo, en este caso
 tenemos un error de sólo el 3,5% sobre los
 datos de entrenamiento. Este modelo es
 muchísimo mejor que sí sólo nos guiamos por
 la distribución, que nos daría un error de más
 del 50% .
Podemos analizar pares de atributos utilizando
diferentes gráficos. Para comparar la relación entre
atributos en Weka debemos acudir al entorno
Visualize, donde podemos realizar gráficas entre pares de
atributos y ver si tienen alguna relación con las clases. De
entre todas las combinaciones posibles, destaca la que
utiliza los parámetros de los niveles de sodio y potasio (K
y Na) ver Pulsando en la parte inferior sobre las
clases, podemos cambiar los colores asignados a las
clases, mejorando la visualización del gráfico. Además
podemos ampliar y ver con más detalle alguna zona del
gráfico con select instance y submit.
En este gráfico sí que se ven algunas
características muy significativas. Parece haber
una clara separación lineal entre una relación
K/Na alta y una relación K/Na baja. De
hecho, para las concentraciones K/Na bajas, el
tratamiento Y es el más efectivo de una manera
clara y parece mostrarse que por encima de un
cierto cociente K/Na ese medicamento deja de
ser efectivo y se debe recurrir a los otros cuatro.
Luis Eduardo Cuenca Hurtado


Weitere ähnliche Inhalte

Was ist angesagt?

teoria de conjunto
teoria de conjuntoteoria de conjunto
teoria de conjuntopazvidal999
 
Patrones bridge puente
Patrones bridge puentePatrones bridge puente
Patrones bridge puenteMario Cabrera
 
Planificación estratégica
Planificación estratégicaPlanificación estratégica
Planificación estratégicadanmer28
 
PLANEACION ESTRATEGICA DE LOS RECURSOS HUMANOS COMO CREACION DE VALOR EN LAS ...
PLANEACION ESTRATEGICA DE LOS RECURSOS HUMANOS COMO CREACION DE VALOR EN LAS ...PLANEACION ESTRATEGICA DE LOS RECURSOS HUMANOS COMO CREACION DE VALOR EN LAS ...
PLANEACION ESTRATEGICA DE LOS RECURSOS HUMANOS COMO CREACION DE VALOR EN LAS ...dsarcila
 
Cuadro comparativo de los modelos estrategicos
Cuadro comparativo de los modelos estrategicosCuadro comparativo de los modelos estrategicos
Cuadro comparativo de los modelos estrategicosrafaelgaleanopetro
 
Pack de rubrica de matematica
Pack de rubrica de matematicaPack de rubrica de matematica
Pack de rubrica de matematicaAlumic S.A
 
Simbologia ansi (1)
Simbologia ansi (1)Simbologia ansi (1)
Simbologia ansi (1)AxePal
 
Unidad 2. modelo entidad relacion
Unidad 2. modelo entidad relacionUnidad 2. modelo entidad relacion
Unidad 2. modelo entidad relacionLuiS YmAY
 
EVALUACIÓN DEL SISTEMA ORGANIZACIONAL EMPRESARIAL
EVALUACIÓN DEL SISTEMA ORGANIZACIONAL EMPRESARIALEVALUACIÓN DEL SISTEMA ORGANIZACIONAL EMPRESARIAL
EVALUACIÓN DEL SISTEMA ORGANIZACIONAL EMPRESARIALGera Herrera Izquierdo
 
7. misión, visión y valores 092016
7. misión, visión y  valores 0920167. misión, visión y  valores 092016
7. misión, visión y valores 092016Carmen De Leon
 

Was ist angesagt? (13)

teoria de conjunto
teoria de conjuntoteoria de conjunto
teoria de conjunto
 
Patrones bridge puente
Patrones bridge puentePatrones bridge puente
Patrones bridge puente
 
Planificación estratégica
Planificación estratégicaPlanificación estratégica
Planificación estratégica
 
PLANEACION ESTRATEGICA DE LOS RECURSOS HUMANOS COMO CREACION DE VALOR EN LAS ...
PLANEACION ESTRATEGICA DE LOS RECURSOS HUMANOS COMO CREACION DE VALOR EN LAS ...PLANEACION ESTRATEGICA DE LOS RECURSOS HUMANOS COMO CREACION DE VALOR EN LAS ...
PLANEACION ESTRATEGICA DE LOS RECURSOS HUMANOS COMO CREACION DE VALOR EN LAS ...
 
Cuadro comparativo de los modelos estrategicos
Cuadro comparativo de los modelos estrategicosCuadro comparativo de los modelos estrategicos
Cuadro comparativo de los modelos estrategicos
 
Pack de rubrica de matematica
Pack de rubrica de matematicaPack de rubrica de matematica
Pack de rubrica de matematica
 
Diagrama pert
Diagrama pertDiagrama pert
Diagrama pert
 
Simbologia ansi (1)
Simbologia ansi (1)Simbologia ansi (1)
Simbologia ansi (1)
 
Unidad 2. modelo entidad relacion
Unidad 2. modelo entidad relacionUnidad 2. modelo entidad relacion
Unidad 2. modelo entidad relacion
 
La planificaciòn
La planificaciònLa planificaciòn
La planificaciòn
 
EVALUACIÓN DEL SISTEMA ORGANIZACIONAL EMPRESARIAL
EVALUACIÓN DEL SISTEMA ORGANIZACIONAL EMPRESARIALEVALUACIÓN DEL SISTEMA ORGANIZACIONAL EMPRESARIAL
EVALUACIÓN DEL SISTEMA ORGANIZACIONAL EMPRESARIAL
 
7. misión, visión y valores 092016
7. misión, visión y  valores 0920167. misión, visión y  valores 092016
7. misión, visión y valores 092016
 
Flujogramas
FlujogramasFlujogramas
Flujogramas
 

Ähnlich wie Ejemplo d eun ejercicio en Weka

Ejemplo de analisis_descriptivo_de_un_conjunto_de_datos
Ejemplo de analisis_descriptivo_de_un_conjunto_de_datosEjemplo de analisis_descriptivo_de_un_conjunto_de_datos
Ejemplo de analisis_descriptivo_de_un_conjunto_de_datosVerónica Melgarejo
 
Árboles de Decisión en Weka
Árboles de Decisión en WekaÁrboles de Decisión en Weka
Árboles de Decisión en WekaLorena Quiñónez
 
Reporte del DATA SET "Balance scale" con WEKA
Reporte del DATA SET "Balance scale" con WEKAReporte del DATA SET "Balance scale" con WEKA
Reporte del DATA SET "Balance scale" con WEKANathaly Rohe
 
Analisis discriminante
Analisis discriminanteAnalisis discriminante
Analisis discriminanteIsaac Amaya
 
Sistemas de Control de Calidad Básico e Intermedio para el Laboratorio Clínico
Sistemas de Control de Calidad Básico e Intermedio para el Laboratorio ClínicoSistemas de Control de Calidad Básico e Intermedio para el Laboratorio Clínico
Sistemas de Control de Calidad Básico e Intermedio para el Laboratorio ClínicoIPN
 
Estadistica bivariada
Estadistica bivariadaEstadistica bivariada
Estadistica bivariadaMariiiaaRC
 
Distribución de frecuencias, resúmenes numéricos y gráficas.
Distribución de frecuencias, resúmenes numéricos y gráficas.Distribución de frecuencias, resúmenes numéricos y gráficas.
Distribución de frecuencias, resúmenes numéricos y gráficas.alejandravega98
 
Taller medidas descriptivas
Taller medidas descriptivasTaller medidas descriptivas
Taller medidas descriptivasidea
 
Taller medidas descriptivas
Taller medidas descriptivasTaller medidas descriptivas
Taller medidas descriptivasidea
 

Ähnlich wie Ejemplo d eun ejercicio en Weka (20)

ARBOLES DE CLASIFICACION
ARBOLES DE CLASIFICACIONARBOLES DE CLASIFICACION
ARBOLES DE CLASIFICACION
 
Ejemplo de analisis_descriptivo_de_un_conjunto_de_datos
Ejemplo de analisis_descriptivo_de_un_conjunto_de_datosEjemplo de analisis_descriptivo_de_un_conjunto_de_datos
Ejemplo de analisis_descriptivo_de_un_conjunto_de_datos
 
Aplicacion Weka Lorena Leon
Aplicacion Weka Lorena LeonAplicacion Weka Lorena Leon
Aplicacion Weka Lorena Leon
 
Árboles de Decisión en Weka
Árboles de Decisión en WekaÁrboles de Decisión en Weka
Árboles de Decisión en Weka
 
407473849-ERROR-TOTAL-pdf.pdf
407473849-ERROR-TOTAL-pdf.pdf407473849-ERROR-TOTAL-pdf.pdf
407473849-ERROR-TOTAL-pdf.pdf
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Tarea 6
Tarea 6Tarea 6
Tarea 6
 
Laboratorio De Farmacología .pdf
Laboratorio De Farmacología .pdfLaboratorio De Farmacología .pdf
Laboratorio De Farmacología .pdf
 
Reporte del DATA SET "Balance scale" con WEKA
Reporte del DATA SET "Balance scale" con WEKAReporte del DATA SET "Balance scale" con WEKA
Reporte del DATA SET "Balance scale" con WEKA
 
Analisis discriminante
Analisis discriminanteAnalisis discriminante
Analisis discriminante
 
Sistemas de Control de Calidad Básico e Intermedio para el Laboratorio Clínico
Sistemas de Control de Calidad Básico e Intermedio para el Laboratorio ClínicoSistemas de Control de Calidad Básico e Intermedio para el Laboratorio Clínico
Sistemas de Control de Calidad Básico e Intermedio para el Laboratorio Clínico
 
Tarea obligatoria v
Tarea obligatoria vTarea obligatoria v
Tarea obligatoria v
 
Spss
Spss Spss
Spss
 
Estadistica bivariada
Estadistica bivariadaEstadistica bivariada
Estadistica bivariada
 
Distribución de frecuencias, resúmenes numéricos y gráficas.
Distribución de frecuencias, resúmenes numéricos y gráficas.Distribución de frecuencias, resúmenes numéricos y gráficas.
Distribución de frecuencias, resúmenes numéricos y gráficas.
 
Bioestadística
BioestadísticaBioestadística
Bioestadística
 
Lab 01
Lab 01Lab 01
Lab 01
 
Taller medidas descriptivas
Taller medidas descriptivasTaller medidas descriptivas
Taller medidas descriptivas
 
Taller medidas descriptivas
Taller medidas descriptivasTaller medidas descriptivas
Taller medidas descriptivas
 
Significancia estadistica
Significancia estadisticaSignificancia estadistica
Significancia estadistica
 

Mehr von luis eduardo

Mehr von luis eduardo (7)

Inteligencia Informe
Inteligencia InformeInteligencia Informe
Inteligencia Informe
 
Presentacion Rutas Turisticas
Presentacion Rutas TuristicasPresentacion Rutas Turisticas
Presentacion Rutas Turisticas
 
Tripletas Luis Eduardo
Tripletas Luis EduardoTripletas Luis Eduardo
Tripletas Luis Eduardo
 
Tripletas
TripletasTripletas
Tripletas
 
Tecnologia Dsl
Tecnologia DslTecnologia Dsl
Tecnologia Dsl
 
Xgrid
XgridXgrid
Xgrid
 
Creative commons
Creative commonsCreative commons
Creative commons
 

Ejemplo d eun ejercicio en Weka

  • 1.
  • 2. En este caso se trata de predecir el tipo de medicamento que se  debe administrar a un paciente con una enfermedad determinada según distintos parámetros/variables. Las variables que se recogen en los historiales clínicos de cada paciente son:  Age: Edad  Sex: Sexo  BP (Blood Pressure): Tensión sanguínea.  Cholesterol: nivel de colesterol.  Na: Nivel de sodio en la sangre.  K: Nivel de potasio en la sangre. Hay cinco tratamientos posibles: DrugA, DrugB, DrugC, DrugX,  DrugY. los datos del medicamento idóneo para muchos pacientes se han tomade de cuatro hospitales.
  • 3. Una vez inicializado el weka procedemos a cargar el proyecto de la siguiente manera:
  • 4. Aquí analizamos cuantos atributos tenemos y de que tipo son:
  • 5. En la grafica anterior nos podemos dar cuenta que tenemos 7 atributos y en la parte derecha de la pantalla podemos ver el tipo de atributo y los componentes que tiene. Lo mismo podemos hacer con todas las variables para poder darnos cuenta.
  • 6. En la pantalla nos muestra los parámetros a escoger para poder generar el árbol de clasificación.
  • 7. En este caso tomamos el J48, en test options damos clic en la pestaña Use training set y por último damos clic en start y podemos darnos cuenta que nos da una tabla de resultados.
  • 8. === Run information === Scheme: weka.classifiers.trees.J48 -C 0.25 -M 2 Relation: DRUG1n Instances: 200 Attributes: 7 Age Sex BP Cholesterol Na K Drug Test mode: evaluate on training data === Classifier model (full training set) === J48 pruned tree ------------------ K <= 0.055221 | K <= 0.037124: drugY (56.0) | K > 0.037124 | | Na <= 0.685143 | | | BP = HIGH | | | | Na <= 0.656371: drugA (6.0) | | | | Na > 0.656371: drugY (2.0/1.0) | | | BP = LOW | | | | Sex = F: drugC (3.0) | | | | Sex = M: drugX (4.0/1.0) | | | BP = NORMAL: drugX (11.0/1.0) | | Na > 0.685143: drugY (33.0/2.0) K > 0.055221 | BP = HIGH | | Age <= 50: drugA (17.0) | | Age > 50: drugB (15.0) | BP = LOW | | Cholesterol = HIGH: drugC (14.0/1.0) | | Cholesterol = NORMAL: drugX (13.0) | BP = NORMAL: drugX (26.0) Number of Leaves : 12 Size of the tree : 21 Time taken to build model: 0.02 seconds === Evaluation on training set === === Summary === Correctly Classified Instances 194 97 % Incorrectly Classified Instances 6 3% Kappa statistic 0.9568 Mean absolute error 0.0199 Root mean squared error 0.0997 Relative absolute error 7.1292 % Root relative squared error 26.749 % Total Number of Instances 200 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure Class 0.967 0.028 0.967 0.967 0.967 drugY 1 0.005 0.941 1 0.97 drugC 0.963 0.014 0.963 0.963 0.963 drugX 1 0 1 1 1 drugA 0.938 0 1 0.938 0.968 drugB === Confusion Matrix === a b c d e <-- classified as 88 1 2 0 0 | a = drugY 0 16 0 0 0 | b = drugC 2 0 52 0 0 | c = drugX 0 0 0 23 0 | d = drugA 1 0 0 0 15 | e = drugB
  • 9. Como podemos observar weka nos informa en primer lugar de algunos parámetros del dataset. A continuación nos muestra de manera textual el modelo aprendido. Por ultimo nos incluye información sobre la evaluación del modelo. En este problema. Además podemos conocer más detalles de la distribución de los ejemplos por clase en la matriz de confusión.
  • 10. Luego realizamos clic derecho en el link que nos dio en el momento de que pinchamos start y nos ubicamos en la parte que dice visualize tree
  • 11. Nos presenta una nueva pantalla con el árbol.
  • 12. Como podemos observar, el árbol tiene bastantes reglas. Podemos ver cuál es el acierto de este árbol respecto a los datos de entrenamiento. Sin embargo, en este caso tenemos un error de sólo el 3,5% sobre los datos de entrenamiento. Este modelo es muchísimo mejor que sí sólo nos guiamos por la distribución, que nos daría un error de más del 50% .
  • 13. Podemos analizar pares de atributos utilizando diferentes gráficos. Para comparar la relación entre atributos en Weka debemos acudir al entorno Visualize, donde podemos realizar gráficas entre pares de atributos y ver si tienen alguna relación con las clases. De entre todas las combinaciones posibles, destaca la que utiliza los parámetros de los niveles de sodio y potasio (K y Na) ver Pulsando en la parte inferior sobre las clases, podemos cambiar los colores asignados a las clases, mejorando la visualización del gráfico. Además podemos ampliar y ver con más detalle alguna zona del gráfico con select instance y submit.
  • 14.
  • 15. En este gráfico sí que se ven algunas características muy significativas. Parece haber una clara separación lineal entre una relación K/Na alta y una relación K/Na baja. De hecho, para las concentraciones K/Na bajas, el tratamiento Y es el más efectivo de una manera clara y parece mostrarse que por encima de un cierto cociente K/Na ese medicamento deja de ser efectivo y se debe recurrir a los otros cuatro.
  • 16. Luis Eduardo Cuenca Hurtado 