SlideShare ist ein Scribd-Unternehmen logo
1 von 23
ESCUELA
SUPERIOR
POLITÉCNICA DE
CHIMBORAZO
MINI MANUAL DE
R-COMMANDER,
COMANDOS,
VENTANAS Y
APLICACIONES DEL
SOFTWARE EN LA
PRUEBA DE
HIPÓTESIS.

PROBABILIDAD Y
ESTADÍSTICA

Jordan Sebastian
Huilca Logroño
El entorno R-Commander
 R-Commander

es una Interfaz Gráfica de
Usuario (GUI en inglés), creada por John
Fox, que permite acceder a muchas
capacidades del entorno estadístico R sin
que el usuario tenga que conocer el
lenguaje de comandos propio de este
entorno. Al arrancar R-Commander, se
nos presentan dos ventanas:


La ventana de la izquierda es la consola de R. Aquí podremos
ejecutar comandos de R, para lo cual necesitamos conocer el
lenguaje R y su sintaxis. La ventana de la derecha corresponde al
entorno de R-commander, que nos evita precisamente tener que usar
dicho lenguaje de comandos, al menos para las tareas que se
encuentran implementadas dentro de dicho entorno.



No obstante, R-Commander no pretende ocultar el lenguaje R. Si
observamos de cerca la ventana de R-Commander, vemos que se
divide en tres subventanas: script, output y messages. Cada vez que,
a través de los menús de R-commander accedamos a las
capacidades de R (gráficos, procedimientos estadísticos, modelos,
etc.), en la ventana script se mostrará el comando R que ejecuta la
tarea que hayamos solicitado, y en la ventana output se mostrará el
resultado de dicho comando. De este modo, aunque el usuario no
conozca ellenguaje de comandos de R, simplemente observando lo
que va apareciendo en la ventana script se irá familiarizando (y con
un poco de interés, también aprendiendo) con dicho lenguaje. Es
más, el usuario puede introducir comandos directamente en dicha
ventana, y tras pulsar el botón Submit dichos comandos serán
ejecutados1 y su resultado mostrado en la ventana Output. El script
puede guardarse y volver a ser ejecutado directamente otras veces
con otros conjuntos de datos diferentes, sin que el usuario tenga que
desplazarse por todo el sistema de menús para volver a realizar las
mismas tareas.
El acceso a las funciones implementadas en R-commander es
muy simple y se realiza utilizando el ratón para seleccionar,
dentro del menú situado en la primera línea de la ventana, la
opción a la que queramos acceder.
 Las opciones son:
− File: para abrir ficheros con instrucciones a ejecutar, o para
guardar datos, resultados, sintaxis, etc.
− Edit: las típicas opciones para cortar, pegar, borrar, etc.
− Data: Utilidades para la gestión de datos (creación de datos,
importación desde otros programas, recodificación de variables,
etc.)
− Statistics: ejecución de procedimientos propiamente
estadísticos
− Graphs: gráficos
− Models: definición y uso de modelos específicos para el análisis
de datos.
− Distribution: probabilidades, cuantiles y gráficos de las
distribuciones de probabilidad más habituales (Normal, t de
Student, F de Fisher, binomial, etc.)
− Tools: carga de librerías y definición del entorno.
− Help: ayuda sobre R-commander (en inglés).

Lectura de datos desde un
fichero externo


Supongamos que hemos creado los datos con EXCEL (o
equivalente), y que los hemos guardado desde EXCEL en formato
CSV (Comma Separated Values)2. Este formato es simplemente un
formato de texto en el que los datos se guardan tal como se han
introducido en EXCEL, separados por punto y coma, y sin que se
añada ninguna información adicional (negritas, cursivas, colores
de las letras, etc.). Para que R (y cualquier otro paquete
estadístico) pueda utilizar los datos, éstos deben introducirse de
modo que cada variable figure en una columna, y cada fila
represente un caso. Asimismo, es conveniente que cada columna
esté encabezada con el nombre de la variable. A modo de
ejemplo, vemos la pantalla de EXCEL correspondiente a una
muestra de peces, de cada uno de los cuales se ha determinado
su estado de madurez sexual (0 = inmaduro, 1 = maduro) y sexo (1
= hembra, 2 = macho), midiéndose además su longitud y peso.
Como se ve, cada columna corresponde a una variable, y cada
fila corresponde a un sujeto (un pez en este caso).
A

veces no se dispone del valor de alguna
variable o variables en alguno o varios
casos. Por ejemplo, pudiera haber peces
cuyo estado de madurez o sexo no haya
podido determinarse, o cuya longitud o
peso se haya podido medir. Cuando falte
algún dato, conviene introducir el valor NA,
que R interpretará como Not Assigned
(valor no asignado). En el ejemplo que se
muestra a continuación vemos que hay
valores perdidos en varias variables y varios
casos, que han sido consignados con el
valor NA.


Para leer estos datos con R commander, una vez
situados en la ventana de este programa hay que
picar con el ratón en la opción Data, luego Import
data y por último from text file …:



Data > Import data > from text file ...



Nos aparecerá entonces el cuadro que se muestra
en la página siguiente, en el que hay que
especificar:
Nombre que le queremos poner al conjunto de
datos (data set) que vamos a analizar. Este nombre
no tiene por qué coincidir con el nombre del fichero
de datos. En este caso vamos a llamar peces a
nuestro conjunto de datos.
Como en el fichero están los nombres de las
variables en la primera fila, marcamos la casilla
Variable names in file.










Por defecto en la casilla Missing data indicator
aparece NA. Si hemos codificado de esta forma
los valores perdidos, no hay que modificar esta
asignación.
Hay que especificar qué carácter separa los
campos (Field Separator). Si hemos guardado los
datos con EXCEL en formato CSV, el separador
es el punto y coma. Hay que marcar Other y en
el cuadro Specify poner ;
• Por último en Decimal-Point Character hay que
especificar cual es el separador de cifras
decimales. En los ordenadores con Windows en
español el separador decimal es la coma.
 Una

vez introducida esta información,
picando en OK, nos aparece la ventana
para abrir ficheros de Windows. Buscamos el
directorio en que hemos guardado nuestro
fichero de datos y lo seleccionamos:
 En

la pantalla de R-commander ha
aparecido un comando en la ventana
superior (script) y el mismo comando repetido
en la ventana inferior (Output window). Este
comando es concretamente:
 Peces=read.table("C:/Estadística/Datos/pece
s.csv", header=TRUE, sep=";", na.strings="NA",
dec=",",strip.white=TRUE)






La sintaxis de este comando es fácil de entender: en el data
set (conjunto de datos) peces se introduce el resultado de leer
(read.table) el fichero c:/Estadística/Datos/peces.csv. Se
indica que el fichero contiene los nombres de las variables en
la cabecera (header=TRUE), que el separador de los datos es
el punto y coma (sep=”;”), que los valores perdidos se han
codificado como NA (na.strings=”NA”), que el separador de
cifras decimales es la coma (dec=”,”) y que en caso de leer
variables de tipo carácter (variables cuyos valores son
alfanuméricos, por ejemplo, nombres de islas) se eliminen los
espacios anteriores y posteriores al valor registrado en dichas
variables (strip.white=TRUE).
En la ventana de salida (Output) no se observa ningún
resultado ya que solamente se ha procedido a la lectura de
los datos. Esto se nos indica en la ventana inferior (Messages)
donde aparece una nota señalando que se ha leido el
dataset peces, y que éste tiene 20 filas y 4 columnas.
Obsérvese también que en la ventana de R-commander,
arriba a la izquierda, en el recuadro denominado Data set
aparece el nombre de nuestro conjunto de datos activo,
peces. Si deseamos ver los datos que se han leido, picamos el
recuadro View data set , y si queremos editarlos para
introducir alguna modificación picamos en el recuadro Edit
data set.
Prueba de hipótesis e intervalo
de confianza para una
proporción.
 Contraste

la hipótesis nula de que la
proporción de respuesta positiva después
del parto (aclact1) es igual a 0,5.
Construya el intervalo de confianza al
95% para la proporción poblacional de
respuesta positiva
Resultados



Deberemos rechazar la hipótesis nula de que la proporción sea 0,5 con
p=0,002304. Nótese que el estadístico X-squared (ji-cuadrado) es
equivalente en valor de p a la prueba z para una proporción.
Intervalo de confianza para el cociente de
dos varianzas (datos independientes)
En este proceso, que es muy sensible a la hipótesis
de normalidad de los datos, se quiere valorar si las
varianzas de dos poblaciones son iguales o no a
partir de la evidencia de dos muestras.
 Llamando teta= 2/ 2 , se puede calcular un
1
2
intervalo de este cociente de varianzas empleando
la distribución F de Snedecor, haciéndose notar que
el proceso es poco robusto, es decir, muy sensible a
la hipótesis de normalidad d e los datos.
(Luceño&González, expresión 7.20, pg 328). El
intervalo es:
 (teta/F(n1-1,n2-1,1- /2), teta*F(n2-1,n1-1,1- /2)
siendo teta el cociente de cuasivarianzas muestrales.

















Se calcula con las intrucciones R:
> cv1=sd(Pulsea1$Height[Pulsea1$Gender=="Female"])^2;
> cv2=sd(Pulsea1$Height[Pulsea1$Gender=="Male"])^2
> alfa=0.05
>
n1=sum(Pulsea1$Gender=="Female");n2=sum(Pulsea1$Gende
r=="Male")
> print(c(n1,n2));print(c(cv1,cv2))
[1] 35 57
[1] 6.566912 6.670739
> teta=cv1/cv2;
> Fiz=qf(c(1-alfa/2), df1=n1-1, df2=n2-1, lower.tail=TRUE);
> Fder=qf(c(0.975), df1=n2-1, df2=n1-1, lower.tail=TRUE)
> iz=teta/Fiz;der=teta*Fder;print(c(iz,der))
[1] 0.5467021 1.8561761# este es el intervalo de confianza
Por otra parte, con el menu de RCommander: > Estadísticos >
Varianzas > Test F para 2 varianzas…
 > tapply(Pulsea1$Height, Pulsea1$Gender,
 var, na.rm=TRUE) #calcula varianzas de datos
Female Male
6.566912 6.670739
 > var.test(Height ~ Gender,
 alternative='two.sided',
 conf.level=.95, data=Pulsea1)

F test to compare two variances
 data: Height by Gender
 F = 0.9844, num df = 34,
 denom df = 56, p-value = 0.9796
 alternative hypothesis:
 true ratio of variances is not equal to 1
 95 percent confidence interval:
 0.5467021 1.8561761
 sample estimates:
 ratio of variances

0.9844354






La conclusión es que se acepta la igualdad de
varianzas, pues el valor ‘1’ está en el intervalo.
También se puede aplicar el test de Levene de
igualdad de varianzas, que es más robusto que el de
Bartlett:
> Estadísticos > Varianzas > Test de Levene…

> levene.test(Pulsea1$Height, Pulsea1$Gender)
Levene's Test for Homogeneity of Variance
Df F value Pr(>F)
group 1 0.009 0.9247
90
 Como Pr(>F)=0.9247, mayor que 0.05., se acepta la
igualdad de varianzas al nivel del 95%
 Habría que contrastar la hipótesis normalidad de la
altura de hombres y de mujeres.

Weitere ähnliche Inhalte

Was ist angesagt?

81 Php. Creacion De Tablas
81 Php. Creacion De Tablas81 Php. Creacion De Tablas
81 Php. Creacion De Tablas
José M. Padilla
 
Temas programacion java_2
Temas programacion java_2Temas programacion java_2
Temas programacion java_2
Wally IG
 
Mantenimiento De Datos En Netbeans
Mantenimiento De Datos En NetbeansMantenimiento De Datos En Netbeans
Mantenimiento De Datos En Netbeans
Randy
 
Unidad 6 Lenguaje Sql 4 (Consultas Dml Avanzado)
Unidad 6 Lenguaje Sql 4 (Consultas Dml Avanzado)Unidad 6 Lenguaje Sql 4 (Consultas Dml Avanzado)
Unidad 6 Lenguaje Sql 4 (Consultas Dml Avanzado)
Sergio Sanchez
 
Diagramas de flujo DFD
Diagramas de flujo DFDDiagramas de flujo DFD
Diagramas de flujo DFD
Hanny
 
Funciones de sql server
Funciones de sql serverFunciones de sql server
Funciones de sql server
Emily_Fdez
 
Base de datos con Netbeans
Base de datos con NetbeansBase de datos con Netbeans
Base de datos con Netbeans
Randy
 
Introducción a la Programación en R
Introducción a la Programación en RIntroducción a la Programación en R
Introducción a la Programación en R
Rosa E Padilla
 
Quasi - Comandos básicos para UNIX
Quasi - Comandos básicos para UNIXQuasi - Comandos básicos para UNIX
Quasi - Comandos básicos para UNIX
degarden
 

Was ist angesagt? (20)

Estadística con Lenguaje R: Sesión 8
Estadística con Lenguaje R: Sesión 8Estadística con Lenguaje R: Sesión 8
Estadística con Lenguaje R: Sesión 8
 
Dfd
DfdDfd
Dfd
 
81 Php. Creacion De Tablas
81 Php. Creacion De Tablas81 Php. Creacion De Tablas
81 Php. Creacion De Tablas
 
Temas programacion java_2
Temas programacion java_2Temas programacion java_2
Temas programacion java_2
 
Mantenimiento De Datos En Netbeans
Mantenimiento De Datos En NetbeansMantenimiento De Datos En Netbeans
Mantenimiento De Datos En Netbeans
 
Unidad 6 Lenguaje Sql 4 (Consultas Dml Avanzado)
Unidad 6 Lenguaje Sql 4 (Consultas Dml Avanzado)Unidad 6 Lenguaje Sql 4 (Consultas Dml Avanzado)
Unidad 6 Lenguaje Sql 4 (Consultas Dml Avanzado)
 
Diagramas de flujo DFD
Diagramas de flujo DFDDiagramas de flujo DFD
Diagramas de flujo DFD
 
Estadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión IntroductoriaEstadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión Introductoria
 
Funciones de sql server
Funciones de sql serverFunciones de sql server
Funciones de sql server
 
Breve resumen sobre consultas básicas en MySQL
Breve resumen sobre consultas básicas en MySQLBreve resumen sobre consultas básicas en MySQL
Breve resumen sobre consultas básicas en MySQL
 
Comandos mysql
Comandos mysqlComandos mysql
Comandos mysql
 
Base de datos con Netbeans
Base de datos con NetbeansBase de datos con Netbeans
Base de datos con Netbeans
 
Introducción a la Programación en R
Introducción a la Programación en RIntroducción a la Programación en R
Introducción a la Programación en R
 
Swing MenúS Y Mantenimiento De Datos
Swing MenúS Y Mantenimiento De DatosSwing MenúS Y Mantenimiento De Datos
Swing MenúS Y Mantenimiento De Datos
 
Swing MenúS Y Mantenimiento De Datos
Swing MenúS Y Mantenimiento De DatosSwing MenúS Y Mantenimiento De Datos
Swing MenúS Y Mantenimiento De Datos
 
Normalización en Bases de datos
Normalización en Bases de datosNormalización en Bases de datos
Normalización en Bases de datos
 
Estadística con Lenguaje R: Sesión 1
Estadística con Lenguaje R: Sesión 1Estadística con Lenguaje R: Sesión 1
Estadística con Lenguaje R: Sesión 1
 
Oracle pl sql
Oracle pl sqlOracle pl sql
Oracle pl sql
 
Quasi - Comandos básicos para UNIX
Quasi - Comandos básicos para UNIXQuasi - Comandos básicos para UNIX
Quasi - Comandos básicos para UNIX
 
5. Ejercicios normalización
5. Ejercicios normalización5. Ejercicios normalización
5. Ejercicios normalización
 

Ähnlich wie Manual de R-Commander

Manual de r commander
Manual de r commanderManual de r commander
Manual de r commander
Lenin Medina
 
Presentacion_de_R_para_el_Congreso.ppt
Presentacion_de_R_para_el_Congreso.pptPresentacion_de_R_para_el_Congreso.ppt
Presentacion_de_R_para_el_Congreso.ppt
RobertoMarciano6
 
Mini manual de rcomander
Mini manual de rcomanderMini manual de rcomander
Mini manual de rcomander
Jhony Tacuri
 
Minimanual r commander
Minimanual r commanderMinimanual r commander
Minimanual r commander
Javito Ramirez
 

Ähnlich wie Manual de R-Commander (20)

Manual de r commander
Manual de r commanderManual de r commander
Manual de r commander
 
Mini manual R commander kathy moya dual
Mini manual R commander kathy moya dualMini manual R commander kathy moya dual
Mini manual R commander kathy moya dual
 
R commander
R commanderR commander
R commander
 
Manual r commander aa
Manual r commander aaManual r commander aa
Manual r commander aa
 
Manual rcmdr
Manual rcmdrManual rcmdr
Manual rcmdr
 
Espoch modalidad dual cristina balladares
Espoch modalidad dual cristina balladaresEspoch modalidad dual cristina balladares
Espoch modalidad dual cristina balladares
 
Presentacion_de_R_para_el_Congreso.ppt
Presentacion_de_R_para_el_Congreso.pptPresentacion_de_R_para_el_Congreso.ppt
Presentacion_de_R_para_el_Congreso.ppt
 
Mini manual de rcomander
Mini manual de rcomanderMini manual de rcomander
Mini manual de rcomander
 
Mini manual para r commander
Mini manual para r commanderMini manual para r commander
Mini manual para r commander
 
5-EDA-teo.ppt
5-EDA-teo.ppt5-EDA-teo.ppt
5-EDA-teo.ppt
 
5-EDA-teo.ppt
5-EDA-teo.ppt5-EDA-teo.ppt
5-EDA-teo.ppt
 
5-EDA-teo.ppt
5-EDA-teo.ppt5-EDA-teo.ppt
5-EDA-teo.ppt
 
Estructura de Datos y tipos de Datos - Informática
Estructura de Datos y tipos de Datos - InformáticaEstructura de Datos y tipos de Datos - Informática
Estructura de Datos y tipos de Datos - Informática
 
fundamentos de algoritmos básico intermedio.ppt
fundamentos de algoritmos básico intermedio.pptfundamentos de algoritmos básico intermedio.ppt
fundamentos de algoritmos básico intermedio.ppt
 
estructura de datos y algoritmos repaso
estructura de  datos y algoritmos repasoestructura de  datos y algoritmos repaso
estructura de datos y algoritmos repaso
 
Cristian vasquez manual de r comander en prueba de hipotesis
Cristian vasquez manual de r comander en prueba de hipotesisCristian vasquez manual de r comander en prueba de hipotesis
Cristian vasquez manual de r comander en prueba de hipotesis
 
Presentacion Editor de Dasto de SPSS.pdf
Presentacion Editor de Dasto de SPSS.pdfPresentacion Editor de Dasto de SPSS.pdf
Presentacion Editor de Dasto de SPSS.pdf
 
Minimanual de r commander
Minimanual de r commanderMinimanual de r commander
Minimanual de r commander
 
Minimanual r commander
Minimanual r commanderMinimanual r commander
Minimanual r commander
 
Clase04 tutorial p-seint
Clase04 tutorial p-seintClase04 tutorial p-seint
Clase04 tutorial p-seint
 

Manual de R-Commander

  • 1. ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO MINI MANUAL DE R-COMMANDER, COMANDOS, VENTANAS Y APLICACIONES DEL SOFTWARE EN LA PRUEBA DE HIPÓTESIS. PROBABILIDAD Y ESTADÍSTICA Jordan Sebastian Huilca Logroño
  • 2. El entorno R-Commander  R-Commander es una Interfaz Gráfica de Usuario (GUI en inglés), creada por John Fox, que permite acceder a muchas capacidades del entorno estadístico R sin que el usuario tenga que conocer el lenguaje de comandos propio de este entorno. Al arrancar R-Commander, se nos presentan dos ventanas:
  • 3.
  • 4.  La ventana de la izquierda es la consola de R. Aquí podremos ejecutar comandos de R, para lo cual necesitamos conocer el lenguaje R y su sintaxis. La ventana de la derecha corresponde al entorno de R-commander, que nos evita precisamente tener que usar dicho lenguaje de comandos, al menos para las tareas que se encuentran implementadas dentro de dicho entorno.  No obstante, R-Commander no pretende ocultar el lenguaje R. Si observamos de cerca la ventana de R-Commander, vemos que se divide en tres subventanas: script, output y messages. Cada vez que, a través de los menús de R-commander accedamos a las capacidades de R (gráficos, procedimientos estadísticos, modelos, etc.), en la ventana script se mostrará el comando R que ejecuta la tarea que hayamos solicitado, y en la ventana output se mostrará el resultado de dicho comando. De este modo, aunque el usuario no conozca ellenguaje de comandos de R, simplemente observando lo que va apareciendo en la ventana script se irá familiarizando (y con un poco de interés, también aprendiendo) con dicho lenguaje. Es más, el usuario puede introducir comandos directamente en dicha ventana, y tras pulsar el botón Submit dichos comandos serán ejecutados1 y su resultado mostrado en la ventana Output. El script puede guardarse y volver a ser ejecutado directamente otras veces con otros conjuntos de datos diferentes, sin que el usuario tenga que desplazarse por todo el sistema de menús para volver a realizar las mismas tareas.
  • 5.
  • 6. El acceso a las funciones implementadas en R-commander es muy simple y se realiza utilizando el ratón para seleccionar, dentro del menú situado en la primera línea de la ventana, la opción a la que queramos acceder.  Las opciones son: − File: para abrir ficheros con instrucciones a ejecutar, o para guardar datos, resultados, sintaxis, etc. − Edit: las típicas opciones para cortar, pegar, borrar, etc. − Data: Utilidades para la gestión de datos (creación de datos, importación desde otros programas, recodificación de variables, etc.) − Statistics: ejecución de procedimientos propiamente estadísticos − Graphs: gráficos − Models: definición y uso de modelos específicos para el análisis de datos. − Distribution: probabilidades, cuantiles y gráficos de las distribuciones de probabilidad más habituales (Normal, t de Student, F de Fisher, binomial, etc.) − Tools: carga de librerías y definición del entorno. − Help: ayuda sobre R-commander (en inglés). 
  • 7. Lectura de datos desde un fichero externo  Supongamos que hemos creado los datos con EXCEL (o equivalente), y que los hemos guardado desde EXCEL en formato CSV (Comma Separated Values)2. Este formato es simplemente un formato de texto en el que los datos se guardan tal como se han introducido en EXCEL, separados por punto y coma, y sin que se añada ninguna información adicional (negritas, cursivas, colores de las letras, etc.). Para que R (y cualquier otro paquete estadístico) pueda utilizar los datos, éstos deben introducirse de modo que cada variable figure en una columna, y cada fila represente un caso. Asimismo, es conveniente que cada columna esté encabezada con el nombre de la variable. A modo de ejemplo, vemos la pantalla de EXCEL correspondiente a una muestra de peces, de cada uno de los cuales se ha determinado su estado de madurez sexual (0 = inmaduro, 1 = maduro) y sexo (1 = hembra, 2 = macho), midiéndose además su longitud y peso. Como se ve, cada columna corresponde a una variable, y cada fila corresponde a un sujeto (un pez en este caso).
  • 8. A veces no se dispone del valor de alguna variable o variables en alguno o varios casos. Por ejemplo, pudiera haber peces cuyo estado de madurez o sexo no haya podido determinarse, o cuya longitud o peso se haya podido medir. Cuando falte algún dato, conviene introducir el valor NA, que R interpretará como Not Assigned (valor no asignado). En el ejemplo que se muestra a continuación vemos que hay valores perdidos en varias variables y varios casos, que han sido consignados con el valor NA.
  • 9.  Para leer estos datos con R commander, una vez situados en la ventana de este programa hay que picar con el ratón en la opción Data, luego Import data y por último from text file …:  Data > Import data > from text file ...  Nos aparecerá entonces el cuadro que se muestra en la página siguiente, en el que hay que especificar: Nombre que le queremos poner al conjunto de datos (data set) que vamos a analizar. Este nombre no tiene por qué coincidir con el nombre del fichero de datos. En este caso vamos a llamar peces a nuestro conjunto de datos. Como en el fichero están los nombres de las variables en la primera fila, marcamos la casilla Variable names in file.  
  • 10.    Por defecto en la casilla Missing data indicator aparece NA. Si hemos codificado de esta forma los valores perdidos, no hay que modificar esta asignación. Hay que especificar qué carácter separa los campos (Field Separator). Si hemos guardado los datos con EXCEL en formato CSV, el separador es el punto y coma. Hay que marcar Other y en el cuadro Specify poner ; • Por último en Decimal-Point Character hay que especificar cual es el separador de cifras decimales. En los ordenadores con Windows en español el separador decimal es la coma.
  • 11.
  • 12.  Una vez introducida esta información, picando en OK, nos aparece la ventana para abrir ficheros de Windows. Buscamos el directorio en que hemos guardado nuestro fichero de datos y lo seleccionamos:
  • 13.  En la pantalla de R-commander ha aparecido un comando en la ventana superior (script) y el mismo comando repetido en la ventana inferior (Output window). Este comando es concretamente:  Peces=read.table("C:/Estadística/Datos/pece s.csv", header=TRUE, sep=";", na.strings="NA", dec=",",strip.white=TRUE)
  • 14.
  • 15.    La sintaxis de este comando es fácil de entender: en el data set (conjunto de datos) peces se introduce el resultado de leer (read.table) el fichero c:/Estadística/Datos/peces.csv. Se indica que el fichero contiene los nombres de las variables en la cabecera (header=TRUE), que el separador de los datos es el punto y coma (sep=”;”), que los valores perdidos se han codificado como NA (na.strings=”NA”), que el separador de cifras decimales es la coma (dec=”,”) y que en caso de leer variables de tipo carácter (variables cuyos valores son alfanuméricos, por ejemplo, nombres de islas) se eliminen los espacios anteriores y posteriores al valor registrado en dichas variables (strip.white=TRUE). En la ventana de salida (Output) no se observa ningún resultado ya que solamente se ha procedido a la lectura de los datos. Esto se nos indica en la ventana inferior (Messages) donde aparece una nota señalando que se ha leido el dataset peces, y que éste tiene 20 filas y 4 columnas. Obsérvese también que en la ventana de R-commander, arriba a la izquierda, en el recuadro denominado Data set aparece el nombre de nuestro conjunto de datos activo, peces. Si deseamos ver los datos que se han leido, picamos el recuadro View data set , y si queremos editarlos para introducir alguna modificación picamos en el recuadro Edit data set.
  • 16. Prueba de hipótesis e intervalo de confianza para una proporción.  Contraste la hipótesis nula de que la proporción de respuesta positiva después del parto (aclact1) es igual a 0,5. Construya el intervalo de confianza al 95% para la proporción poblacional de respuesta positiva
  • 17.
  • 18.
  • 19. Resultados  Deberemos rechazar la hipótesis nula de que la proporción sea 0,5 con p=0,002304. Nótese que el estadístico X-squared (ji-cuadrado) es equivalente en valor de p a la prueba z para una proporción.
  • 20. Intervalo de confianza para el cociente de dos varianzas (datos independientes) En este proceso, que es muy sensible a la hipótesis de normalidad de los datos, se quiere valorar si las varianzas de dos poblaciones son iguales o no a partir de la evidencia de dos muestras.  Llamando teta= 2/ 2 , se puede calcular un 1 2 intervalo de este cociente de varianzas empleando la distribución F de Snedecor, haciéndose notar que el proceso es poco robusto, es decir, muy sensible a la hipótesis de normalidad d e los datos. (Luceño&González, expresión 7.20, pg 328). El intervalo es:  (teta/F(n1-1,n2-1,1- /2), teta*F(n2-1,n1-1,1- /2) siendo teta el cociente de cuasivarianzas muestrales. 
  • 21.              Se calcula con las intrucciones R: > cv1=sd(Pulsea1$Height[Pulsea1$Gender=="Female"])^2; > cv2=sd(Pulsea1$Height[Pulsea1$Gender=="Male"])^2 > alfa=0.05 > n1=sum(Pulsea1$Gender=="Female");n2=sum(Pulsea1$Gende r=="Male") > print(c(n1,n2));print(c(cv1,cv2)) [1] 35 57 [1] 6.566912 6.670739 > teta=cv1/cv2; > Fiz=qf(c(1-alfa/2), df1=n1-1, df2=n2-1, lower.tail=TRUE); > Fder=qf(c(0.975), df1=n2-1, df2=n1-1, lower.tail=TRUE) > iz=teta/Fiz;der=teta*Fder;print(c(iz,der)) [1] 0.5467021 1.8561761# este es el intervalo de confianza
  • 22. Por otra parte, con el menu de RCommander: > Estadísticos > Varianzas > Test F para 2 varianzas…  > tapply(Pulsea1$Height, Pulsea1$Gender,  var, na.rm=TRUE) #calcula varianzas de datos Female Male 6.566912 6.670739  > var.test(Height ~ Gender,  alternative='two.sided',  conf.level=.95, data=Pulsea1)  F test to compare two variances  data: Height by Gender  F = 0.9844, num df = 34,  denom df = 56, p-value = 0.9796  alternative hypothesis:  true ratio of variances is not equal to 1  95 percent confidence interval:  0.5467021 1.8561761  sample estimates:  ratio of variances  0.9844354 
  • 23.    La conclusión es que se acepta la igualdad de varianzas, pues el valor ‘1’ está en el intervalo. También se puede aplicar el test de Levene de igualdad de varianzas, que es más robusto que el de Bartlett: > Estadísticos > Varianzas > Test de Levene… > levene.test(Pulsea1$Height, Pulsea1$Gender) Levene's Test for Homogeneity of Variance Df F value Pr(>F) group 1 0.009 0.9247 90  Como Pr(>F)=0.9247, mayor que 0.05., se acepta la igualdad de varianzas al nivel del 95%  Habría que contrastar la hipótesis normalidad de la altura de hombres y de mujeres.