SlideShare ist ein Scribd-Unternehmen logo
1 von 10
Downloaden Sie, um offline zu lesen
ESTADÍSTICA
DESCRIPTIVA
Temas de investigación
[Seleccionar fecha]
[Escribir el nombre de la compañía]
Elena
POBLACION Y MUESTRA
Cuando se realiza un estudio de investigación, se pretende generalmente inferir
o generalizar resultados de una muestra a una población. Este proceso de inferencia
se efectúa por medio de métodos estadísticos basados en la probabilidad.

•

Población:

Representa el conjunto de todos los individuos que deseamos estudiar y
generalmente suele ser inaccesible. Tienen en común alguna característica observable
y del que se pretende obtener una serie de conclusiones.

•

Muestra:

Es el conjunto menor de individuos accesible y limitado de la población sobre el
que realizamos las mediciones o el experimento con la idea de obtener conclusiones
generalizables a la población. El individuo es cada uno de los componentes de la
población y la muestra. Al número de individuos que forman la muestra se llama
tamaño muestral (n). La muestra debe ser representativa de la población y con ello
queremos decir que cualquier individuo de la población en estudio debe haber tenido
la misma probabilidad de ser elegido.
Las razones para estudiar muestras en lugar de poblaciones son diversas y entre
ellas podemos señalar:
o
o
o

Estudiar la totalidad de los pacientes o personas con una característica
determinada en muchas ocasiones puede ser una tarea inaccesible o
imposible de realizar.

o

Aumentar la calidad del estudio.

o

•

Ahorrar tiempo.
Ahorrar costes.

La selección de muestras específicas nos permitirá reducir la
heterogeneidad de una población al indicar los criterios de inclusión y/o
exclusión.

Muestreo:

El proceso de selección de los individuos se puede realizar mediante distintas
técnicas de muestreo:
-

Muestreo aleatorio simple  Cada individuo tiene las mismas posibilidades de
ser elegido para formar parte de la muestra.
Muestreo aleatorio estratificado  Aseguras que la muestra tenga la misma
proporción de una(s) variables que la población de la que procede.
-

Muestreo sistemático  El proceso de selección se basa en alguna regla
sistemática simple, por ejemplo, elegir uno de cada “n” individuos.

-

Muestreo por etapas  La selección se realiza en 2 ó más etapas sucesivas o
dependientes.

VARIABLES
Lo que estudiamos en cada individuo de la muestra son las variables (edad,
sexo, peso, talla, tensión arterial sistólica, etc). Los datos son los valores que toma la
variable en cada caso. Lo que vamos a realizar es medir, es decir, asignar valores a
las variables incluidas en el estudio. Deberemos además concretar la escala de
medida que aplicaremos a cada variable.
Un consejo: “Recoger tantas variables como sean necesarias y tan pocas como
sea posible”.
Una variable es una característica observable que se desea estudiar en una
muestra de individuos, pudiendo tomar diferentes valores. Las clasificaremos en dos
tipos: variables cuantitativas o variables cualitativas.
a. Variables cuantitativas. Son las variables que pueden medirse,
cuantificarse o expresarse numéricamente. Las variables cuantitativas
pueden ser de dos tipos:
o Variables cuantitativas continuas, si admiten tomar cualquier
valor dentro de un rango numérico determinado (edad, peso,
talla).
o

Variables cuantitativas discretas, si no admiten todos los
valores intermedios en un rango. Suelen tomar solamente
valores enteros (número de hijos, número de partos, número de
hermanos, etc).

b. Variables cualitativas. Este tipo de variables representan una
cualidad o atributo que clasifica a cada caso en una de varias
categorías.
o Dicotómicas (escalas nominales): La situación más sencilla es
aquella en la que se clasifica cada caso en uno de dos grupos
(hombre/mujer, enfermo/sano, fumador/no fumador).
o Ordinal (escalas ordinales): Se requiere de un mayor número de
categorías (color de los ojos, grupo sanguíneo, profesión, etc).
ESTADISTICA DESCRIPTIVA
Se considera la estadística descriptiva como el conjunto de técnicas que
facilitan la organización, resumen y comunicación de datos.
Una vez que se han recogido los valores que toman las variables de nuestro
estudio (datos), procederemos al análisis descriptivo de los mismos.
Para variables categóricas, como el sexo o el estadiaje, se quiere conocer el
número de casos en cada una de las categorías, reflejando habitualmente el
porcentaje que representan del total, y expresándolo en una tabla de frecuencias.
Para variables numéricas, en las que puede haber un gran número de valores
observados distintos, se ha de optar por un método de análisis distinto, respondiendo
a las siguientes preguntas:
a. ¿Alrededor de qué valor se agrupan los datos?
b. Supuesto que se agrupan alrededor de un número, ¿cómo lo hacen?
¿muy concentrados? ¿muy dispersos?
1) Medidas de tendencia central :
Las medidas de centralización vienen a responder a la primera pregunta. Nos
indican alrededor de qué valores se agrupan los datos observados. Distinguimos:
•

Media aritmética  No es más que la suma de todos los valores de una
variable dividida entre el número total de datos de los que se dispone.

•

Mediana  Es eñ valor numérico que divide al conjunto de datos ordenados en
2 partes iguales, es decir, el 50% de los datos será menor que ella y el 50% de
los datos mayor. En una distribución simétrica, la mediana coincide con la
media aritmética, pero no en una asimétrica. Es la observación equidistante de
los extremos.

•

Moda  Siendo éste el valor de la variable que presenta una mayor frecuencia.
Pueden existir distribuciones con más de una moda.

•

Media Geométrica  Muy utilizada en microbiología y serología, cuyos datos
tienen marcada una asimetría positiva (hacia derecha).

Aunque desde un punto de vista puramente descriptivo las 3 medidas proporcionan
información complementaria, sus propiedades son muy distintas: La media utiliza
todos los datos y es, por tanto, preferible si los datos son homogéneos. Tiene el
inconveniente de que es muy sensible a observaciones atípicas, y un error de datos o
un valor anormal puede modificarla totalmente.
Por el contrario, la mediana utiliza menos información que la media, ya que sólo
tiene en cuenta el orden de los datos y no su magnitud, pero en contrapartida, no se
verá alterada si una observación es extrema o contiene errores grandes de la medida
de transcripción.
En consecuencia, es recomendable calcular la media y la mediana: Si ambas
difieren mucho, la distribución es asimétrica, lo que sugiere que los datos son
heterogéneos.

2) Medidas de dispersión:
Tal y como se adelantaba antes, otro aspecto a tener en cuenta al describir datos
continuos es la dispersión de los mismos. Éstas complementan la información sobre la
distribución de la variable, indicando si los valores de la variable están muy dispersos
o se concentran alrededor de la medida de centralización.
•

Rango o recorrido  Cuando se quieren señalar valores extremos en una
distribución de datos, se suele utilizar la amplitud como medida de dispersión.
La amplitud es la diferencia entre el valor mayor y el menor de la distribución.

•

Varianza (S2) es la más utilizada. Es la media de los cuadrados de las
diferencias entre cada valor de la variable y la media aritmética de la
distribución.

Esta varianza muestral se obtiene como la suma de las de las
diferencias de cuadrados y por tanto tiene como unidades de medida el
cuadrado de las unidades de medida en que se mide la variable estudiada.
•

Desviación típica  La desviación típica (S) es la raíz cuadrada de la
varianza. Expresa la dispersión de la distribución y se expresa en las mismas
unidades de medida de la variable. La desviación típica es la medida de
dispersión más utilizada en estadística.
Aunque esta fórmula de la desviación típica muestral es correcta, en la
práctica, la estadística nos interesa para realizar inferencias poblacionales, por
lo que en el denominador se utiliza, en lugar de n, el valor n-1.
Por tanto, la medida que se utiliza es la cuasidesviación típica, dada
por:

El haber cambiado el denominador de n por n-1 está en relación al
hecho de que esta segunda fórmula es una estimación más precisa de la
desviación estándar verdadera de la población y posee las propiedades que
necesitamos para realizar inferencias a la población.
Propiedades de la media, varianza y desviación típica:




Son índices que describen la variabilidad o dispersión y por tanto cuando los
datos están muy alejados de la media, el numerador de sus fórmulas será
grande y la varianza y la desviación típica lo serán.
Al aumentar el tamaño de la muestra, disminuye la varianza y la desviación
típica. Para reducir a la mitad la desviación típica, la muestra se tiene que
multiplicar por 4.



Cuando todos los datos de la distribución son iguales, la varianza y la
desviación típica son iguales a 0.



Para su cálculo se utilizan todos los datos de la distribución; por tanto,
cualquier cambio de valor será detectado. Es decir, si a todos los valores de
una distribución se les multiplica por una constante, su media y desviación
típica quedan multiplicadas por la misma constante, mientras que la varianza
queda multiplicada por el cuadrado de esa constante. Si a todos los valores de
una distribución se les suma una constante, su media queda aumentada en
ese valor, mientras que su varianza no se modifica.

•

Coeficiente de variación  Es una medida de dispersión adimensional relativa
de los datos y se calcula dividiendo la desviación típica muestral por la media y
multiplicando el cociente por 100. Su utilidad estriba en que nos permite
comparar la dispersión o variabilidad de dos o más grupos. Es el método de
elección para comparar la variabilidad o dispersión relativa de las variables que
estén expresadas en las mismas o en diferentes unidades.

•

Cuartiles y percentiles  Cuando los datos se distribuyen de forma simétrica (y
ya hemos dicho que esto ocurre cuando los valores de su media y mediana
están próximos), se usan para describir esa variable su media y desviación
típica. En el caso de distribuciones asimétricas, la mediana y la amplitud son
medidas más adecuadas. En este caso, se suelen utilizar además los cuartiles
y percentiles.
Los cuartiles y percentiles no son medidas de tendencia central sino medidas
de posición. El percentil es el valor de la variable que indica el porcentaje de
una distribución que es igual o menor a esa cifra.
Así, por ejemplo, el percentil 80 es el valor de la variable que es igual o deja
por debajo de sí al 80% del total de las puntuaciones. Los cuartiles son los
valores de la variable que dejan por debajo de sí el 25%, 50% y el 75% del total
de las puntuaciones y así tenemos por tanto el primer cuartil (Q1), el segundo
(Q2) y el tercer cuartil (Q3).

DISTRIBUCIÓN
HOMOGENEA
DISTRIBUCIÓN
ASIMÉTRICA

MEDIDA DE
CENTRALIZACIÓN
Media

MEDIDA DE DISPERSIÓN

Mediana

Percentiles, cuartiles

Desviación típica

REPRESENTACIÓN GRÁFICA
La representación gráfica de los datos facilita un análisis visual. Según la
naturaleza de las variables estudiadas se utilizan distintos tipos de representación.
• Variables cualitativas: En todos los casos se debe cumplir el principio de
proporcionalidad de las áreas a las frecuencias absolutas.
-

Diagrama de rectángulos  Tienen una base constante y una altura
proporcional a la frecuencia absoluta correspondiente.

-

Diagrama sectorial (pastel)  El ángulo central es proporcional a la frecuencia
absoluta correspondiente, por lo que también es su área.
•

Variables cuantitativas:
o

Discretas: DIAGRAMA DE BARRAS  Sobre el valor que puede tomar
la variable se levanta una barra cuya altura mide exactamente la
frecuencia absoluta del valor.

o

Continuas:


HISTOGRAMA  Gráfico formado por rectángulos adyacentes
que tienen por base cada uno de los intervalos y por altura las
frecuencias absolutas.



POLÍGONO DE FRECUENCIAS Es una línea quebrada que
une los puntos medios de las barras superiores de los
rectangulos del histograma.
Estadistica descriptiva
Estadistica descriptiva

Weitere ähnliche Inhalte

Was ist angesagt?

Planteamiento de hipótesis en más de dos poblaciones
Planteamiento de hipótesis en más de dos poblacionesPlanteamiento de hipótesis en más de dos poblaciones
Planteamiento de hipótesis en más de dos poblacionesguest91e7e85
 
Términos básicos en estadística
Términos básicos en estadísticaTérminos básicos en estadística
Términos básicos en estadísticaFranklin Martinez
 
Guía de interpretación de resultados en el contraste de hipótesis estadísticas
Guía de interpretación de resultados en el contraste de hipótesis estadísticasGuía de interpretación de resultados en el contraste de hipótesis estadísticas
Guía de interpretación de resultados en el contraste de hipótesis estadísticasEnrique Navarro
 
Exp. prueba de hipotesis
Exp.  prueba de hipotesisExp.  prueba de hipotesis
Exp. prueba de hipotesisesnedagarcia
 
Terminos basicos (variables)
Terminos basicos (variables)Terminos basicos (variables)
Terminos basicos (variables)8291766
 
Coeficiente variacion
Coeficiente variacionCoeficiente variacion
Coeficiente variacionTepiflow
 
Definición de algunos terminos estadisticos
Definición de algunos terminos estadisticosDefinición de algunos terminos estadisticos
Definición de algunos terminos estadisticosluisenriquefm196
 
conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...
conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...
conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...Mayra Madrid Castillo
 
Clase01 conceptos generales
Clase01   conceptos generalesClase01   conceptos generales
Clase01 conceptos generalesCarlos Franco
 
15 spss comparacion de medias
15 spss comparacion de medias15 spss comparacion de medias
15 spss comparacion de mediasCarlos Rojas
 

Was ist angesagt? (20)

Metodología y estadística básicas
Metodología y estadística básicasMetodología y estadística básicas
Metodología y estadística básicas
 
Planteamiento de hipótesis en más de dos poblaciones
Planteamiento de hipótesis en más de dos poblacionesPlanteamiento de hipótesis en más de dos poblaciones
Planteamiento de hipótesis en más de dos poblaciones
 
Términos básicos en estadística
Términos básicos en estadísticaTérminos básicos en estadística
Términos básicos en estadística
 
Medidas de dispersión
Medidas de dispersiónMedidas de dispersión
Medidas de dispersión
 
Guía de interpretación de resultados en el contraste de hipótesis estadísticas
Guía de interpretación de resultados en el contraste de hipótesis estadísticasGuía de interpretación de resultados en el contraste de hipótesis estadísticas
Guía de interpretación de resultados en el contraste de hipótesis estadísticas
 
Estadistica y Probabilidad.
Estadistica y Probabilidad.Estadistica y Probabilidad.
Estadistica y Probabilidad.
 
Exp. prueba de hipotesis
Exp.  prueba de hipotesisExp.  prueba de hipotesis
Exp. prueba de hipotesis
 
Terminos basicos (variables)
Terminos basicos (variables)Terminos basicos (variables)
Terminos basicos (variables)
 
Medidas de dispersión
Medidas de dispersiónMedidas de dispersión
Medidas de dispersión
 
Doc 20170503-wa0008
Doc 20170503-wa0008Doc 20170503-wa0008
Doc 20170503-wa0008
 
Coeficiente variacion
Coeficiente variacionCoeficiente variacion
Coeficiente variacion
 
Definición de algunos terminos estadisticos
Definición de algunos terminos estadisticosDefinición de algunos terminos estadisticos
Definición de algunos terminos estadisticos
 
Compara medias
Compara mediasCompara medias
Compara medias
 
Guia 1-estadistica
Guia 1-estadisticaGuia 1-estadistica
Guia 1-estadistica
 
Guia 1-estadistica
Guia 1-estadisticaGuia 1-estadistica
Guia 1-estadistica
 
4. prueba estadistica
4. prueba estadistica4. prueba estadistica
4. prueba estadistica
 
Trabajo estadistica
Trabajo  estadisticaTrabajo  estadistica
Trabajo estadistica
 
conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...
conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...
conceptos basicos: Variable (tipos), Población y Muestra, Parámetros Estadíst...
 
Clase01 conceptos generales
Clase01   conceptos generalesClase01   conceptos generales
Clase01 conceptos generales
 
15 spss comparacion de medias
15 spss comparacion de medias15 spss comparacion de medias
15 spss comparacion de medias
 

Ähnlich wie Estadistica descriptiva

Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15Elfego Lopez
 
Generalidades de la estadística
Generalidades de la estadísticaGeneralidades de la estadística
Generalidades de la estadísticaJenny HB
 
Bioestadistica Y EpidemiologíA
Bioestadistica Y EpidemiologíABioestadistica Y EpidemiologíA
Bioestadistica Y EpidemiologíAPaola Torres
 
Presentación de estadistica paola
Presentación de estadistica paolaPresentación de estadistica paola
Presentación de estadistica paolapaola santos
 
Clase1-Estadística descriptiva aplicada a la investigación
Clase1-Estadística descriptiva aplicada a la investigaciónClase1-Estadística descriptiva aplicada a la investigación
Clase1-Estadística descriptiva aplicada a la investigaciónsifuentesdocencia
 
Distribuición, prevalencia, medidores de la salud
Distribuición, prevalencia, medidores de la saludDistribuición, prevalencia, medidores de la salud
Distribuición, prevalencia, medidores de la saludTiago Alves
 
Youblisher.com 1250985-revista digital
Youblisher.com 1250985-revista digitalYoublisher.com 1250985-revista digital
Youblisher.com 1250985-revista digitalluisv2015
 
Las medidas de_tendencia_central luis velasquez
Las medidas de_tendencia_central luis velasquezLas medidas de_tendencia_central luis velasquez
Las medidas de_tendencia_central luis velasquezluisv2015
 
presentacionestadisticadescriptiva-150314070124-conversion-gate01.pdf
presentacionestadisticadescriptiva-150314070124-conversion-gate01.pdfpresentacionestadisticadescriptiva-150314070124-conversion-gate01.pdf
presentacionestadisticadescriptiva-150314070124-conversion-gate01.pdfSeriesEcuador
 
Presentacion estadistica descriptiva
Presentacion estadistica descriptivaPresentacion estadistica descriptiva
Presentacion estadistica descriptivabetis081281
 
Variables y tipos de Variables
Variables y tipos de Variables Variables y tipos de Variables
Variables y tipos de Variables stefany_90
 
Esta Di Stica Descriptiva
Esta Di Stica DescriptivaEsta Di Stica Descriptiva
Esta Di Stica Descriptivalissa
 
Presentación estadistica l
Presentación estadistica lPresentación estadistica l
Presentación estadistica ljouberth24
 

Ähnlich wie Estadistica descriptiva (20)

Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
Generalidades de la estadística
Generalidades de la estadísticaGeneralidades de la estadística
Generalidades de la estadística
 
Bioestadistica Y EpidemiologíA
Bioestadistica Y EpidemiologíABioestadistica Y EpidemiologíA
Bioestadistica Y EpidemiologíA
 
Presentación de estadistica paola
Presentación de estadistica paolaPresentación de estadistica paola
Presentación de estadistica paola
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Descriptiva
DescriptivaDescriptiva
Descriptiva
 
Clase1-Estadística descriptiva aplicada a la investigación
Clase1-Estadística descriptiva aplicada a la investigaciónClase1-Estadística descriptiva aplicada a la investigación
Clase1-Estadística descriptiva aplicada a la investigación
 
Distribuición, prevalencia, medidores de la salud
Distribuición, prevalencia, medidores de la saludDistribuición, prevalencia, medidores de la salud
Distribuición, prevalencia, medidores de la salud
 
Youblisher.com 1250985-revista digital
Youblisher.com 1250985-revista digitalYoublisher.com 1250985-revista digital
Youblisher.com 1250985-revista digital
 
Las medidas de_tendencia_central luis velasquez
Las medidas de_tendencia_central luis velasquezLas medidas de_tendencia_central luis velasquez
Las medidas de_tendencia_central luis velasquez
 
MEDIDAS DE DISPERSION
MEDIDAS DE DISPERSIONMEDIDAS DE DISPERSION
MEDIDAS DE DISPERSION
 
presentacionestadisticadescriptiva-150314070124-conversion-gate01.pdf
presentacionestadisticadescriptiva-150314070124-conversion-gate01.pdfpresentacionestadisticadescriptiva-150314070124-conversion-gate01.pdf
presentacionestadisticadescriptiva-150314070124-conversion-gate01.pdf
 
Presentacion estadistica descriptiva
Presentacion estadistica descriptivaPresentacion estadistica descriptiva
Presentacion estadistica descriptiva
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersion
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersion
 
Variables y tipos de Variables
Variables y tipos de Variables Variables y tipos de Variables
Variables y tipos de Variables
 
Esta Di Stica Descriptiva
Esta Di Stica DescriptivaEsta Di Stica Descriptiva
Esta Di Stica Descriptiva
 
Presentación estadistica l
Presentación estadistica lPresentación estadistica l
Presentación estadistica l
 

Mehr von jennypao39

Unidad 16 las tablas dinamicas
Unidad 16 las tablas dinamicasUnidad 16 las tablas dinamicas
Unidad 16 las tablas dinamicasjennypao39
 
Estadidtica descriptiva graficos_exploratorios
Estadidtica descriptiva graficos_exploratoriosEstadidtica descriptiva graficos_exploratorios
Estadidtica descriptiva graficos_exploratoriosjennypao39
 
Estad+ìstica descriptiva diapositiva
Estad+ìstica descriptiva  diapositivaEstad+ìstica descriptiva  diapositiva
Estad+ìstica descriptiva diapositivajennypao39
 
Estadistica tablasygraficos
Estadistica  tablasygraficosEstadistica  tablasygraficos
Estadistica tablasygraficosjennypao39
 

Mehr von jennypao39 (10)

Ejercicio
EjercicioEjercicio
Ejercicio
 
Doc medidas
Doc medidasDoc medidas
Doc medidas
 
Tema 4
Tema 4Tema 4
Tema 4
 
Unidad 16 las tablas dinamicas
Unidad 16 las tablas dinamicasUnidad 16 las tablas dinamicas
Unidad 16 las tablas dinamicas
 
Tablas dina
Tablas dinaTablas dina
Tablas dina
 
Teo estadist.
Teo estadist.Teo estadist.
Teo estadist.
 
Estadidtica descriptiva graficos_exploratorios
Estadidtica descriptiva graficos_exploratoriosEstadidtica descriptiva graficos_exploratorios
Estadidtica descriptiva graficos_exploratorios
 
Estad+ìstica descriptiva diapositiva
Estad+ìstica descriptiva  diapositivaEstad+ìstica descriptiva  diapositiva
Estad+ìstica descriptiva diapositiva
 
Estadistica tablasygraficos
Estadistica  tablasygraficosEstadistica  tablasygraficos
Estadistica tablasygraficos
 
08 graficas
08 graficas08 graficas
08 graficas
 

Estadistica descriptiva

  • 1. ESTADÍSTICA DESCRIPTIVA Temas de investigación [Seleccionar fecha] [Escribir el nombre de la compañía] Elena
  • 2. POBLACION Y MUESTRA Cuando se realiza un estudio de investigación, se pretende generalmente inferir o generalizar resultados de una muestra a una población. Este proceso de inferencia se efectúa por medio de métodos estadísticos basados en la probabilidad. • Población: Representa el conjunto de todos los individuos que deseamos estudiar y generalmente suele ser inaccesible. Tienen en común alguna característica observable y del que se pretende obtener una serie de conclusiones. • Muestra: Es el conjunto menor de individuos accesible y limitado de la población sobre el que realizamos las mediciones o el experimento con la idea de obtener conclusiones generalizables a la población. El individuo es cada uno de los componentes de la población y la muestra. Al número de individuos que forman la muestra se llama tamaño muestral (n). La muestra debe ser representativa de la población y con ello queremos decir que cualquier individuo de la población en estudio debe haber tenido la misma probabilidad de ser elegido. Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos señalar: o o o Estudiar la totalidad de los pacientes o personas con una característica determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de realizar. o Aumentar la calidad del estudio. o • Ahorrar tiempo. Ahorrar costes. La selección de muestras específicas nos permitirá reducir la heterogeneidad de una población al indicar los criterios de inclusión y/o exclusión. Muestreo: El proceso de selección de los individuos se puede realizar mediante distintas técnicas de muestreo: - Muestreo aleatorio simple  Cada individuo tiene las mismas posibilidades de ser elegido para formar parte de la muestra. Muestreo aleatorio estratificado  Aseguras que la muestra tenga la misma proporción de una(s) variables que la población de la que procede.
  • 3. - Muestreo sistemático  El proceso de selección se basa en alguna regla sistemática simple, por ejemplo, elegir uno de cada “n” individuos. - Muestreo por etapas  La selección se realiza en 2 ó más etapas sucesivas o dependientes. VARIABLES Lo que estudiamos en cada individuo de la muestra son las variables (edad, sexo, peso, talla, tensión arterial sistólica, etc). Los datos son los valores que toma la variable en cada caso. Lo que vamos a realizar es medir, es decir, asignar valores a las variables incluidas en el estudio. Deberemos además concretar la escala de medida que aplicaremos a cada variable. Un consejo: “Recoger tantas variables como sean necesarias y tan pocas como sea posible”. Una variable es una característica observable que se desea estudiar en una muestra de individuos, pudiendo tomar diferentes valores. Las clasificaremos en dos tipos: variables cuantitativas o variables cualitativas. a. Variables cuantitativas. Son las variables que pueden medirse, cuantificarse o expresarse numéricamente. Las variables cuantitativas pueden ser de dos tipos: o Variables cuantitativas continuas, si admiten tomar cualquier valor dentro de un rango numérico determinado (edad, peso, talla). o Variables cuantitativas discretas, si no admiten todos los valores intermedios en un rango. Suelen tomar solamente valores enteros (número de hijos, número de partos, número de hermanos, etc). b. Variables cualitativas. Este tipo de variables representan una cualidad o atributo que clasifica a cada caso en una de varias categorías. o Dicotómicas (escalas nominales): La situación más sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador). o Ordinal (escalas ordinales): Se requiere de un mayor número de categorías (color de los ojos, grupo sanguíneo, profesión, etc).
  • 4. ESTADISTICA DESCRIPTIVA Se considera la estadística descriptiva como el conjunto de técnicas que facilitan la organización, resumen y comunicación de datos. Una vez que se han recogido los valores que toman las variables de nuestro estudio (datos), procederemos al análisis descriptivo de los mismos. Para variables categóricas, como el sexo o el estadiaje, se quiere conocer el número de casos en cada una de las categorías, reflejando habitualmente el porcentaje que representan del total, y expresándolo en una tabla de frecuencias. Para variables numéricas, en las que puede haber un gran número de valores observados distintos, se ha de optar por un método de análisis distinto, respondiendo a las siguientes preguntas: a. ¿Alrededor de qué valor se agrupan los datos? b. Supuesto que se agrupan alrededor de un número, ¿cómo lo hacen? ¿muy concentrados? ¿muy dispersos? 1) Medidas de tendencia central : Las medidas de centralización vienen a responder a la primera pregunta. Nos indican alrededor de qué valores se agrupan los datos observados. Distinguimos: • Media aritmética  No es más que la suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone. • Mediana  Es eñ valor numérico que divide al conjunto de datos ordenados en 2 partes iguales, es decir, el 50% de los datos será menor que ella y el 50% de los datos mayor. En una distribución simétrica, la mediana coincide con la media aritmética, pero no en una asimétrica. Es la observación equidistante de los extremos. • Moda  Siendo éste el valor de la variable que presenta una mayor frecuencia. Pueden existir distribuciones con más de una moda. • Media Geométrica  Muy utilizada en microbiología y serología, cuyos datos tienen marcada una asimetría positiva (hacia derecha). Aunque desde un punto de vista puramente descriptivo las 3 medidas proporcionan información complementaria, sus propiedades son muy distintas: La media utiliza
  • 5. todos los datos y es, por tanto, preferible si los datos son homogéneos. Tiene el inconveniente de que es muy sensible a observaciones atípicas, y un error de datos o un valor anormal puede modificarla totalmente. Por el contrario, la mediana utiliza menos información que la media, ya que sólo tiene en cuenta el orden de los datos y no su magnitud, pero en contrapartida, no se verá alterada si una observación es extrema o contiene errores grandes de la medida de transcripción. En consecuencia, es recomendable calcular la media y la mediana: Si ambas difieren mucho, la distribución es asimétrica, lo que sugiere que los datos son heterogéneos. 2) Medidas de dispersión: Tal y como se adelantaba antes, otro aspecto a tener en cuenta al describir datos continuos es la dispersión de los mismos. Éstas complementan la información sobre la distribución de la variable, indicando si los valores de la variable están muy dispersos o se concentran alrededor de la medida de centralización. • Rango o recorrido  Cuando se quieren señalar valores extremos en una distribución de datos, se suele utilizar la amplitud como medida de dispersión. La amplitud es la diferencia entre el valor mayor y el menor de la distribución. • Varianza (S2) es la más utilizada. Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución. Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada. • Desviación típica  La desviación típica (S) es la raíz cuadrada de la varianza. Expresa la dispersión de la distribución y se expresa en las mismas unidades de medida de la variable. La desviación típica es la medida de dispersión más utilizada en estadística.
  • 6. Aunque esta fórmula de la desviación típica muestral es correcta, en la práctica, la estadística nos interesa para realizar inferencias poblacionales, por lo que en el denominador se utiliza, en lugar de n, el valor n-1. Por tanto, la medida que se utiliza es la cuasidesviación típica, dada por: El haber cambiado el denominador de n por n-1 está en relación al hecho de que esta segunda fórmula es una estimación más precisa de la desviación estándar verdadera de la población y posee las propiedades que necesitamos para realizar inferencias a la población. Propiedades de la media, varianza y desviación típica:   Son índices que describen la variabilidad o dispersión y por tanto cuando los datos están muy alejados de la media, el numerador de sus fórmulas será grande y la varianza y la desviación típica lo serán. Al aumentar el tamaño de la muestra, disminuye la varianza y la desviación típica. Para reducir a la mitad la desviación típica, la muestra se tiene que multiplicar por 4.  Cuando todos los datos de la distribución son iguales, la varianza y la desviación típica son iguales a 0.  Para su cálculo se utilizan todos los datos de la distribución; por tanto, cualquier cambio de valor será detectado. Es decir, si a todos los valores de una distribución se les multiplica por una constante, su media y desviación típica quedan multiplicadas por la misma constante, mientras que la varianza queda multiplicada por el cuadrado de esa constante. Si a todos los valores de una distribución se les suma una constante, su media queda aumentada en ese valor, mientras que su varianza no se modifica. • Coeficiente de variación  Es una medida de dispersión adimensional relativa de los datos y se calcula dividiendo la desviación típica muestral por la media y multiplicando el cociente por 100. Su utilidad estriba en que nos permite comparar la dispersión o variabilidad de dos o más grupos. Es el método de elección para comparar la variabilidad o dispersión relativa de las variables que estén expresadas en las mismas o en diferentes unidades. • Cuartiles y percentiles  Cuando los datos se distribuyen de forma simétrica (y ya hemos dicho que esto ocurre cuando los valores de su media y mediana están próximos), se usan para describir esa variable su media y desviación típica. En el caso de distribuciones asimétricas, la mediana y la amplitud son medidas más adecuadas. En este caso, se suelen utilizar además los cuartiles y percentiles.
  • 7. Los cuartiles y percentiles no son medidas de tendencia central sino medidas de posición. El percentil es el valor de la variable que indica el porcentaje de una distribución que es igual o menor a esa cifra. Así, por ejemplo, el percentil 80 es el valor de la variable que es igual o deja por debajo de sí al 80% del total de las puntuaciones. Los cuartiles son los valores de la variable que dejan por debajo de sí el 25%, 50% y el 75% del total de las puntuaciones y así tenemos por tanto el primer cuartil (Q1), el segundo (Q2) y el tercer cuartil (Q3). DISTRIBUCIÓN HOMOGENEA DISTRIBUCIÓN ASIMÉTRICA MEDIDA DE CENTRALIZACIÓN Media MEDIDA DE DISPERSIÓN Mediana Percentiles, cuartiles Desviación típica REPRESENTACIÓN GRÁFICA La representación gráfica de los datos facilita un análisis visual. Según la naturaleza de las variables estudiadas se utilizan distintos tipos de representación. • Variables cualitativas: En todos los casos se debe cumplir el principio de proporcionalidad de las áreas a las frecuencias absolutas. - Diagrama de rectángulos  Tienen una base constante y una altura proporcional a la frecuencia absoluta correspondiente. - Diagrama sectorial (pastel)  El ángulo central es proporcional a la frecuencia absoluta correspondiente, por lo que también es su área.
  • 8. • Variables cuantitativas: o Discretas: DIAGRAMA DE BARRAS  Sobre el valor que puede tomar la variable se levanta una barra cuya altura mide exactamente la frecuencia absoluta del valor. o Continuas:  HISTOGRAMA  Gráfico formado por rectángulos adyacentes que tienen por base cada uno de los intervalos y por altura las frecuencias absolutas.  POLÍGONO DE FRECUENCIAS Es una línea quebrada que une los puntos medios de las barras superiores de los rectangulos del histograma.