2. Índice: 1. Parámetros estadísticos: Tipos. 1.1 Medidas de centralización (Medias y Moda) 1.2 Medidas de posición (Mediana, cuartiles y porcentiles/centiles) 1.3 Medidas de dispersión (Rango, rango intercuartílico, desviación media, varianza, desviación típica) 1.4 Medidas de forma (coeficiente de asimetría y coeficiente de apuntamiento) 2. Interpretación de la media y desviación típica: 2.1 Desigualdad de TCHEBICHEFF 2.2 Coeficiente de Variación. 3. Transformaciones (suma y producto) en un conjunto de datos estadísticos.
3. 1.Parámetros Estadísticos Parámetros estadísticos: Son datos que resumen el estudio realizado en la población. 1.1 Parámetros de centralización. Son datos que representan de forma global a toda la población. Entre ellos encontramos la media aritmética, la moda . Media aritmética. Se define la media aritmética como la suma de todos los datos dividida por el número de datos. Moda. Se define la moda como el valor de la variable que más se repite, es el decir, aquél que tiene mayor frecuencia absoluta. Se representa por Mo.
4. Centrales: Mediana. Si ordenamos todos los valores de la variable de menor a mayor, se define la mediana como el valor de la variable que está en el centro. Se representa por Me. Aquí tenemos que comprender que si hay un número impar de valores, habrá un sólo valor central; mientras que si hay un número par de valores habrá dos valores centrales. 1.2 Parámetros de posición. Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando. Pueden ser centrales, o no centrales. No centrales: + Cuartiles : son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. + Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.
5. 1.3 Parámetros de dispersión . Son datos que informan de la concentración o dispersión de los datos respecto de los parámetros de centralización. Por ejemplo el recorrido, la varianza y la desviación típica. Varianza Se define la varianza como la media aritmética de los cuadrados de las desviaciones respecto de la media. Desviación típica Se define la desviación típica como la raíz cuadrada positiva de la varianza.
6. Rango Se define el o como la diferencia entre el mayor y el menor de los valores de la variable. Se representa por R. Nos indica un intervalo en el que están comprendido todos los datos. Rango intercuartílico Es la diferencia entre los cuartiles tercero y primero. Se representa por RI (RI=C3-C1) y representa la amplitud del intervalo en el que se encuentra el 50% central de los datos. Desviación media. Al calcular la media, podemos ver la diferencia que hay entre este parámetro y cada valor de la variable, a la que llamaremos desviación. Definimos la desviación media como la media aritmética de los valores absolutos de las desviaciones respecto de la media.
7. 1.4 Medidas de forma Comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama de barras de la distribución, con la distribución normal. *MEDIDA DE ASIMETRÍA Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden. Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas) descienden más lentamente por la derecha que por la izquierda. Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la distribución es asmétrica a la izquierda. Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el Coeficiente de Asimetría. Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando existe asimetría a la izquierda.
8. *MEDIDA DE APUNTAMIENTO O CURTOSIS Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones según su grado de curtosis: Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.
9. 2. Interpretación de la media y desviación típica. Pafnuty Lvóvich Chebyshev (1821–1894): Matemático ruso, considerado unos de los creadores de la escuela matemática en ese país y famoso por sus contribuciones en el área de probabilidad y estadística. Su nombre se translitera también como Tchebychev, Tchebycheff, Tschebyscheff o Čebišev. Concepto: La probabilidad de que cualquier variable aleatoria X tome un valor dentro de k desviaciones estándar de la media es al menos 1- (1/k2) Este matemático descubrió que la fracción del área entre 2 valores simétricos cualesquiera alrededor de la media está relacionada con la desviación estándar. Como el área bajo una curva de distribución de probabilidad o en un histograma de probabilidad suma 1, el área entre cualesquiera 2 números es la probabilidad de que la variable aleatoria tome un valor entre estos números. Es un resultado estadístico que ofrece una cota inferior a la probabilidad de que el valor de una variable aleatoria con varianza finita esté a una cierta distancia de su esperanza matemática o de su media 2.1. Desigualdad de TCHEBICHEFF
10. 2.2. Coeficiente de variación. Si hemos realizado un estudio estadístico en dos poblaciones diferentes, y queremos comparar resultados, no podemos acudir a la desviación típica para ver la mayor o menor homogeneidad de los datos, sino a otro parámetro nuevo, llamado coeficiente de variación y que se define como el cociente entre la desviación típica y la media. Por ejemplo, en una exposición de ganado estudiamos un conjunto de vacas con una media de 500 kilos y una desviación típica de 50 kilos. Y observamos también un conjunto de perros con una media de 40 kilos y una desviación típica de 10 kilos. ¿Qué grupo de animales es más homogéneo? Un razonamiento falso sería decir que el conjunto de perros es más homogéneo porque su desviación típica es más pequeña, pero si calculamos el coeficiente de variación para ambos: Vv = 50/500 = 0.1 Vp = 10/40 = 0.25 Por tanto, es más homogéneo el conjunto de las vacas.
11. 3. Transformaciones (suma y producto) en un conjunto de datos estadísticos. x 1 4 8 ni 3 5 2 X= xi.ni = 1·3 + 4·5 +8·2 = 3.9 N 10 Si a una serie de datos se le suma un valor constante, la media resultante es la suma de la anterior con dicha constante. x+5 6 9 13 ni 3 5 2 X= 3.9 + k= 8.9