2. •LA ESTADÍSTICA NACIÓ COMO ARTIMÉTICA DEL ESTADO EN
FUNCIÓN ESTÁTICA DE RECOPILACION DE DATOS.
•RAPIDAMENTE SE APLICÓ AL COMERCIO Y A LOS SEGUROS
NAVALES (avería-average).
•GALTON LA APLICÓ A SUS ESTUDIOS ANTROPOLÓGICOS Y
HACIA FINES DEL SIGLO XIX PEARSON, SUCESOR DE GALTON Y
OTROS COMO EL QUIMICO GOSSET (su seudónimo era Student),
DESARROLLARON LA ESTADÍSTICA DINÁMICA.
ESTADÍSTICA BÁSICA
3. •LA FUNCIÓN ES:
• Reducción de los datos experimentales (muestreo,
presentacion, inferencia estadística).
• Cálculo comparativo de las probabilidades de
hipótesis (ensayos de hipótesis).
• Diseño de experimentos (Analisis de varianza, DOE,
etc)
• Vinculación de variables (correlación y regresión)
ESTADÍSTICA BÁSICA
4. •UN CONJUNTO DE DATOS TOMADOS DE LA EXPERIENCIA
PUEDEN SER ORDENADOS SEGÚN LA FRECUENCIA EN LA QUE
APARECEN.
•SI LOS AGRUPAMOS Y DETERMINAMOS LA PROPORCIÓN DE
ELLOS EN CADA INTERVALO DE VALORES PODREMOS TENER
DISTINTAS DISTRIBUCIONES DE FRECUENCIAS.
ESTADÍSTICA BÁSICA
6. •Un número infinito de datos sobre un sistema particular nos habla del
UNIVERSO de datos; un tamaño menor al que en algunos casos podría
accederse nos habla de una POBLACION y un número más pequeño y
accesible nos habla de una MUESTRA.
•EN NUESTRO TRABAJO NOS OCUPAMOS DE CONJUNTOS
LIMITADOS DE DATOS, ES DECIR QUE TRABAJAMOS CON
MUESTRAS
ESTADÍSTICA BÁSICA
7. •LOS PARÁMETROS ESTADÍSTICOS SON LAS CARACTERÍSTICAS
DE UNA POBLACIÓN QUE PUEDEN OBTENERSE DIRECTAMENTE
O ESTIMARSE POR MUESTREO.
• Ejemplo: Muestra = 36.3, 36.4, 36.5, 36.8, 36.8
PARÁMETROS CENTRALES
_
• Media: X = ∑ xi / n = 36.56
• Mediana: Valor que se encuentra en la mitad cuando
se ordena de mayor a menor = 36.5
• Modo o moda: Valor mas frecuente = 36.8
ESTADÍSTICA BÁSICA
8. PARÁMETROS DE DISPERSION
_ _
• Desviación simple media: d = ∑ [xi - X ] / n = 0.192
• Desviación standard: Raíz cuadrada del promedio de la
suma de los cuadrados de las desviaciones simples:
_
s = √ (∑ [xi - X ]2
/ n-1) = 0.23
• Variancia: Cuadrado de la desviación standard
Var = s2
= 0.053
ESTADÍSTICA BÁSICA
9. • Como trabajamos con muestras que estiman los
parámetros de la población hay nomenclaturas
diferentes:
ESTADÍSTICA BÁSICA
Parámetro Poblacion Muestra
No.de datos N n
Media
μ
_
X
Desvio standard σ s
10. • Solo para el desvío standard hay una diferencia de
cálculo:
_ _
σ = √((∑ xi – X)2
/ N) ; y s = √((∑ xi – X)2
/ n-1)
• La diferencia se explica de varias formas, una de
ellas es que el sistema no debe permitir calcular s
con un solo dato, de modo que de esta forma
obtenemos una indeterminación en s cuando n=1;
la otra forma nos habla del grado de libertad de un
sistema que es la cantidad de información
necesaria para definirlo ( n-1 en este caso).
ESTADÍSTICA BÁSICA
11. • Existen otros indicadores:
_
• Desviacion standard relativa: s% = s/X *100
• Sesgo o asimetría
• Kurtosis
ESTADÍSTICA BÁSICA
12. •Normalización de distribuciones:
• ES POSIBLE TRANSFORMAR EN DOS ETAPAS
CUALQUIER DISTRIBUCION EN LA GAUSSIANA
NORMALIZADA.
• Teorema del límite central.
• Normalización de la variable a z.
• En el 1er paso presentamos un método para pasar de una
distribución, cualquiera sea su forma a la gaussiana
correspondiente; y en la segunda, ésta es
“normalizada”(μ=0; σ=1).
ESTADÍSTICA BÁSICA
13. •Ejemplo: Tomemos 600 tiros de un dado.
• Obtendremos una distribución de frecuencias cuadrada
con centro en 3,5.
• Si ahora tomamos subgrupos de n=4, tendremos 150
promedios los que darán como resultado una
concentración alrededor de 3,5 dando frecuencias
menores hacia los costados y simétrica ( tiende a la
Gaussiana).
• En este caso el promedio es el mismo que para los datos
originales (3,5); pero la desviacion std disminuye en √n;
es decir que
s = σ/ √n
ESTADÍSTICA BÁSICA
14. •Ahora si normalizamos la variable x transformándola en z=(x-μ)/σ ,
la gaussiana obtenida pasa a una gaussiana normalizada con μ = 0 y
σ=1.
ESTADÍSTICA BÁSICA
15. •De acuerdo al Teorema central del límite para una cantidad grande
de datos, los promedios de esas muestras se distribuirán
normalmente.
•La distribución normal o de Gauss (para infinitos valores)
responde a:
y= 1/2√π e -1/2[(x-μ)/σ]2
• y = Frecuencia relativa de los valores de x
• x = Datos (valores) de la distribucion
• μ = Promedio del universo
• σ = Desvio standard del universo
ESTADÍSTICA BÁSICA
16. • Con la ecuación podemos obtener una tabla donde
tengamos un intervalo para x, la ordenada y; y el
área bajo la campana:
ESTADÍSTICA BÁSICA
17. •Superficies de probabilidad entre límites:
ESTADÍSTICA BÁSICA
Intervalo del valor x % bajo la campana % fuera de la
campana
μ±1,5σ 86,64 13,36
μ±1,96σ 95,00 5,00
μ±3,09σ 99,80 0,20
μ±3,5σ 99,94 0,06
18. •Límites de confianza de la media
• Es deseable poder afirmar que un valor dado se encuentra
dentro (o fuera) de ciertos límites de una distribucion con
probabilidad determinada.
• Esto se resume a calcular la probabilidad que ciertos
valores de una distribucion estén comprendidos entre los
límites de confianza μ±uσ alrededor de la media.
• El factor u depende de la probabilidad que se asigna; y el
ámbito –uσ; +uσ se llama intervalo de confianza.
ESTADÍSTICA BÁSICA
19. •Límites en la distribución de Gauss
• A un valor cualquiera x le corresponden las
probabilidades que vimos en la tabla anterior para los
límites ±uσ; y esto lo expresamos con probabilidad dada P
%.
• Yendo a la práctica se nos aparece una complicación
pues para una muestra real no podemos usar los valores
u de la tabla dado que este u depende del tamano de la
muestra (n); recordemos que de acuerdo al teorema
central del límite s2
= σ2
/n; quiere decir que la varianza de
la muestra será 1/n veces menor que la de la población.
ESTADÍSTICA BÁSICA
20. •Entonces????
• El químico W.Gossett publicó en 1908 su artículo sobre
distribución de promedios de muestras pequenas bajo el
seudónimo Student en el cual llamó t al factor que
habíamos llamado u.
• En este artículo publicó su distribución en donde
_
X ± ts/√n
Donde t se ubica en tablas para n-1 grados de libertad (la
cantidad de información para definir la muestra); y un
nivel de confianza (la probabilidad que el valor medio de la
muestra esté dentro del rango establecido).
ESTADÍSTICA BÁSICA
21. •DATOS EXTREMOS
• Cuando una muestra presenta valores muy apartados de
su media los llamamos datos extremos o “outliers”.
• Usaremos tres criterios para la toma de decisión con base
estadística para descartar datos extremos
• CRITERIO DE FISHER
• CRITERIO DE GRUBBS
• CRITERIO DE DEAN Y DIXON
ESTADÍSTICA BÁSICA
22. •CRITERIO DE FISHER
• Utiliza el ensayo ¨t¨ para los datos de una muestra de
tamaño n incluyendo el dato sospechoso, con un nivel
de significación de 0,05 (5%) para n-1 grados de libertad.
•Se considera descartable el dato si excede los límites de confianza
Media ± t.s
ESTADÍSTICA BÁSICA
23. Ejemplo:
•Para la determinación del límite de deteccion del método para Bario se
tienen estos siete datos en ppm:
0,010; 0,011; 0,010; 0,011; 0,010; 0,012; 0,019.
•El dato sospechoso; 0,019 lo sometemos al criterio de Fisher.
•La media es: 0,012; el desvío std es: 0,0032.
•El valor t de tablas para nivel de significación 5% y 6 grados de libertad:
2,45.
•Los límites de confianza calculados en base a lo anterior son:
0,012 ± 0,008.
En este caso el dato extremo de 0,019 no puede descartarse ya que el
extremo superior en el límte de confianza es 0,020.
ESTADÍSTICA BÁSICA
24. •CRITERIO DE GRUBBS
•Se calcula la desviación simple relativa según:
Me – Media / s
Donde Me es el dato extremo.
•Si la desviación simple relativa excede el valor de la tabla de abajo, el dato
se considera descartable.
ESTADÍSTICA BÁSICA
25. ESTADÍSTICA BÁSICA
n Me – Media / s
3 1,15
4 1,48
5 1,71
6 1,89
7 2,02
8 2,13
9 2,21
10 2,29
12 2,41
14 2,51
16 2,59
18 2,65
20 2,71
25 2,82
26. Tomando el ejemplo anterior:
•Según el criterio de Grubbs la desviación simple relativa es (tomando el
valor absoluto): 0,019 – 0,012 / 0,0032 = 2,19.
•La tabla indica que para n = 7, la desviación simple relativa es 2,02.
•Dado que 2,19 es mayor a 2,02; el dato extremo puede descartarse según
Grubbs.
ESTADÍSTICA BÁSICA
27. •CRITERIO DE DEAN Y DIXON
•Emplea la desviación entre el dato sospechoso Me y el inmediato Me´ mas
cercano al promedio; relativa al rango o ámbito.
Q = Me – Me´/ Am
(Am = valor mayor menos valor menor en la muestra de datos numérica).
ESTADÍSTICA BÁSICA
28. •En nuestro caso el ámbito es 0,019 – 0,010 = 0,009.
•Obtenemos Q = 0,012 – 0,011 / 0,009 = 0,111.
•Comparamos el Q obtenido con un Qmáx de tablas. Si nuestro Q excede el
de tablas, entonces el dato sospechoso puede descartarse según Dean y
Dixon.
ESTADÍSTICA BÁSICA
29. ESTADÍSTICA BÁSICA
N Q máx
3 0,94
4 0,76
5 0,64
6 0,56
7 0,51
8 0,47
9 0,44
∞ 0,00
En este caso, según Dean y Dixon el dato no será descartable.
30. •EXACTITUD Y PRECISION
•Exactitud: grado de concordancia entre el resultado del ensayo y un valor de
referencia aceptado (*). Se obtiene determinando la veracidad y la precisión.
•Veracidad: grado de concordancia existente entre el valor medio obtenido de
una gran serie de resultados y un valor de referencia aceptado. La veracidad se
expresa normalmente como sesgo (*).
•Precisión: grado de concordancia entre resultados de ensayos independientes
obtenidos en condiciones estipuladas (predeterminadas). La precisión suele
expresarse como imprecisión y calcularse como desviación estándar de los
resultados de los ensayos. Cuanto mayores la desviación estándar menor es la
precisión (*).
INCERTIDUMBRE DE MEDICION
31. •EXACTITUD Y PRECISION
•(*)ISO 3534-1: 1993 Statistical Methods for quality control — Vol. 1 vocabulary
and symbols.
INCERTIDUMBRE DE MEDICION
32. •INCERTIDUMBRE (tomado de GUM , BIPM 2008)
Uncertainty (of measurement)
Parameter, associated with the result of a measurement, that characterizes the
dispersion of the values that could reasonably be attributed to the measurand.
NOTE 1 The parameter may be, for example, a standard deviation (or a given multiple of it), or the half-
width of an
interval having a stated level of confidence.
NOTE 2 Uncertainty of measurement comprises, in general, many components. Some of these
components may be
evaluated from the statistical distribution of the results of series of measurements and can be
characterized by
experimental standard deviations. The other components, which also can be characterized by standard
deviations, are
evaluated from assumed probability distributions based on experience or other information.
INCERTIDUMBRE DE MEDICION
33. Note 3. It is understood that the result of the measurement is the best estimate of the value of the
measurand, and that all components of uncertainty, including those arising from systematic effects, such
as components associated with corrections and reference standards, contribute to the dispersion.
MESURANDO.
measurand
particular quantity subject to measurement
EXAMPLE Vapour pressure of a given sample of water at 20 °C.
NOTE The specification of a measurand may require statements about quantities such as
time, temperature and
pressure.
INCERTIDUMBRE DE MEDICION
34. En mecánica cuántica, la relación de indeterminación de Heisenberg
o principio de incertidumbre afirma que no se puede determinar,
simultáneamente y con precisión arbitraria, ciertos pares de variables
físicas, como son, por ejemplo, la posición y el momento lineal (cantidad
de movimiento) de un objeto dado. En otras palabras, cuanta mayor
certeza se busca en determinar la posición de una partícula, menos se
conoce su cantidad de movimiento lineal y, por tanto, su velocidad. Esto
implica que las partículas, en su movimiento, no tienen asociada una
trayectoria bien definida. Este principio fue enunciado por Werner
Heisenberg en 1927.
INCERTIDUMBRE DE MEDICION
35. Con todo lo anterior....
Qué es el resultado de una medición???
INCERTIDUMBRE DE MEDICION
36. Un procedimiento para estimar la incertidumbre de la calibración:
•Paso 1: Definir el mensurando.
•Paso 2: Planificar intervención sobre el instrumento a ser calibrado de acuerdo a
procedimientos estandarizados.
•Paso 3: Recopilar la información sobre el valor convencionalmente verdadero
(verificar confiabilidad, trazabilidad, declaración de incertidumbre, compatibilidad
con la capacidad metrológica de lo que quiero calibrar, etc).
•Paso 4: Realizar las mediciones según el paso 2.
•Paso 5: Testear los datos para eliminar outliers.
•Paso 6: Identificar las fuentes que contribuyen a la incertidumbre.
•Paso 7: Cuantificar la incertidumbre standard de las fuentes
•Paso 8: Combinar las incertidumbres standard relativas
•Paso 9: Expandir la incertidumbre combinada
•Paso 10: Reportar la incertidumbre expandida con su factor de cobertura.
INCERTIDUMBRE DE MEDICION
37. Cómo estimar las incertidumbres standard de las distintas
componentes?
•INCERTIDUMBRE TIPO A
• Hace uso de estimación a través del desvío standard de una
serie de repeticiones.
•INCERTIDUMBRE TIPO B
• Toma información de otras mediciones.
• De la experiencia o conocimiento del comportamiento de las
propiedades de materiales o instrumentos
De las especificaciones del fabricante
De certificados de calibracion y otros certificados
De valores tomados de tablas y manuales.
INCERTIDUMBRE DE MEDICION
38. TIPO A
•Tomar la varianza de la media como una medida de la incertidumbre standard:
u(x) = s(x)/√n
(ver 4.2.4 de GUM)
INCERTIDUMBRE DE MEDICION
39. TIPO B
•Depende de la informacion que se tenga:
• Si se tiene un certificado de calibracion donde se declara el
factor de cobertura, se toma la incertidumbre declarada y se la
divide por el factor de cobertura.
• Si no se declara un factor de cobertura, pero se declara el
nivel de confianza; entonces se supone una distribución
gaussiana y se escoge el multiplicador correspondiente al
nivel de confianza (p.ej: para 95% se usa 1.95).
INCERTIDUMBRE DE MEDICION
40. TIPO B
•Si no hay información sobre la distribucion y puede suponerse que
dentro del intervalo de la variable, todos los valores son igualmente
probables, entonces la incertidumbre standard se obtiene como el rango
dividido por raíz de 3.
•Si se sospecha que hay una probabilidad convergente al centro del
rango de una variable, entonces la incertidumbre standard se obtiene
como el rango dividido por raíz de 6.
•Ver ejemplos en GUM, item 4.3.
INCERTIDUMBRE DE MEDICION
41. CÓMO SE COMBINAN LAS INCERTIDUMBRES STANDARD?
Como estamos trabajando con sumas, restas, cocientes y productos; se
usa el modelo de la sumatoria cuadrática de las incertidumbres standard
relativas:
INCERTIDUMBRE DE MEDICION
42. CÓMO SE COMBINAN LAS INCERTIDUMBRES STANDARD?
•Lo anterior aplica para variables no correlacionadas.
•Para variables correlacionadas, como por ejemplo las que se obtienen
como resultante del ajuste por cuadrados mínimos en una curva de
calibracion, el modelo es algo más complejo y se escapa a este curso.
INCERTIDUMBRE DE MEDICION
43. EXPANSION Y REPORTE DE LA INCERTIDUMBRE
•Basicamente multiplicamos la incertidumbre combinada por un factor
k=2 para un 95% de confianza.
•Se reporta el valor de la incertidumbre con sus dos signos y se aclara el
factor de cobertura utilizado.
INCERTIDUMBRE DE MEDICION
46. TESTS DE HIPÓTESIS
•Consiste en decidir si dos (o más) conjuntos o series de valores
pueden ser aceptados como “iguales”; es decir, “pertenecientes a
la misma distribución estadística’o no.
•Si no resultan “iguales”es porque presentan diferencias
significativas de acuerdo con el ensayo aplicado.
•Podemos decir que siempre ensayamos la misma hipótesis, la
hipótesis de nulidad de la diferencia Ho o hipótesis nula.
APÉNDICE
47. TESTS DE HIPÓTESIS
•Consiste en decidir si dos (o más) conjuntos o series de valores
pueden ser aceptados como “iguales”; es decir, “pertenecientes a
la misma distribución estadística’o no.
•Si no resultan “iguales”es porque presentan diferencias
significativas de acuerdo con el ensayo aplicado.
•Podemos decir que siempre ensayamos la misma hipótesis, la
hipótesis de nulidad de la diferencia Ho o hipótesis nula.
ESTADÍSTICA BÁSICA
48. ENSAYOS PARA COMPARAR PROMEDIOS.
•Ensayo Z: Se usa para decidir si un valor promedio de una muestra
pertenece o no a una dada distribución normal.
•Ejemplo: Se realiza una “prueba de inteligencia” durante muchos
años a grupos numerosos de estudiantes obteniendose un
promedio μ = 80 y σ = 7. Este año hemos preparado un grupo de 25
estudiantes en lectura eficaz y obtuvieron un promedio de 83 (se
supone que σ no ha variado). Ha cambiado la preparación especial
en lectura el promedio en forma significativa?
ESTADÍSTICA BÁSICA
49. Usando un nivel de significacion P=0.05, es decir con una confianza
del 95% se aplica la ecuación:
_
Z = (X –μ) / (σ/√n) = 2,14
Como Z = 1,96 para P=0.05; y 2,14>1,96; entonces se supera el valor
límite de tabla y nos indica que debemos rechazar Ho, con lo cual
las diferencias son significativas y las atribuimos a la preparación
especial.
ESTADÍSTICA BÁSICA
50. En la práctica no siempre se conoce σ con lo que se debe aplicar
otro ensayo. El ensayo t.
Supongamos que no hubieramos conocido σ por repetidos
ensayos previos y la estimamos por medio de una muestra de 5
datos de estudiantes con los resultados 80, 87, 85 y 77 de donde el
promedio es 82 y la estimación del desvío standard es s = 4. Como
conocemos μ = 80, se aplica
_
t = (X – μ) / (s/√n) = 1,12
ESTADÍSTICA BÁSICA
51. Como t 0,04(4) = 2,78 y 1,12<2,78 se acepta la Ho y no hay diferencias
significativas.
•Si de lo que se trata es comparar los promedios de muestras para
decidir si podemos afirmar o no que pertenecen a la misma
población, poodemos aplicar el ensayo Z con σ1 y σ2 conocidas
según:
Z = [ X1 – X2] / √(σ2
1/n2
1+σ2
2/n2
2)
•Para poder aplicar ésto las desviaciones std deben ser
homogéneas (significativamente parecidas).
ESTADÍSTICA BÁSICA
52. •Ejemplo: Una partida de un producto tiene un peso promedio de
68,2g con σ1 = 2,5; mientras que otra tiene, para igual numero de
potes (n1=n2=50) un promedio de 67,5g y σ2 = 2,8. Se puede afirmar
que la máquina envasadora funcionó en forma diferente para
ambas partidas??.
•Aplicando la ecuacion anterior tenemos que Z = 2,48.
Como Z(0,05) = 1,96 entonces se rechaza Ho y se concluye que la
máquina funcionó diferente.
ESTADÍSTICA BÁSICA
53. •Si no conocemos σ de las poblaciones y debemos estimarlas a
partir del s de las muestras, aplicamos otro ensayo t.
•En este ensayo vale que:
_ _
t = [ X1 – X2] / √[S2
c (n1+n2) / n1n2]
Con S2
c = (S2
1 + S2
2) / (n1+n2-2)
ESTADÍSTICA BÁSICA
54. •Ejemplo: Tenemos dos conjuntos de datos de análisis realizados
por dos analistas diferentes sobre la misma muestra con los
siguientes resultados:
•A = 59.09; 59.19; 59.27; 59.13; 59.10; 59.14.
•B = 59.51; 59.75; 59.61; 59.60.
•Promedio A = 59.15; SA = 0.0654
•Promedio B = 59.62; SB = 0.0994
•Aplicando la ecuación de t = 9.13 y dado que t(8)0.01 = 3.35;
entonces 9.13>3.35 se rechaza Ho y se concluye que existen
diferencias significativas entre los dos analistas.
ESTADÍSTICA BÁSICA
55. •Ensayo para comparar varianzas. Ensayo F.
•El ensayo F de Snedecor toma el siguiente cociente entre
varianzas de dos grupos de muestras:
F = S2
1/S2
2
Se compara el valor F con el de tablas de la distribución F para un
nivel de confianza predeterminado y para el numero de grados de
libertad de numerador y denominador.
ESTADÍSTICA BÁSICA
56. •Tomando los datos del ejemplo anterior
F= 1.4; como F0,05 = 5.41 y como 1,41<5,41 se acepta la hipótesis de
nulidad y no hay diferencias significativas de varianzas entre
analistas considerandolos homogéneos.
ESTADÍSTICA BÁSICA