This document outlines the key concepts and formulas covered over 7 weeks in a statistics course. Week 1 covers frequency tables and measures of central tendency for ungrouped data like the mean, median, and mode. Week 2 introduces measures of variability for ungrouped data such as range, interquartile range, variance, standard deviation, and coefficients. Week 3 covers probability concepts such as sample space, events, operations on events, and probability formulas. Week 4 introduces the binomial distribution and its properties. Week 5 introduces the Poisson distribution. Week 6 covers the normal distribution and standardization. Week 7 discusses statistical estimation including confidence intervals for the population mean, proportion, and variance.
1. ESTADÍSTICA GENERAL Y APLICADA
FORMULARIO
Semana 1:
Tabla de frecuencias por intervalos
Paso 1: Calcule el rango (R):
𝑹 = 𝑿𝒎𝒂𝒙 − 𝑿𝒎𝒊𝒏
Paso 2: Calcule el número de clases o intervalos (k) utilizando la regla de Sturges:
𝒌 = 𝟏 + 𝟑. 𝟑 𝒍𝒐𝒈 𝒏
Paso 3: Calcule la amplitud del intervalo de clase (c):
𝒄 =
𝑹
𝒌
Semana 2:
Medidas de tendencia central (datos no agrupados)
Media aritmética
𝑿
̅ =
∑ 𝑿𝒊
𝒏
Propiedades de la media aritmética
Nueva Variable Nueva Media
𝒚𝒊 = 𝒙𝒊 ± 𝒃 𝒚
̅ = 𝒙
̅ ± 𝒃
𝒚𝒊 = 𝒄 𝒙𝒊 𝒚
̅ = 𝒄𝒙
̅
𝒚𝒊 = 𝒄𝒙𝒊 ± 𝒃 𝒚
̅ = 𝒄𝒙
̅ ± 𝒃
Mediana
Impar: 𝑴𝒆 = 𝒙(
𝒏+𝟏
𝟐
)
Par: 𝑴𝒆 =
𝒙
(
𝒏
𝟐
)
+𝒙
(
𝒏
𝟐
+𝟏)
𝟐
Moda (Dato más frecuente)
Medidas de tendencia no central (datos no agrupados)
Cálculo de percentiles
1. Ordenar los datos en forma ascendente.
2. Hallar la posición (j) del percentil (Pk) a partir de la siguiente expresión:
𝒋 =
𝒌(𝒏 + 𝟏)
𝟏𝟎𝟎
3. Ubicar el percentil en la posición hallada si “j” es un número entero; caso contrario, el
percentil se calcula con la siguiente fórmula:
𝑷𝒌 = 𝑳𝒊 + 𝒅𝒆𝒄 × (𝑳𝒅 − 𝑳𝒊)
3. Semana 5:
Principio de multiplicación para n eventos
𝑷(𝑨𝟏 ∩ 𝑨𝟐 ∩ … ∩ 𝑨𝒏) = 𝑷(𝑨𝟏) 𝑷(𝑨𝟐/𝑨𝟏) … 𝑷(𝑨𝒏/𝑨𝟏 ∩ … ∩ 𝑨𝒏−𝟏)
Eventos independientes para 2 eventos
𝑷(𝑨/𝑩) = 𝑷(𝑨) 𝑷(𝑨 ∩ 𝑩) = 𝑷(𝑨) × 𝑷(𝑩)
Teorema de probabilidad total
𝑷(𝑨) = 𝑷(𝑨𝟏) × 𝑷(𝑨/𝑨𝟏) + 𝑷(𝑨𝟐) × 𝑷(𝑨/𝑨𝟐) + ⋯ + 𝑷(𝑨𝒏) × 𝑷(𝑨/𝑨𝒏)
Teorema de Bayes
𝑷(𝑨𝒊/ 𝑨) =
𝑷(𝑨𝒊 ∩ 𝑨)
𝑷(𝑨)
𝑷(𝑨𝒊/ 𝑨) =
𝑷(𝑨𝒊) × 𝑷(𝑨/𝑨𝒊)
𝑷(𝑨𝟏) × 𝑷(𝑨/𝑨𝟏) + 𝑷(𝑨𝟐) × 𝑷(𝑨/𝑨𝟐) + ⋯ + 𝑷(𝑨𝒏) × 𝑷(𝑨/𝑨𝒏)
; 𝒊
Semana 6:
Distribución Binomial
Función de probabilidad de la distribución Binomial.
𝑷(𝑿 = 𝒙) = ∁𝒙
𝒏
𝒑𝒙(𝟏 − 𝒑)𝒏−𝒙
Medidas de resumen.
Esperanza Matemática 𝑬(𝑿) = 𝒏 𝒑
Varianza 𝑽(𝑿) = 𝒏 𝒑(𝟏 − 𝒑)
Distribución Poisson
Función de probabilidad de la distribución Poisson.
𝑷(𝑿 = 𝒙) = 𝒆−𝝀
×
𝝀𝒙
𝒙!
Medidas de resumen.
Esperanza Matemática 𝑬(𝑿) = 𝝀
Varianza 𝑽(𝑿) = 𝝀
Semana 7:
Distribución normal
Estandarización
𝒁 =
𝑿 − 𝝁
𝝈
ESTADISTICA APLICADA
Semana 1:
Estimación por intervalo para la media o promedio poblacional 𝝁:
Caso I: Cuando σ2
es conocido:
𝑰𝑪(𝝁) = 〈𝒙
̅ ± 𝒁𝟏−𝜶 𝟐
⁄
𝝈
√𝒏
〉
Caso II: Cuando σ2
es desconocido (n≤ 30)
𝑰𝑪(𝝁) = 〈𝒙
̅ ± 𝒕𝟏−𝜶 𝟐
⁄ ;𝒏−𝟏
𝑺
√𝒏
〉
Caso III: Cuando σ2
es desconocido (n> 30)
𝑰𝑪(𝝁) = 〈𝒙
̅ ± 𝒛𝟏−𝜶 𝟐
⁄
𝑺
√𝒏
〉
4. Estimación por intervalo para la proporción poblacional 𝝅:
𝑰𝑪(𝝅) = 𝒑 ± 𝒁𝟏−𝜶 𝟐
⁄ √
𝒑(𝟏 − 𝒑)
𝒏
Estimación por intervalo para la varianza poblacional 𝝈𝟐
:
(𝒏 − 𝟏)𝒔𝟐
𝝌𝟏−𝜶 𝟐
⁄ ;𝒏−𝟏
𝟐
≤ 𝝈𝟐
≤
(𝒏 − 𝟏)𝒔𝟐
𝝌𝜶 𝟐
⁄ ;𝒏−𝟏
𝟐
Tamaño de muestra
Media
𝒏𝟎 =
𝒛𝟏−𝜶 𝟐
⁄
𝟐
× 𝝈𝟐
𝜺𝟐
Proporción:
𝒏𝟎 =
𝒛𝟏−𝜶 𝟐
⁄
𝟐
𝒑(𝟏 − 𝒑)
𝜺𝟐
Factor de corrección si se conoce la población
𝒏 =
𝒏𝟎
𝟏 +
𝒏𝟎
𝑵
Semana 2:
Intervalo de confianza para el cociente de varianzas (𝝈𝟏
𝟐
𝝈𝟐
𝟐
⁄ )
〈
𝒔𝟏
𝟐
𝒔𝟐
𝟐
×
𝟏
𝑭𝜶 𝟐
⁄ , 𝒏𝟏−𝟏; 𝒏𝟐−𝟏
≤
𝝈𝟏
𝟐
𝝈𝟐
𝟐
≤
𝒔𝟏
𝟐
𝒔𝟐
𝟐
× 𝑭𝜶 𝟐
⁄ , 𝒏𝟐−𝟏; 𝒏𝟏−𝟏〉
Intervalo de confianza para las diferencias de medias poblacionales (𝝁𝟏 − 𝝁𝟐)
Caso 1: Cuando las varianzas poblacionales son conocidas
𝑰𝑪(𝝁𝟏 − 𝝁𝟐) : (𝒙
̅ − 𝒚
̅) ± 𝒛𝟏−𝜶 𝟐
⁄ √
𝝈𝟏
𝟐
𝒏𝟏
+
𝝈𝟐
𝟐
𝒏𝟐
Caso 2: Cuando las varianzas poblacionales son desconocidas pero homogéneas
𝑰𝑪(𝝁𝟏 − 𝝁𝟐) : (𝒙
̅ − 𝒚
̅) ± 𝒕𝟏−𝜶 𝟐
⁄ ;𝒏𝟏+𝒏𝟐−𝟐
√(
(𝒏𝟏 − 𝟏)𝒔𝟏
𝟐
+ (𝒏𝟐 − 𝟏)𝒔𝟐
𝟐
𝒏𝟏 + 𝒏𝟐 − 𝟐
) (
𝟏
𝒏𝟏
+
𝟏
𝒏𝟐
)
Caso 3: Cuando las varianzas poblacionales son desconocidas, pero no homogéneas
𝑰𝑪(𝝁𝟏 − 𝝁𝟐) : (𝒙
̅ − 𝒚
̅) ± (𝒕𝟏−𝜶 𝟐
⁄ ; 𝒈 ) √
𝒔𝟏
𝟐
𝒏𝟏
+
𝒔𝟐
𝟐
𝒏𝟐
Grados de libertad
𝒈 =
[
𝒔𝟏
𝟐
𝒏𝟏
+
𝒔𝟐
𝟐
𝒏𝟐
]
𝟐
[
𝒔𝟏
𝟐
𝒏𝟏
]
𝟐
𝒏𝟏 + 𝟏 +
[
𝒔𝟐
𝟐
𝒏𝟐
]
𝟐
𝒏𝟐 + 𝟏
− 𝟐
Intervalo de confianza para la diferencia de 2 proporciones poblacionales (𝝅𝟏 − 𝝅𝟐)
5. 𝑰𝑪(𝝅𝟏 − 𝝅𝟐) : (𝒑 𝟏
− 𝒑𝟐) ± 𝒛𝟏−𝜶 𝟐
⁄ √
𝒑𝟏(𝟏 − 𝒑𝟏)
𝒏𝟏
+
𝒑𝟐(𝟏 − 𝒑𝟐)
𝒏𝟐
Semana 3:
PROCEDIMIENTO PARA REALIZAR UNA PRUEBA DE HIPÓTESIS
Paso 1 (Plantee las hipótesis de prueba)
Paso 2 (Establezca el nivel de significancia) α
Paso 3 (Calcule el valor del estadístico de prueba)
La decisión de aceptar o rechazar la hipótesis nula, se hace en base al valor del estadístico de
contraste (estadístico de prueba), este valor se obtiene con los datos de la muestra.
Paso 4 Regla de decisión
La región de rechazo, también conocida como región crítica, se establece a partir del nivel de
significancia α.
Paso 5 (Concluya de acuerdo al enunciado del problema)
Si el valor del estadístico de prueba cae en la región de rechazo, se rechaza la hipótesis nula
(H0), caso contrario no se rechaza.
Prueba de Hipótesis para la media poblacional:
CASO 1: Cuando σ es conocido
𝒁𝒄𝒂𝒍 =
𝒙
̅ − 𝝁𝟎
𝝈
√𝒏
~𝑵(𝟎, 𝟏)
CASO 2: Cuando σ es desconocido y n ≤ 30
𝑻𝒄𝒂𝒍 =
𝒙
̅ − 𝝁𝟎
𝒔
√𝒏
~𝒕𝒏−𝟏
CASO 3: Cuando σ es desconocido y n > 30
𝒁𝒄𝒂𝒍 =
𝒙
̅ − 𝝁𝟎
𝒔
√𝒏
~𝑵(𝟎, 𝟏)
Prueba de Hipótesis para la proporción poblacional:
𝒁𝒄𝒂𝒍 =
𝒑 − 𝝅𝟎
√𝝅𝟎(𝟏 − 𝝅𝟎)
𝒏
~𝑵(𝟎, 𝟏)
𝒑 =
∑ 𝑿𝒊
𝒏
𝒊=𝟏
𝒏
=
𝑿𝟏 + 𝑿𝟐 + ⋯ 𝑿𝒏
𝒏
Prueba de Hipótesis para la varianza poblacional:
𝝌𝒄𝒂𝒍
𝟐
=
(𝒏 − 𝟏)𝒔𝟐
𝝈𝟎
𝟐
~𝝌𝒏−𝟏
𝟐
6. Semana 4:
Prueba de hipótesis para el cociente de varianzas poblacionales:
𝑭𝒄𝒂𝒍 =
𝒔𝟏
𝟐
𝒔𝟐
𝟐 ~𝑭𝒏𝟏−𝟏, 𝒏𝟐−𝟏
Prueba de hipótesis para la diferencia de medias poblacionales:
Caso 1: Cuando las varianzas poblacionales son conocidas
𝒁𝒄𝒂𝒍 =
(x
̅1 − x
̅2) − μ0
√
𝜎1
2
𝑛1
+
𝜎2
2
𝑛2
Caso 2: Cuando las varianzas poblacionales son desconocidas pero homogéneas
𝒕𝒄𝒂𝒍 =
(𝒙
̅𝟏 − 𝒙
̅𝟐) − 𝝁𝟎
√
(𝒏𝟏 − 𝟏)𝑺𝟏
𝟐
+ (𝒏𝟐 − 𝟏)𝑺𝟐
𝟐
𝒏𝟏 + 𝒏𝟐 − 𝟐 (
𝟏
𝒏𝟏
+
𝟏
𝒏𝟐
)
Caso 3: Cuando las varianzas poblacionales son desconocidas, pero no homogéneas
𝒕𝒄𝒂𝒍 =
(x
̅1 − x
̅2) − μ0
√
𝑆1
2
𝑛1
+
𝑆2
2
𝑛2
Grados de libertad
𝒈 =
(
𝒔𝟏
𝟐
𝒏𝟏
+
𝒔𝟐
𝟐
𝒏𝟐
)
𝟐
(
𝒔𝟏
𝟐
𝒏𝟏
)
𝟐
𝒏𝟏 + 𝟏 +
(
𝒔𝟐
𝟐
𝒏𝟐
)
𝟐
𝒏𝟐 + 𝟏
− 𝟐
Prueba de hipótesis para la diferencia de proporciones (𝝅𝟏 − 𝝅𝟐) = 𝝅𝟎
Prueba de hipótesis para la igualdad de proporciones
Zcal =
𝑝1 − 𝑝2
√𝑝̂(1 − 𝑝̂) (
1
𝑛1
+
1
𝑛2
)
𝑝̂ =
𝑛1𝑝1 + 𝑛2𝑝2
𝑛1 + 𝑛2
Prueba de hipótesis para la diferencia de proporciones diferentes de cero
𝒁𝒄𝒂𝒍 =
(𝒑𝟏 − 𝒑𝟐) − 𝝅𝒐
√
𝒑𝟏(𝟏 − 𝒑𝟏)
𝒏𝟏
+
𝒑𝟐(𝟏 − 𝒑𝟐)
𝒏𝟐
7. Semana 5:
Análisis de varianza (ANOVA)
𝐻0:𝜇1 = 𝜇2 = 𝜇3 = ⋯ = 𝜇𝑘
𝐻1:𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝜇𝑖 es diferente
Fcal =
CMTra
CME
~ 𝐹𝑘−1; 𝑛−𝑘; 𝛼
Cuadro ANOVA
Fuente de
variación
Grados de
libertad
Suma de cuadrados
Cuadrados
medios
Fcal
Tratamiento k – 1 SCTra = ∑
T.j
2
𝑛𝑗
−
T..
2
𝑛
k
j=1
CMTra =
SCTra
𝑘 − 1
Fcal =
CMTra
CME
Error n – k SCE = SCT − SCTra CME =
SCE
𝑛 − 𝑘
Total n – 1 SCT = ∑ ∑ 𝑦ij
2
𝑟
i=1
𝑘
j=1
−
T..
2
𝑛
Semana 6:
Prueba de Independencia
𝜒𝑐𝑎𝑙
2
= ∑ ∑
(𝑜𝑖𝑗 − 𝑒𝑖𝑗)2
𝑒𝑖𝑗
𝑐
𝑗=1
𝑟
𝑖=1
~ 𝜒[1−𝛼; (𝑟−1)×(𝑐−1)]
2
r=Número de categorías de la variable X
c=Número de categorías de la variable Y
Frecuencia esperada
𝒆𝒊𝒋 =
𝒏𝒊. × 𝒏.𝒋
𝒏..
Coeficiente de contingencia
𝐶 = √
𝜒𝑐𝑎𝑙
2
𝜒𝑐𝑎𝑙
2
+ 𝑛
Prueba de homogeneidad
𝜒𝑐𝑎𝑙
2
= ∑ ∑
(𝑜𝑖𝑗 − 𝑒𝑖𝑗)2
𝑒𝑖𝑗
𝑘
𝑗=1
𝑟
𝑖=1
~ 𝜒[1−𝛼, (𝑟−1)×(𝑘−1)]
2
r=Número de categorías de la variable
k=Número de poblaciones
8. Semana 7:
Regresión lineal simple
𝑺𝑪(𝒙) = ∑ 𝒙𝟐
− 𝒏𝒙
̅𝟐
𝑺𝑪(𝒚) = ∑ 𝒚𝟐
− 𝒏𝒚
̅𝟐
𝑺𝑷(𝒙𝒚) = ∑ 𝒙𝒚 − 𝒏 𝒙
̅ 𝒚
̅
Estimación de los parámetros del modelo de regresión lineal simple
𝒀
̂ = 𝒃𝟎 + 𝒃𝟏𝑿
𝜷
̂𝟏 = 𝒃𝟏 =
𝑺𝑷(𝒙, 𝒚)
𝑺𝑪(𝒙)
𝜷
̂𝟎 = 𝒃𝟎 = 𝒚
̅ − 𝒃𝟏𝒙
̅
Prueba de hipótesis para validar el modelo
Paso 1 (Plantee las hipótesis de prueba)
𝑯𝟎: 𝜷𝟏 = 𝟎 (La recta de regresión no es significativa)
𝑯𝟏: 𝜷𝟏 ≠ 𝟎 (La recta de regresión es significativa)
Paso 2 (Establezca el nivel de significancia) α
Paso 3 (Calcule el valor del estadístico de prueba)
𝑻𝒄𝒂𝒍 =
𝒃𝟏
𝑺𝒃𝟏
~𝒕𝒏−𝟐
𝑺𝒃𝟏
=
𝑺𝒆
√𝑺𝑪(𝑿)
𝑺𝒆 = √
∑ 𝒚𝒊
𝟐
𝒏
𝒊=𝟏 − 𝒃𝟎 ∑ 𝒚𝒊
𝒏
𝒊=𝟏 − 𝒃𝟏 ∑ 𝒙𝒊𝒚𝒊
𝒏
𝒊=𝟏
𝒏 − 𝟐
Coeficiente de correlación:
𝑟 =
𝑆𝑃(𝑥, 𝑦)
√𝑆𝐶(𝑥) √𝑆𝐶(𝑦)
; −1 ≤ 𝑟 ≤ 1
Coeficiente de determinación
𝑅2
=
𝑏1𝑆𝑃(𝑥, 𝑦)
𝑆𝐶(𝑦)
; 0 ≤ 𝑅2
≤ 1