2. PRONOSTICOS
Pronosticar es el arte de especificar
información significativa acerca del futuro.
Las decisiones relativas a la planeación a
largo plazo exigen que se consideren
muchos factores:
las condiciones económicas
prevalecientes a nivel general,
las tendencias en la industria,
las acciones probables de los
competidores,
las condiciones del entorno político en
general, etc.
2
3. PRONOSTICOS (continuación)
Los pronósticos extrínsecos se formulan en
función de asociaciones externas, por
ejemplo, entre las ventas de aparatos
electrodomésticos y el ingreso personal
disponible.
Los pronósticos intrínsecos sirven para
planear la producción y se formulan en
forma individual para cada artículo.
3
4. PRONOSTICOS (continuación)
Un pronóstico es un cálculo de la actividad
futura. Puede ser una predicción sobre:
la aceptación de un nuevo producto,
los cambios de la demanda,
los inventarios,
u otras condiciones que influyen
directamente en la planeación de la
producción.
4
5. PRONOSTICOS (continuación)
Pronosticar es el arte y la ciencia de
predecir los eventos del futuro.
Hasta la década de los 70´s, los pronósticos
eran, en su gran mayoría, un arte.
Ahora también son una ciencia. Aunque aún
se necesita del juicio gerencial para
pronosticar, el gerente tiene herramientas y
métodos matemáticos sofisticados.
5
6. PERIODO DE LOS PRONOSTICOS
A Corto Plazo (hasta 6 meses), sirven de parámetros
para las operaciones en curso (productos
específicos, volumen de inventario, tipos de
habilidades y mano de obra, capacidad de
máquina).
A Mediano Plazo (entre seis meses y dos años),
sirven de apoyo para la planeación agregada
(grupo de productos, capacidades
departamentales).
A Largo Plazo (más de dos años), sirven de apoyo
para las decisiones acerca de:
ubicación y capacidad de la planta,
ampliación de las instalaciones,
selección de nueva tecnología y procesos
productivos,
adopción de nuevas líneas de productos, etc.
6
7. PRECISION DE LOS
PRONOSTICOS
La precisión del pronóstico se refiere a lo
aproximado que los pronósticos resultan en
comparación con los datos reales.
Pronósticos por grupo o familia de
productos (más o menos precisos).
Pronósticos de artículo por separado
(menos precisos)
7
8. MARCO CONCEPTUAL DE
LOS PRONOSTICOS
Aquí nos enfocaremos en el pronóstico de
la demanda de producción. Demanda y
ventas no siempre son iguales:
Si la demanda no se limita por la
capacidad o por políticas, el pronóstico
de ésta será el mismo que el pronóstico
de ventas.
En caso contrario, las ventas podrían ser
ligeramente inferiores a la demanda de
los clientes.
8
9. MARCO CONCEPTUAL DE
LOS PRONOSTICOS (cont.)
Es necesario aclarar la diferencia
entre pronóstico y planeación:
Los pronósticos se refieren a lo que se cree
que sucederá en el futuro.
La planeación se refiere a lo que se
considera que debería suceder en el futuro.
9
10. MARCO CONCEPTUAL DE
LOS PRONOSTICOS (cont.)
Los pronósticos son un insumo para todos los
tipos de planeación y control empresarial, tanto
dentro como fuera de la función de operaciones.
Mercadotecnia los usa para planear los
productos, la promoción y los precios.
Finanzas los utiliza como insumos para la
planeación financiera.
Operaciones los usa como insumo para la toma
de decisiones sobre: diseño de proceso,
planeación de la capacidad, estimación de
los niveles de inventarios, etc.
10
11. 11
ADMINISTRACIÓN DE LA DEMANDA
A
Demanda Independiente
B(4) C(2)
D(2) E(1) D(3) F(2)
Demanda Dependiente
12. 12
FACTORES QUE AFECTAN LA
DEMANDA
Factores Externos:
Una economía floreciente, logra influir positivamente en la
demanda, aun cuando sus efectos pueden no ser iguales para
todos los productos y servicios.
Ciertas actividades económicas, como los cambios en las
reglamentaciones de un gobierno, afectan a algunos productos,
pero no a otros.
Factores Internos, los cuales tienen que ver con las
decisiones sobre:
Diseño de productos o servicios.
Determinación de los volúmenes de inventario.
La fijación de precios y las promociones publicitarias.
El diseño de envases.
Los incentivos para el personal de ventas.
La expansión o contracción de las áreas geográficas
seleccionadas como objetivo de mercado.
13. METODOS DE PRONOSTICOS
• METODOS CUALITATIVOS
–Delphi
–Estudio de Mercados
–Analogía de los Ciclos de Vida
–Juicio Informado
•METODOS CUANTITATIVOS
–Pronósticos por Series de Tiempo
»Promedio Simple
»Promedio Móvil
»Suavización Exponencial
»Análisis de Regresión
»Modelos Matemáticos
»Box Jenkins
Promedio móvil Simple
Promedio Móvil Ponderado
Promedio Móvil Centrado
–Modelos Causales de Pronósticos
»Análisis de Regresión
»Modelos Econométricos
»Modelo de Insumo - Producto
»Indicadores Anticipados
--Modelos de Simulación
13
14. METODOS DE
PRONOSTICOS (continuac.)
Para pronósticos de planeación de la
producción y de inventarios, un sistema de
pronóstico “satisfactorio” presenta las
siguientes características:
Precisión
Pocos requisitos en cuanto al tiempo para hacer
cálculos.
Escasas necesidades de almacenamiento en
computadora.
Costos bajos en la compra o el desarrollo de programas.
Capacidad en línea.
Capacidad para enlazarse con un sistema de
administración de base de datos existente.
14
15. MÉTODOS CUALITATIVOS DE
PRONÓSTICOS
Como ya se indicó, los métodos cualitativos
de pronósticos utilizan el juicio de los
gerentes, su experiencia, los datos
relevantes y un modelo matemático
implícito.
Como el modelo es implícito, si dos
gerentes distintos utilizan los métodos
cualitativos, es frecuente que lleguen a
pronósticos con variaciones importantes.
15
17. 17
1. Método de Delphi
Descripción: Pronóstico desarrollado mediante un
grupo de expertos que responden preguntas en
rondas sucesivas. Las respuestas anónimas del
grupo retroalimentan en cada ronda a todos los
participantes. Se pueden usar entre tres y seis
rondas para lograr un consenso sobre el
pronóstico.
Usos: Pronósticos de ventas a largo plazo para
planeación de capacidad o instalaciones.
Pronósticos tecnológicos para evaluar cuando
pueden presentarse los cambios tecnológicos.
Exactitud: Regular a muy buena en el corto,
mediano y largo plazo.
18. 18
Delphi Method
1. Choose the experts to participate. There should be a
variety of knowledgeable people in different areas.
2. Through a questionnaire (or E-mail), obtain forecasts (and
any premises or qualifications for the forecasts) from all
participants.
3. Summarize the results and redistribute them to the
participants along with appropriate new questions.
4. Summarize again, refining forecasts and conditions, and
again develop new questions.
5. Repeat Step 4 if necessary. Distribute the final results to
all participants. *
19. 19
2. Estudios de Mercado
Descripción: Grupos, cuestionarios, pruebas de
mercado o estudios que se usan para obtener datos
sobre las condiciones del mercado.
Usos: Pronósticos de las ventas totales de la
compañía, de grupos de productos importantes o
de productos individuales.
Exactitud: Muy buena en el corto plazo. Buena
en el mediano plazo. Regular en el largo plazo.
*
20. 20
3. Analogía de los Ciclos de
Vida
Descripción: Predicción basada en la fase de
introducción, crecimiento y saturación de
productos similares. Aprovecha la curva de
crecimiento de las ventas en forma de S.
Usos: Pronósticos de ventas a largo plazo para
planeación de capacidad o instalaciones.
Exactitud: Mala en el corto plazo. Regular a
buena en el mediano plazo. Regular a buena en el
largo plazo. *
21. 21
4. Juicio Informado
Descripción: Pronóstico que puede hacer un
grupo o un individuo basándose en sus
experiencias, intuición o hechos relacionados con
la situación. No se usa un método riguroso.
Usos: Pronósticos de ventas totales y de productos
individuales.
Exactitud: Mala a regular en el corto, mediano y
largo plazo.
22. TIME SERIES ANALYSIS
Pick a model based on:
1. Time horizon to forecast
2. Data availability
3. Accuracy required
4. Size of forecasting budget
5. Availability of qualified personnel
22
23. 23
SERIE DE TIEMPO
Las observaciones repetidas de
la demanda de un producto o
servicio, tomando como base el
orden en que se realizan,
forman un patrón que se conoce
como serie de tiempo.
24. PRONÓSTICOS POR SERIES
DE TIEMPO
La expresión que se emplea más comúnmente para
un pronóstico por series de tiempo es:
En donde: Y = valor pronosticado.
T = tendencia básica.
C = variaciones cíclicas alrededor
de la tendencia.
S = variaciones de estacionalidad
dentro de la tendencia.
R = variaciones residuales o restantes sin
explicar.
Y TCSR
24
25. PRONÓSTICOS POR SERIES
DE TIEMPO (continuación)
Otro ejemplo de la descomposición de una serie de
tiempo es el siguiente:
en donde: y(t) = demanda durante el periodo t
a = nivel
b = tendencia
f(t) = factor de estacionalidad (multiplicativo)
e = error aleatorio
y t a bt f t e
( ) ( ) ( )
25
26. COMPONENTES DE UNA
SERIE DE TIEMPO
Serie de tiempo
original
Demanda
Tiempo
Ciclo
Patrón de
estacionalidad
Tendencia
Nivel
Error Aleatorio
Tiempo
Demanda
26
27. 27
»Promedio Simple
»Promedio Móvil
»Suavización Exponencial
»Análisis de Regresión
»Modelos Matemáticos
»Box Jenkins
PRONÓSTICOS POR SERIES
DE TIEMPO
Promedio móvil Simple
Promedio Móvil Ponderado
Promedio Móvil Centrado
*
*
*
*
*
*
28. PROMEDIO SIMPLE
Cuando b en la ecuación de la recta Y = a + bX es
igual a cero, la recta es horizontal. El pronóstico
para el siguiente periodo se convierte entonces en
el promedio simple de todos los valores de Y
hasta la fecha:
El cálculo de un promedio simple para el
pronóstico de tendencia es entonces un caso
especial del método de mínimo cuadrados.
N
Y
N
i
i
f
Y
1
28
29. PROMEDIO SIMPLE EJEMPLO
• Dados los datos de consumos de los trimestres de
cada año, entre 2.010 y 2.014 de una determinada
materia prima, se requiere el pronóstico trimestral
para el año 2.015.
29
Año T1 T2 T3
2.010 190 370 300
2.011 280 420 310
2.012 270 360 280
2.013 300 430 290
2.014 320 440 320
34. PROMEDIO SIMPLE EJEMPLO
(continuación)
Aplicando el pronóstico de línea recta para
2.015 para la ecuación de la recta
Y = a + bX, se tiene
n
i
i
n
i
i
n
i
i
i
n
i
n
i
i
X
b
X
a
Y
X
Xi
b
Na
Y
1
2
1
1
1
1
34
35. PROMEDIO SIMPLE EJEMPLO
(continuación)
En la siguiente tabla se hace un cálculo de las sumatorias
anteriores y los resultados se llevan a las dos últimas
ecuaciones vistas.
AÑO Y * X X2 XY
2.010 1080 0 0 0
2.011 1190 1 1 1190
2.012 1100 2 4 2200
2.013 1220 3 9 3660
2.014 1300 4 16 5200
Sumas 5890 10 30 12250
* Los valores de Y están dados en unidades.
35
36. PROMEDIO SIMPLE EJEMPLO
(continuación)
Reemplazando los resultados de las sumatorias en las
ecuaciones tenemos:
5890 = 5a +10b
12250 = 10a + 30b
Resolviendo estas dos ecuaciones simultáneamente se tiene
Llevando estos valores a la ecuación de la recta tenemos:
Y = 1.084 + 47X
para X = 5, correspondiente al 2.015, se tiene que
Y = 1.319, lo cual será el pronóstico para ese año.
36
5980 = 5a + 10b (-2)
12250 = 10a + 30b
290 = 10b de donde b = 29
5890 = 5a + 470 de donde
5a = 5420 de donde a = 1084
Y = 1080 + 47X
37. PROMEDIO SIMPLE EJEMPLO
(continuación)
Aplicando los índices de estacionalidad se tiene:
015
.
2
_
_
_
_
_
319
.
1
..
..........
..........
228
69
,
0
4
319
.
1
336
02
,
1
4
319
.
1
452
37
,
1
4
319
.
1
303
92
,
0
4
319
.
1
4
3
2
1
el
para
tendencia
la
de
pronostico
Total
F
F
F
F
T
T
T
T
37
*
38. SIMPLE MOVING AVERAGE
Week Demand
1 650
2 678
3 720
4 785
5 859
6 920
7 850
8 758
9 892
10 920
11 789
12 844
A =
+ D + D +...+D
n
t
t t-1 t-2 t-n+1
D
t t
F A
1
Let’s develop 3-week and 6-
week moving average
forecasts for demand.
Assume you only have 3
weeks and 6 weeks of
actual demand data for the
respective forecasts 38
41. In-Class Exercise
Week Demand
1 820
2 775
3 680
4 655
5 620
6 600
7 575
Develop 3-week and
5-week moving
average forecasts for
demand.
Assume you only
have 3 weeks and 5
weeks of actual
demand data for the
respective forecasts
41
43. WEIGHTED MOVING AVERAGE
Determine the 3-period
weighted moving average
forecast for period t = 4.
Weights:
t-1 0.5
t-2 0.3
t-3 0.2
Week Demand
1 650
2 678
3 720
4
t t t t N t N
F A W D W D W D
1 1 2 1 1
...
i
i
N
W
1
1
With the condition that
43
47. PROMEDIO MÓVIL CENTRADO
47
AÑO TRIMESTRE
UNIDADES
CONSUMO
T3
T4
T1
T2
T3
T4
T1
T2 420
T3
T4
T1
T2
190
370
300
220
280
2.012
2.013
2.014
310
180
270
360
280
190
48. PROMEDIO MÓVIL CENTRADO
48
a
b
Prono
AÑO TRIMESTRE
UNIDADES
CONSUM
O
PROMEDIO
MÓVIL DE 4
PERÍODOS
PROMEDIO
MÓVIL
CENTRADO
ÍNDICE
TEMPORAL
T3
T4
T1
T2
T3
T4
T1
T2 420
T3
T4
T1
T2
190
370
300
220
280
2.012
2.013
2.014
270
293
305
308
298
295
280
310
180
270
360
280
190
273
275
281
299
306
303
296
288
276
274
1,067
0,736
0,914
1,388
1,046
0,626
0,977
1,315
49. INDICES
49
a b
Anterior
AÑO T1 T2 T3 T4
2,012 1.07 0.74
2,013 0.91 1.39 1.05 0.63
2,014 0.98 1.32
TOTALES 1.89 2.71 2.12 1.37
ÍNDICE
TEMPORAL
PROMEDIO
0.945 1.355 1.06 0.685 4.045 1.011 0.988875155
ÍNDICE
TEMPORAL
AJUSTADO
0.934 1.340 1.048 0.677 4 1
FACTOR DE
AJUSTE
50. El paso final es hacer un pronóstico, el cual se
lleva a cabo tomando el producto del promedio
móvil centrado más reciente y su propio índice
Temporal ajustado. Para los dos primeros
trimestres del año 2.015, se tiene:
T12.015= 276 x 0,934 = 257,78 unidades
T22.015 = 274 x 1,340 = 367,16 unidades
50
*
Anterior
51. EXPONENTIAL SMOOTHING
Ft+1 = Ft + (Dt - Ft)
Ft+1 = Dt + (1- )Ft
At = Dt + (1- )At-1
Ft+1 = At
Premise--The most recent observations might
have the highest predictive value.
Therefore, we should give more weight to the
more recent time periods when forecasting 51
Para 0 ≤ ≤ 1, se tiene:
52. Exponential Smoothing Example
Week Demand
1 820
2 775
3 680
4 655
5 750
6 802
7 798
8 689
9 775
10
Determine
exponential
smoothing forecasts
for periods 2-10
using =0.10 and
=0.60.
Let F1=D1
52
58. 58
MAD (Desviación Absoluta Promedio
o Mean Absolute Deviation )
La Desviación Absoluta Promedio se representa así:
MAD =
A - F
n
t t
t=1
n
1 MAD 0.8 standard deviation
1 standard deviation 1.25 MAD
59. Example MAD
Month Sales Forecast
1 220 n/a
2 250 255
3 210 205
4 300 320
5 325 315
Determine the MAD for the four forecast periods
59
60. Solution
MAD =
A - F
n
=
40
4
= 10
t t
t=1
n
Month Sales Forecast Abs Error
1 220 n/a
2 250 255 5
3 210 205 5
4 300 320 20
5 325 315 10
40
60
61. Señal de Rastreo (Tracking Signal)
deviation
absolute
Mean
errors
forecast
of
sum
Running
=
MAD
RSFE
=
TS
Is the forecast average keeping pace with any
genuine upward or downward changes?
61
MAD
pronostico
del
desviacion
la
de
acumulada
suma
TS
rastreo
de
Señal
_
_
_
_
_
_
_
_
MAD
TS
rastreo
de
Señal F
D t
t
_
_
62. 62
Periodo Demanda
Dt
Error MADt
Dt - Ft ( = 0.3 )
1 10 15.0 -5.0 6.4
2 18 13.5 4.5 5.8
3 29 14.9 14.2 8.3
4 15 19.0 -4.1 7.1
5 30 17.9 12.1 8.6
6 12 21.5 -9.5 8.8
7 16 18.7 -2.7 7.0
8 8 17.9 -9.9 7.9
9 22 14.9 7.1 7.6
10 14 17.0 -3.0 6.2
11 15 16.1 -1.1 4.7
12 27 15.9 11.2 6.7
13 30 19.2 10.9 7.9
14 23 22.4 0.6 5.7
15 15 22.6 -7.6 6.4
17.7
103.4
*F1 = 15 MAD0 = 7 7
= 0.3
Pronós-
tico
t t
D F Tendencia
( )...
t t
D F Desviacion absoluta
... _
Con base en la siguiente información, determine la señal de rastreo
a b
63. 63
Con base en la siguiente información, determine los pronósticos,
las MAD y la señales de rastreo TS
1 10
2 18
3 29
4 15
5 30
6 12
7 16
8 8
9 22
10 14
11 15
12 27
13 30
14 23
15 15
Periodo
Demanda
Dt
a b
65. INTRODUCCIÓN A LA REGRESIÓN LINEAL SIMPLE
En la práctica, es frecuente que se requiera resolver
problemas que implican conjuntos de variables de las cuales
se sabe que tienen alguna relación inherente entre sí.
Por ejemplo, en una situación industrial quizá se sepa que el
contenido de alquitrán en la corriente de salida de un proceso
químico está relacionado con la temperatura en la entrada.
Podría ser de interés desarrollar un método de pronóstico, es
decir, un procedimiento para estimar el contenido de
alquitrán de varios combustibles teniendo en cuenta la
temperatura de entrada, a partir de información
experimental. Por supuesto, es muy probable que para
muchos ejemplos concretos en los que la temperatura de
entrada sea la misma, por ejemplo 130 °C, el contenido de
alquitrán a la salida no sea el mismo.
63
66. El contenido de alquitrán es una variable dependiente o
de respuesta. La temperatura en la entrada es una
variable independiente o regresor. Una forma razonable
de relación entre la respuesta Y y el regresor X es la
relación lineal donde, por supuesto, α es la intersección
con el eje Y y β es la pendiente. La relación se ilustra en
la figura 1.
64
67. Relaciones entre variables y regresión
• El término regresión fue introducido por Galton en su libro
“Natural inheritance” (1889) refiriéndose a la “ley de la
regresión universal”:
– “Cada peculiaridad en un hombre es compartida por sus
descendientes, pero en media, en un grado menor.”
• Regresión a la media
– Su trabajo se centraba en la descripción de los rasgos físicos
de los descendientes (una variable) a partir de los de sus
padres (otra variable).
– Pearson (un amigo suyo) realizó un estudio con más de 1000
registros de grupos familiares observando una relación del
tipo:
• Altura del hijo = 85cm + 0,5 altura del padre (aprox.)
• Conclusión: los padres muy altos tienen tendencia a
tener hijos que heredan parte de esta altura, aunque
tienen tendencia a acercarse (regresar) a la media. Lo
mismo puede decirse de los padres muy bajos, tienden a
tener hijos más altos.
• Hoy en día el sentido de regresión es el de predicción de una
medida basándonos en el conocimiento de otra.
Francis Galton
•Primo de Darwin
•Estadístico y
aventurero
•Fundador (con otros)
de la estadística
moderna para explicar
las teorías de Darwin.
65
68. Estudio conjunto de dos variables
• A la derecha tenemos una posible manera de recoger los datos,
observando dos variables en varios individuos de una muestra.
– En cada fila tenemos los datos de un individuo
– Cada columna representa los valores que toma una variable sobre
los mismos.
– Las individuos no se muestran en ningún orden particular.
• Dichas observaciones pueden ser representadas en un
diagrama de dispersión (‘scatterplot’). En ellos, cada
individuos es un punto cuyas coordenadas son los valores de
las variables.
• Nuestro objetivo será intentar reconocer a partir del diagrama
de dispersión, si hay relación entre las variables, de qué tipo, y
si es posible predecir el valor de una de ellas en función de la
otra.
Altura
en cm.
Peso
en Kg.
162 61
154 60
180 78
158 62
171 66
169 60
166 54
176 84
163 68
... ...
66
69. 30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
Diagramas de dispersión o nube de puntos
Mide
187
cm.
Mide 161 cm.
Pesa 76 kg.
Pesa 50 kg.
Tenemos las alturas X y los pesos Y de 30 individuos
representados en un diagrama de dispersión.
67
70. 30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
Relación entre variables.
Tenemos las alturas X y los pesos Y de 30 individuos
representados en un diagrama de dispersión.
68
71. 30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
Predicción de una variable en función de la
otra.
Aparentemente el peso aumenta 10Kg por cada 10 cm de
altura... o sea, el peso aumenta en una unidad por cada
unidad de altura.
10 cm.
10 kg.
69
72. Cómo reconocer relación directa e inversa.
Fuerte relación
directa.
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
Cierta relación
inversa
0
10
20
30
40
50
60
70
80
140 150 160 170 180 190 200
Para valores de X por encima de la
media tenemos valores de Y por
encima y por debajo en proporciones
similares. Incorrelación.
Para los valores de X mayores que la
media le corresponden valores de Y
menores. Esto es relación inversa o
decreciente.
•Para los valores de X
mayores que la media le
corresponden valores de Y
mayores también.
•Para los valores de X
menores que la media le
corresponden valores de Y
menores también.
•Esto se llama relación directa
o creciente entre X e Y.
Incorrelación
30
80
130
180
230
280
330
140 150 160 170 180 190 200
70
73. Cómo reconocer buena o mala relación
Poca relación
30
80
130
180
230
280
330
140 150 160 170 180 190 200
Fuerte relación
directa.
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
Cierta relación
inversa
0
10
20
30
40
50
60
70
80
140 150 160 170 180 190 200
• Dado un valor de X no
podemos decir gran cosa
sobre Y. Mala relación.
•Conocido X sabemos
que Y se mueve por una
horquilla estrecha.
Buena relación.
•Lo de “horquilla estrecha”
hay que entenderlo con
respecto a la dispersión
que tiene la variable Y por
si sola, cuando no se
considera X.
71
Independencia.
74. • La covarianza entre dos variables, Sxy, nos indica si
la posible relación entre dos variables es directa o
inversa.
– Directa: Sxy > 0
– Inversa: Sxy < 0
– Incorreladas: Sxy = 0
• El signo de la covarianza nos dice si el aspecto de la
nube de puntos es creciente o no, pero no nos dice
nada sobre el grado de relación entre las variables.
Covarianza de dos variables X e Y
n
i
i
i
xy y
y
x
x
n
S
1
1
72
75. Coef. de correlación lineal de Pearson
• El coeficiente de correlación lineal de Pearson de
dos variables, r, nos indica si los puntos tienen una
tendencia a disponerse alineadamente (excluyendo
rectas horizontales y verticales).
• tiene el mismo signo que Sxy por tanto de su signo
obtenemos el que la posible relación sea directa o
inversa.
• r es útil para determinar si hay relación lineal entre
dos variables, pero no servirá para otro tipo de
relaciones (cuadrática, logarítmica,...)
yy
xx
xy
S
S
S
r
n
i
i
i
xy
n
i
i
yy
n
i
i
xx
Y
Y
X
X
n
S
Y
Y
n
S
X
X
n
S
1
2
1
2
1
1
1
1
73
76. • Es adimensional
• Sólo toma valores entre [-1,1], es decir, -1 ≤ r ≤ 1
• Las variables son incorreladas r = 0
• Relación lineal perfecta entre dos variables r = +1 o r = -1
– Excluimos los casos de puntos alineados horizontalmente o verticalmente.
• Cuanto más cerca esté r de +1 ó -1, mejor será el grado de
relación lineal.
– Siempre que no existan observaciones anómalas.
Propiedades de r
-1 +1
0
Relación
inversa
perfecta
Relación
directa
perfecta
Variables
incorreladas
74
80. • ¿Si r = 0, quiere decir eso que las variables son independientes?
– En la práctica, casi siempre sí, pero no tiene
por qué ser cierto en todos los casos.
– Lo contrario si es cierto: Independencia
implica incorrelación.
• Me ha salido r=1.2 ¿la relación es “super lineal”[sic]?
– ¿Super qué? Eso es un error de cálculo. Siempre debe
tomar un valor entre -1 y +1.
• ¿A partir de qué valores se considera que hay “buena relación
lineal”?
– Es difícil dar un valor concreto (mira los gráficos
anteriores). Para este curso digamos que si |r| > 0,7 hay
buena relación lineal y que si |r| > 0,4 hay cierta relación
(por decir algo... la cosa es un poco más complicada:
observaciones anómalas,...)
Preguntas frecuentes
78
81. Si la relación es exacta, entonces se trata de una
determinista entre dos variables científicas. Sin embargo,
en los fenómenos científicos y de ingeniería, la relación no
es determinista (es decir, una X dada no siempre produce el
mismo valor de Y).
Como resultado, existen problemas importantes que son de
naturaleza probabilística, toda vez que la relación anterior
no puede considerarse exacta. El concepto de análisis de
regresión tiene que ver con encontrar la mejor relación
entre Y y X, al cuantificar la intensidad de dicha relación y
emplear métodos que permitan predecir los valores de la
respuesta ante valores dados del regresor x.
Regresión lineal simple
79
82. Regresión lineal simple
En muchas aplicaciones, habrá más de un regresor (es decir,
más de una variable independiente que ayude a explicar a
Y"). Por ejemplo, en el caso en que la respuesta es el precio
de una casa, se esperaría que el área construida y la edad de
ésta contribuyeran a la explicación del precio, por lo que en
este caso la estructura múltiple de la regresión podría
escribirse como
donde Y es el precio, x1 son los metros cuadrados y x2 es la
edad en años. Este es un problema con regresores múltiples.
El análisis resultante se denomina regresión múltiple.
En tanto que el análisis del caso con un solo regresor recibe
el nombre de regresión simple.
80
83. 83
Regresión lineal simple
- El modelo para la regresión lineal es:
i
i
i x
b
a
y
i = 1, 2, ..., n
donde:
yi = valor de la variable dependiente en el período i.
xi = Valor de la variable independiente en el período i.
i = Error aleatorio en el modelo.
a = ordenada de la recta que relaciona yi y xi.
b = pendiente de la recta.
n = número de períodos de datos disponibles.
84. Tendencia Rectilínea:
Dentro los diversos criterios que podrían
seguirse para fijar la correlación
existente entre dos variables, vamos a
adoptar el más ampliamente usado,
conocido como criterio mínimo
cuadrático.
Este criterio consiste en determinar, de
entre todas las rectas posibles, aquella en
la que el promedio de los cuadrados de
las distancias de los puntos Y´ a la recta
alcanza el valor mínimo.
Regresión lineal simple
82
85. Tendencia Rectilínea (cont.)
El criterio mínimo cuadrático postula que la recta
que cumpla esta condición es la que mejor se
adapta al gráfico de dispersión y, por lo tanto, la
que expresa mejor dentro del tipo de relación
rectilínea, la correlación existente entre la variable
dependiente y la independiente.
Y’
Y’
Y’
Y’
Y’
$
Puntaje
Y = a + bX
La fórmula que
expresa este
criterio es:
n
i
i
n
bX
a
Y
L
1
2
'
1
L
83
86. Tendencia Rectilínea (cont.)
Derivando parcialmente respecto a a y b, la ecuación
(1), e igualando a cero, se obtienen la primera y
segunda ecuaciones normales, así:
2
3
Simplificando estas dos ecuaciones se obtiene
0
2
0
2
1
1
i
n
i
i
i
n
i
i
i
X
bX
a
Y
b
L
bX
a
Y
a
L
n
i
i
n
bX
a
Y
L
1
2
'
1
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
X
Y
X
b
X
a
Y
X
b
na
1
1
2
1
1
1
4
5
84
87. Tendencia Rectilínea (cont.)
Resolviendo simultáneamente las ecuaciones (4) y
(5), se tienen los resultados para a y b
respectivamente.
;
'
'
1
2
1
2
1
1
1
1
2
n
i
n
i
i
i
n
i
i
i
n
i
i
n
i
i
n
i
i
X
X
n
Y
X
X
Y
X
a
n
i
n
i
i
i
n
i
i
n
i
i
n
i
i
i
X
X
n
Y
X
Y
X
n
b
1
2
1
2
1
1
1
'
'
85
88. 88
Regresión lineal simple
Para ajustar los datos de la mejor manera posible a una línea
recta se buscan valores para a y b de tal forma que se
minimice la suma de cuadrados totales de la diferencia
entre los valores de la variable dependiente real y la estimada
por el modelo.
Esto se consigue utilizando las siguientes fórmulas para el
cálculo de a y b:
89. 89
Ejemplo numérico 1
yi = Número de accesorios vendidos en el mes i.
xi = Número de permisos emitidos en el mes i.
EJEMPLO DE REGRESION LINEAL SIMPLE
Dato
Número de
Permisos
Número de
Accesorios Dato
Número de
Permisos
Número de
Accesorios
1 22 72 13 28 63
2 16 44 14 21 50
3 24 80 15 18 67
4 95 191 16 46 109
5 84 187 17 145 304
6 13 57 18 122 239
7 114 238 19 108 223
8 147 283 20 85 173
9 96 204 21 107 211
10 59 144 22 53 104
11 35 102 23 17 59
12 41 109 24 12 24
90. 90
Solución ejemplo numérico
Gráfico hecho con la
herramienta “X-Y plot...” en
la opción “Scatterplots” del
submenú “plot” de Excel.
Las siguientes
tablas se obtuvieron
con la opción
“simple regresión”
del submenú
“relate” de Excel.
91. Regression Equation Example
Week Sales
1 150
2 157
3 162
4 166
5 177
Develop a regression equation to predict sales
based on these five points.
89
92.
3
.
6
5
.
143
2
2
2
2
15
*
15
-
55
*
5
812
*
15
-
2499
*
5
=
=
b
15
*
15
-
55
*
5
2499
*
15
-
812
*
55
=
=
a
x
2
x
x
n
y
x
xy
n
x
x
n
xy
x
y
90
SOLUTION
Week Week*Week Sales Week*Sales
1 1 150 150
2 4 157 314
3 9 162 486
4 16 166 664
5 25 177 885
15 55 812 2499
Sum Sum Sum Sum
94. 92
EJEMPLO
Suponga que nos interesa estimar la demanda de periódicos basándonos en la
población local. En la siguiente tabla se muestra la demanda de periódicos
durante los último 8 años y la población correspondiente de una ciudad
pequeña.
1 3.0 2.0
2 3.5 2.4
3 4.1 2.8
4 4.4 3.0
5 5.0 3.2
6 5.7 3.6
7 6.4 3.8
8 7.0 4.0
AÑO DEMANDA POBLACION
95. 95
POBLACION PROYECTADA PARA ELAÑO 9
XY
2.0
4.8
8.4
12.0
16.0
21.6
26.6
32.0
X (Años)
1
2
3
4
5
6
7
8
Y (Población)
2.0
2.4
2.8
3.0
3.2
3.6
3.8
4.0
24.8
X
2
1
4
9
16
25
36
49
64
123.4
204
36
a
Y
n
b
X
n
b
n X Y X Y
n X X
i i
i i i i
i i
( ) ( )
2 2
a = 1.836
b = 0.281
Y9 = a + bX = 1.836 + 0.281 * 9 = 4.365 = 4.4
96. 96
VENTAS DE PERIÓDICOS PROYECTADAS PARA EL AÑO 9
i (Años) Yi Xi XiYi Xi
2
Yi
2
1 3.0 2.0 6.0 4.0 9.0
2 3.5 2.4 8.4 5.8 12.3
3 4.1 2.8 11.5 7.8 16.8
4 4.4 3.0 13.2 9.0 19.4
5 5.0 3.2 16.0 10.2 25.0
6 5.7 3.6 20.5 13.0 32.5
7 6.4 3.8 24.3 14.4 41.0
8 7.0 4.0 28.0 16.0 49.0
Sumatorias 39.1 24.8 127.9 80.2 205.0
a
Y
n
b
X
n
b
n X Y X Y
n X X
i i
i i i i
i i
( ) ( )
2 2
a = -1.34
b = 2.01
Y9 = a + bX = -1.34 + 2.01 * 4.4 = 7.50
(Demanda) (Población)
97. Ejemplo 2
Considere los datos experimentales de la tabla adjunta, que se
obtuvo de 33 muestras de desechos tratados químicamente,
en el estudio que se realizó en el Instituto Politécnico y
Universidad Estatal de Virginia.
Reducción de
Sólidos x (%)
Demanda de
Oxígeno
Químico, Y (%)
Reducción de
Sólidos x (%)
Demanda de
Oxígeno
Químico, Y (%)
3 5 36 34
7 11 37 36
11 21 38 38
15 16 39 37
18 16 39 36
27 28 39 45
29 27 40 39
30 25 41 41
30 35 42 40
31 30 42 44
31 40 43 37
32 32 44 44
33 34 45 46
33 32 46 46
34 34 47 49
36 37 50 51
36 38
MEDIDAS DE LOS SÓLIDOS Y LA DEMANDA DE OXÍGENO
95
98. Ejemplo 2 (continuación)
Estime la recta de regresión para los datos de
contaminación de la tabla del Ejemplo 2
Por lo tanto
Así, la recta de regresión estimada está dada por
96
99. EJERCICIO EN CLASE 1
• Ajustar un modelo de regresión simple a los datos de la pureza de
oxigeno que se muestra en la siguiente tabla:
No. Observaciones Nivel Hidrocarburos X (%) Pureza Y (%)
1 0,99 90,01
2 1,02 89,05
3 1,15 91,43
4 1,29 93,74
5 1,46 96,73
6 1,36 94,45
7 0,87 87,59
8 1,23 91,77
9 1,55 99,42
10 1,40 93,65
11 1,19 93,54
12 1,15 92,52
13 0,98 90,56
14 1,01 89,54
15 1,11 89,85
16 1,20 90,39
17 1,26 93,25
18 1,32 93,41
19 1,43 94,98
20 0,95 87,33
NIVEL DE OXIGENO DE HIDROCARBUROS
97