SlideShare ist ein Scribd-Unternehmen logo
1 von 10
Downloaden Sie, um offline zu lesen
ESTIMACION ROBUSTA
HERIBERTO L. URBISAIA y JUANA Z. BRUFMAN (UBA)
1.- GENERALIDADES
La robustez de un método de estimación se refiere a su condición para obtener estimaciones insensibles
ante posibles violaciones de alguno de los supuestos fijados al especificar un modelo, en particular, el
relativo a la distribución admitida para la perturbación aleatoria.
Un estimador robusto produce “buenas” estimaciones” (en algún sentido), ante una amplia variedad de
posibles procesos generadores de datos.
De acuerdo con la formalización habitual en la estadística matemática, se supone que las observaciones
del fenómeno en estudio son generadas a partir de un proceso aleatorio, representado por un miembro
Fθ de la familia paramétrica F de funciones de distribución:
{ };Fθ θ ∈ΘF =
Se admite que el mecanismo es totalmente conocido salvo el parámetro θ , que debe ser estimado utili-
zando un estimador ˆθ , con las propiedades desables conocidas: insesgadez y eficiencia. En general el
método de Máxima Verosimilitud (MV) satisface tales requerimientos y en gran parte de las aplicaciones
se admite la distribución normal ó gaussiana como modelo teórico de distribución.
En el modelo lineal general: i i iy = +ε′x β , con errores normales, independientes e idénticamente distri-
buidos, el estimador mínimo cuadrático clásico (MCC) ˆββββ es el más eficiente de los estimadores insesga-
dos ( best unbiased estimator). Cuando los errores no están normalmente distribuidos, ˆββββ sigue siendo
el más eficiente, pero dentro de una clase más restringida de estimadores, esto es, dentro de la clase de
estimadores lineales insesgados (best linear unbiased estimator).
Ahora bien; si la distribución de los errores es leptocúrtica, en el sentido de generar frecuentemente erro-
res grandes, la linealidad es una condición extremadamente restrictiva: se prueba que los estimadores
MCC resultan inferiores a otros estimadores no lineales insesgados, que se denominan estimadores
robustos.
Es sabido que la distribución subyacente de la perturbación aleatoria no se conoce con certeza; de ahí
que el área de la estimación robusta que ha merecido mayor atención, dentro del campo econométrico,
se refiere a estimadores que si bien son algo menos eficientes que los MCC cuando los errores se
hallan normalmente distribuidos, resultan considerablemente más eficientes que los MCC para errores
no normales. Otros desarrollos referentes a la robustez incluyen estimadores que son robustos ante es-
pecificaciones alternativas de la matriz de varianza-covarianza de los errores y estimadores que son ro-
bustos con respecto a la especificación de la forma funcional; también en la Inferencia Bayesiana la elec-
ción de un estimador robusto con respecto a la especificación de la distribución a priori, ha sido tema de
interés para los econometristas bayesianos.
La robustez de las estimaciones constituye actualmente un tema preocupante entre economistas teóri-
cos y aplicados, dada la extrema sensibilidad de algunos procedimientos de estimación ante la no nor-
malidad del término de error.
2.- OBSERVACIONES ATÍPICAS. OBSERVACIONES INFLUYENTES.
Cuando se analizan datos muestrales es fácil captar visualmente discrepancias respecto a una distribu-
ción normal: en datos microeconómicos ó financieros de alta frecuencia, se observan a menudo distri-
buciones empíricas con colas más densas que la normal.
2
La falta de normalidad obedece a la presencia de datos anómalos (outliers)1
: puede ocurrir que una
pequeña fracción de la muestra, digamos entre el 2% y el 10% aparezca como atípica, debido a errores
de medición, alteraciones en la metodología de recolección de datos, etc.
Valores extremos en la muestra pueden tener, a priori, una incidencia desproporcionada en las estima-
ciones MCC; estos valores se denominan observaciones de efecto palanca, que deberán ser analizados
a los efectos de decidir sobre el tratamiento más adecuado al objetivo del modelo. Con frecuencia, la
función estimada resulta desplazada en exceso, con el correspondiente aumento de los errores están-
dar de las estimaciones. En este caso se habla de valores influyentes y su identificación puede realizar-
se corriendo dos regresiones: una con la muestra completa y otra quitando la i -ésima observación.
Todo dato cuya eliminación altera marcadamente la estimación MCC se considera observación influyen-
te.
2.1.- DETECCION DE OBSERVACIONES INFLUYENTES.
La metodología para identificar valores influyentes ha sido formalizada por Belsley, Kuh y Welsch,
( )1980 ; los autores utilizan medidas de diagnóstico que apuntan a cuantificar el impacto de observacio-
nes potencialmente influyentes en la estimación MCC del Modelo de Regresión.
Sea el Modelo = +y X β εβ εβ εβ ε , con K variables explicativas, a ser estimado con n observaciones. La con-
tribución de la observación i -ésima en la estimación ˆββββ se define como:
( )
( )
1
ˆ
ˆ ˆ
1
i i
i
DFBETA i
h
ε
−
′ ′
= − =
−
X X x
β ββ ββ ββ β
expresión que mide diferencias entre los coeficientes ˆββββ , estimados: i) con la totalidad de la información ;
ii) quitando la observación i .
En esta expresión i
′x es la fila i -ésima de la matriz X y ( )
1
i i ih
−
′ ′= x X X x mide la influencia a priori de
la observación i .
2
Del mismo modo, la expresión
( )
ˆ
ˆ ˆ
1
i i
i i
i
h
DFFIT y y i
h
ε
= − =
−
mide diferencias entre valores ajustados ˆy : i) con la totalidad de la información ; ii) quitando la observa-
ción i .
Dado que estas diferencias dependen de las unidades de medición, es conveniente normalizarlas divi-
diendo cada una de ellas por sus correspondientes errores estándar. Las medidas estandarizadas se
indican como DFBETAS y DFFITS .
Por tanto, si se desea medir el cambio en la estimación del coeficiente kβ , originado por la supresión de
la información i , se deben calcular:
( )
( ) ( )
1
ˆ ˆ
ˆ
k k
ki
kk
i
DFBETAS
i
β β
σ
−
−
=
′X X
;
( )
( ) ( )( )1 2
1 2
ˆ
ˆ ˆ 1
i i i i
i i
i h
DFFITS
i h i h
ε
σ σ
′ ′
= =
−
x xβ − ββ − ββ − ββ − β
1
Toda observación que no parece seguir el patrón de agrupamiento de la mayoría de los datos recibe el nombre de
observación anómala ó atípica.
2
ih es el i -ésimo elemento diagonal de la matriz de proyección MCC: ( )
1−
′ ′=H X X X X , denominada Matriz
“Hat” ; H es matriz idempotente; por tanto 0 1ih≤ ≤ . Además, la traza de H = K , por lo que
1
n
i
i
h K
=
=∑ . El
tamaño promedio de un elemento diagonal es K n.
3
Como regla práctica ó valor de corte, los autores consideran observaciones influyentes cuando:
2
kiDFBETAS
n
> ;
1 2
2i
K
DFFITS
n
 
>  
 
La detección de valores influyentes no implica que deban ser desechados del grueso de la información. A
menudo, tales valores pueden ser indicio de cambios estructurales cuyos efectos deben ser detectados a
partir de las estimaciones del modelo.
Completada la etapa de identificación, efectuadas la correcciones que correspondan, por ejemplo, por
fallas en la carga de datos ó errores de medición, se procederá a la búsqueda de estimadores robustos
que permiten la inclusión de toda observación influyente considerada por el investigador como informa-
ción confiable y valiosa.
3.- ESTIMADORES ROBUSTOS
Existen propuestas alternativas para la estimación robusta de medidas de posición y de escala. Una cla-
sificación apropiada, efectuada por Huber (1964) es la siguiente:
1.- Estimadores M
2.- Estimadores Lp
3.- Estimadores L
4.- Mínimos Cuadrados Recortados
5.- Estimadores con influencia acotada
En lo que sigue ejemplificamos cada uno de los estimadores refiriéndonos al campo econométrico, espe-
cíficamente al Modelo de Regresión:
0 1 1 2 2 K...i i i K i i i iy = + x + x + + x = +β β β β ε ε′+ x β
Estimadores M: Esta clase de estimadores pueden considerarse como generalización de los de Máxima
Verosímil; de ahí la denominación “estimadores- M”. Consisten en minimizar la función suma ponderada
de errores absolutos:
1
n
i i i
i
w y
=
′−∑ x ββββ utilizando diferentes ponderaciones, según la magnitud del error. 3
.
Por ejemplo:
i) Fijando todas las ponderaciones iguales, esto es 1iw = , ∀ i ; en este caso el estimador minimiza la
suma de errores absolutos; el estimador se denomina “Desviación Absoluta Mínima”:
1
n
i i
i
MAD y
=
′= −∑ x ββββ
ii) Utilizando un esquema de ponderaciones que dependa de la magnitud del error en términos absolu-
tos: si éste es menor a un valor arbitrario b, se lo toma como ponderación; en caso contrario, la ponde-
ración se estabiliza en b :
( )i i
i i i i i
i i iy
w y y b
w b sgn y b′−
= − − <′ ′
= − ≥′x
x x
xββββ
β ββ ββ ββ β
ββββ
si
si
iii) Aplicando un esquema similar al anterior, pero con valores iw decrecientes hacia cero si
i i by ≥− ′x ββββ ; cuando i iy − ′x ββββ alcance un valor arbitrario d , iw se tomará =0. Esta opción implica
desechar observaciones que generen errores absolutos mayores que d .
3
En este sentido, los estimadores MCC utilizan como ponderación la magnitud de cada error absoluto.
4
Estimadores Lp : Resultan de minimizar la función
1
n
p
i i
i
y
=
′−∑ x ββββ ; es decir, la suma de errores abso-
lutos elevados a la potencia .p Si 2,p = estamos ante los Estimadores MCC; si 1,p = el estimador coin-
cide con el MAD. Como regla práctica para decidir sobre el valor de p , debe tenerse en cuenta que,
cuanto más densas son las colas de la distribución empírica, menor debe ser .p
Estimadores L: Son combinaciones lineales de estadísticos de orden muestrales.
4
Así, el estadístico de orden 0.25 ó primer cuartil: ( )0.25Yq , separa la distribución de modo que el 25%
de las observaciones son menores que ( )0.25Yq y el 75% mayores que ( )0.25Yq ; la mediana es el se-
gundo cuartil ó cuantil de orden 0.50, etc.
Se recordará que, dada una variable aleatoria Y , con función de distribución ( ) ( )F y P Y y= ≤ , se
define el cuantil de orden τ ( )0 1τ< < , como el menor y que satisface la relación ( )F y τ≥ . Formal-
mente:
{ }( ) inf : ( )q y F yτ τ= ≥
Si se dispone de una muestra aleatoria de tamaño n , la función de distribución empírica tradicional vie-
ne dada por:
( ) ( )n i
k
F y I Y y= ≤∑
donde ( )I z es una función indicativa que toma valor 1 cuando el argumento es cierto y 0 en los demás
casos.
La correspondiente función empírica de los cuantiles viene dada por la expresión:
{ }( ) inf : ( )n nq y F yτ τ= ≥
o lo que es lo mismo, considerado como un problema de optimización:
( )
: :
1( ) argmin
( ) min ( )
n i i
iY iY
n i
i
q Y Y
q arg Y
ξ
ξ
ξ ξ
τ
ττ τ ξ ξ
τ ρ ξ
≥ <
  
− 
  
 
 
 
= − + −
= −
∑ ∑
∑
donde ( ) ( ( 0))u u I uτρ τ= − < se denomina función de chequeo (check function) que pondera asimétri-
camente valores positivos y negativos.
Los estimadores L se obtienen combinando linealmente cuantiles de diferente orden; de este modo es
posible construir estimadores robustos de una medida de posición. Se han propuesto, por ejemplo, las
combinaciones:
( ) ( ) ( )% % %0.30 0.25 + 0.40 0.50 + 0.30 0.75q q q
ó bien:
( ) ( ) ( )% % %0.25 0.25 + 0.50 0.50 + 0.25 0.75q q q
4
Las observaciones ordenadas de la muestra aleatoria ( )1 2, ,..., ny y y se indican como: ( ) ( ) ( )1 2
, ,..., n
y y y siendo
( ) ( ) ( )1 2
... n
y y y≤ ≤ ≤ . Entonces ( ), 1,2,...,i
y i n= , se denomina estadístico de orden i de la muestra.
5
Mínimos Cuadrados Recortados: El método consiste, básicamente en desechar algunas observacio-
nes. Por ejemplo, después de calcular los cuantiles 0.05 y 0.95, se descartan observaciones con resi-
duos negativos respecto a ( )% 0.05q y positivos respecto a ( )% 0.95q . En total se elimina el 10% de las
observaciones; se practica una regresión mínimo- cuadrática con las observaciones remanentes y se
obtiene un estimador MCC α -recortado, siendo en este caso 0.10α = .
Estimadores con influencia acotada : Estos estimadores se diseñan de modo de limitar la incidencia
que una observación anómala pueda tener sobre las estimaciones MCC. Se trata de minimizar la suma
ponderada de errores cuadráticos, disminuyendo el peso otorgado a la observación atípica, respecto de
las restantes, las que conservan ponderación unitaria. La cota se elige generalmente, admitiendo que la
eficiencia del nuevo estimador resulte hasta, por ejemplo, un 5% menor que la correspondiente a los
estimadores MCC.
4.- REGRESIÓN POR CUANTILES Ó REGRESIÓN CUANTÍLICA
La regresión cuantílica, introducida por Koenker y Bassett en 1978, constituye actualmente una metodo-
logía de aplicación corriente en estudios socioeconómicos orientados al análisis de la desigualdad. Ello
ha sido posible gracias a la mayor disponibilidad de información microeconómica, unida a su procesa-
miento electrónico a través de paquetes informáticos cada vez más sofisticados.
En la mayoría de los estudios econométricos se modelan momentos condicionales; al especificar por
ejemplo, la relación i i iy = +ε′x β , se estima específicamente la función media condicional de y , con-
dicionada a las variables regresoras x . Sin embargo, existe actualmente un interés creciente en méto-
dos que permitan apreciar otros aspectos de la distribución de y . En esta dirección la regresión por
cuantiles apunta a una descripción más detallada al modelizar, no sólo el valor medio condicional, sino la
mediana, cuartiles, percentiles, etc., condicionados a los niveles de las variables regresoras.
Si se consideran cuantiles equiespaciados, por ejemplo, cada 5% ó 1% de la población, es posible mode-
lizar cada una de las posiciones predeterminada de la distribución de y . Por tanto, la regresión por
cuantiles amplifica notablemente el análisis de la distribución de la variable respuesta, condicionada al
conjunto de variables regresoras.
Un caso importante de la regresión por cuantiles es el estimador “Desviación Absoluta Mínima” (MAD),
que corresponde al ajuste de la mediana condicional de la variable respuesta.
Retomando el modelo i i iy = +ε′x β , donde iε es el error correspondiente a la observación i , resulta
que:
i) Mínimos Cuadrados Clásicos minimiza la función objetivo 2
ii
ε∑
ii) La regresión por la mediana (estimador MAD) minimiza ii
ε∑
iii) La regresión por quintiles considera como función objetivo una suma que pondera asimétricamente los
errores absolutos: otorga ponderaciónτ a errores por subestimación y ponderación ( )1 τ− para errores
por sobreestimación.
5.- EL MODELO DE REGRESIÓN POR CUANTILES
Como ya dijimos, en un análisis clásico de regresión lineal, formalizado mediante el modelo i i iy = +ε′x β ,
se intenta determinar la incidencia de las variables explicativas i
′x sobre el valor medio condicional de
y ; la incidencia resulta cuantificada al obtener las estimaciones ˆββββ .
En la regresión por cuantiles, en cambio, se analiza la incidencia de las variables explicativas sobre cada
uno de los cuantiles de la distribución de y ; se obtiene entonces un vector de estimaciones por cada
cuantil, que simbolizamos como τ
%ββββ .
6
GRAFICO I
En el grafico adjunto se ha representado para dos valores de 1 2: ,x x x la distribución condicionada de y
que supondremos en ambos casos normal pero con distinta media y varianza (ambas crecientes con x ).
La recta central representa la recta de regresión mínimo cuadrática, es decir, la esperanza condicional
de y dado x , que coincide en este caso con la mediana 0.50Q . Las líneas punteadas son las regresio-
nes cuantilicas Qτ para 0.05τ = y 0.95τ = .
Como puede observarse, las pendientes dadas por los coeficientes τβ resultan crecientes con τ , lo
que muestra la presencia de heterocedasticidad a medida que crece x .
Si las rectas punteadas fuesen paralelas, 0.05 0.95β β= estaríamos en el caso homocedástico.
La regresión por cuantiles condicionales estándar supone una especificación lineal en las variables re-
gresoras x :
( / , )i iQ τ ττ ′=x xβ ββ ββ ββ β
siendo τββββ el vector de coeficientes asociado al τ cuantil .
La función objetivo del párrafo anterior se modifica de manera que el vector cuantílico τ
%ββββ resulta de mi-
nimizar, respecto a τββββ , la expresión
( )
( )
: :
1
i i i i
n n
i i i i
i y x i y x
y y
τ τ
τ τ
τ
β β
τ τ
′ ′≥ <
  
′ ′− + − − 
  
∑ ∑x x
ββββ
β ββ ββ ββ βmin
Obsérvese que se utiliza la notación τββββ , y no ββββ como en el caso de MCC, para destacar que diferentes
elecciones de τ generan distintas estimaciones de ββββ . Por otra parte, si τ es 0.90, por ejemplo, la pon-
deración asimétrica opera con mayor intensidad para observaciones y ′≥ x ββββ que para observaciones
donde y ′< x ββββ
La función objetivo no es diferenciable, por lo que se utilizan métodos de programación lineal para la
búsqueda de la solución.
Regresión Cuantílica (Normal)
7
Desde el momento que este enfoque no requiere supuestos fuertes en lo que respecta a la distribución
de los errores se lo considera un método robusto para modelizar esas relaciones. Los autores Koenker y
Bassett demuestran además la consistencia y normalidad asintótica.
6.- UNA APLICACIÓN AL CÁLCULO DE ELASTICIDADES DEL GASTO
En Urbisaia y Brufman (2005), se estimaron elasticidades del Gasto por Deciles de Ingreso. El trabajo se
realizó en el marco del Proyecto UBACyT E036 Programación 2001-2004: “La Reforma Tributaria. Impli-
cancias sobre la Distribución del Ingreso y el Bienestar”.
Se utilizaron datos de la Encuesta Nacional de Gastos de los Hogares 1996-1997, INDEC, correspon-
dientes a la Región Metropolitana del Gran Buenos Aires, (Capital Federal y Conurbano Bonaerense),
considerándose diversos rubros que componen el presupuesto familiar: Alimentos, Bebidas Alcohólicas,
Indumentaria, Vivienda, Equipamiento del Hogar, Salud, Transporte, Esparcimiento, Educación, Bienes y
Servicios varios.
El análisis y procesamiento de la base de datos estuvo a cargo del Lic. Luis A. Trajtenberg aplicando el
programa STATA 8.0.
6.1.- RELEVANCIA DEL TEMA
El conocimiento de las elasticidades resulta fundamental para analizar el comportamiento de la demanda
ante variaciones de precios e ingresos. La posibilidad de segmentar los estudios según cuantiles de in-
greso permite diferenciar aun más las elasticidades y determinar el rango dentro del cuál los bienes se
comportan como necesarios o superfluos; en síntesis, en estos casos tendremos, para un mismo bien, el
comportamiento de la demanda según tramos de ingreso.
Una de las aplicaciones más interesantes de este instrumental se refiere al estudio de la repercusión de
los impuestos al consumo (ejemplo el valor agregado), sobre la demanda y finalmente sobre la recauda-
ción fiscal.
En efecto; un aumento de impuestos, es visto por el consumidor como un aumento de precios, y por
ende, una baja en los consumos. La magnitud de este efecto viene dado por las respectivas elasticida-
des.
Un incremento de precios vía un aumento de impuesto, tiene un efecto doble sobre las cuentas fiscales:
uno positivo y otro negativo. El positivo viene dado por la mayor tasa de impuesto, pero dado que simul-
táneamente se da el efecto contrario (negativo) por la baja en los consumos, el resultado final puede ser
incierto. En este caso, puede establecerse un nuevo nivel del equilibrio de las variables precio-
consumo, según elasticidades. Por tanto, el hecho de poder desagregar la demanda por cuantiles, con
sus respectivas elasticidades, nos da el instrumento necesario para analizar en forma cuantitativa el
resultado final y el impacto social de este tipo de impuestos.
6.2.- CASOS EMBLEMÁTICOS
El comportamiento de las elasticidades dentro de cada grupo tiene que ver con el grado de saciedad
(medida en unidades físicas) y rapidez y forma con que se llega a la misma, aún cuando luego puede
haber un cambio de calidad, que lleva a una extensión de la misma en términos de valor. A partir de es-
tos conceptos, cada grupo de bienes sigue su propia dinámica. Así para algunos bienes, la saciedad
física llega mas rápidamente que en otros, por ejemplo alimentos respecto a indumentaria, aunque en
valores puede la misma puede ser mas extensa.
Debemos tener en cuenta, que las elasticidades se refieren al gasto por tipo de bien, lo que implica el
efecto conjunto de la cantidad y la calidad. Es decir que al llegar a estratos superiores del ingreso, las
cantidades compradas siguen siendo las mismas o aumentan levemente, pero las calidades pueden au-
mentar significativamente el valor, acarreando variaciones más pronunciadas en el gasto.
Para el rubro Alimentos, como era de esperar, la proporción dedicada a este gasto disminuye a medida
que aumenta el ingreso, proporción que no puede ser alterada significativamente por la calidad; ello im-
8
plica que su valor es más o menos cercano al de saciedad: la elasticidad sufre un aplanamiento más
pronunciado a medida que aumentan los deciles.
Para Bebidas Alcohólicas y Cigarrillos, en virtud de que se trata de consumos que son más bien vicios,
tiene un nivel de saciedad elevado, y por ende, su elasticidad se mantiene constante a través de toda la
escala. Un aumento de precios, por aplicación de un impuesto, difícilmente tendrá impacto sobre la de-
manda. No obstante en este caso el impuesto tendrá un efecto diferente según se lo aplique a las unida-
des consumidas (botellas, atados de cigarrillos) ó al valor de los mismos (unidades x calidad).
En los restantes bienes, como transporte, esparcimiento y educación, las elasticidades son notoriamen-
te decrecientes, se trata de consumos con alto contenido de servicios.
El Cuadro adjunto resume los resultados obtenidos en dicha oportunidad
ELASTICIDADES POR DECILES DE INGRESO
Decil Aliment. B.Alcoh Cigarril. Indumen Viviend Equip Salud Transp Esparc Educ
1 0.7783 0.9020 0.8199 1.1413 0.8772 1.4721 0.9781 1.7017 1.8846 2.9341
2 0.7627 0.9035 0.8410 1.1277 0.8793 1.4197 0.9766 1.6152 1.7588 2.3438
3 0.7479 0.8940 0.8626 1.1287 0.8860 1.3806 0.9758 1.5608 1.6309 2.5217
4 0.7363 0.8998 0.8410 1.1101 0.8775 1.3968 0.9758 1.4916 1.6017 2.0723
5 0.7251 0.8922 0.8238 1.1081 0.8765 1.3610 0.9711 1.4300 1.5328 2.0145
6 0.7088 0.9013 0.8368 1.1129 0.8819 1.3610 0.9732 1.3987 1.5302 1.7087
7 0.6902 0.8904 0.8346 1.1040 0.8734 1.3152 0.9751 1.4033 1.4566 1.6719
8 0.6670 0.8904 0.8299 1.1101 0.8630 1.3122 0.9756 1.3218 1.4329 1.5981
9 0.6397 0.8792 0.7921 1.1058 0.8541 1.2863 0.9771 1.3070 1.4014 1.4609
10 0.5590 0.8769 0.7205 1.1083 0.8358 1.2149 0.9758 1.2904 1.2773 1.3702
Paralelamente se muestran en los Gráficos que siguen, estimaciones de regresión por cuantiles de las
Curvas de Engel del tipo:
ln
,
w G
i j j
α β= −
En las que:
,
w
i j
representa la proporción del gasto en el rubro i efectuado por el hogar j y jG
el gasto total del hogar. Se consideraron los rubros Alimentos, Bebidas Alcohólicas y Cigarrillos. Por
razones de claridad visual, sólo se exiben 0.10Q 0.50Q 0.90Q .
9
GRÁFICO II
ProporcióndelGastodestinadoaAlimentos
Curva de Engel Regresión Cuantílica
Log Ingreso Per Cápita
Regresión Cuantílica 10th Regresión Cuantílica 50th
Regresión Cuantílica 90th Alimentos Share
.733569 8.52231
-.013422
1.20053
ProporcióndelGastodestinadoaCigarrillos
Curva de Engel Regresión Cuantílica
Log Ingreso Per Cápita
Regresión Cuantílica 10th Regresión Cuantílica 50th
Regresión Cuantílica 90th Cigarrillo Share
.733569 8.52231
-.003002
.2494
ProporcióndelGastodestinadoaAlcohol
Curva de Engel Regresión Cuantílica
Log Ingreso Per Cápita
Regresión Cuantílica 10th Regresión Cuantílica 50th
Regresión Cuantílica 90th Alcohol Share
1.02185 8.52231
.000094
.242588
Las regresiones cuantílicas, muestran en la generalidad de los casos, una reducción pronunciada de la
heterocedasticidad a medida que aumenta el ingreso. Sin embargo esta reducción no es idéntica para
todos los bienes, sino que defiere según el tipo de bien.
Respecto a los coeficientes τβ (pendientes) de cada una de las regresiones, se obtuvieron:
Alimentos Bebidas Alcohólicas Cigarrillos
0.10
ˆβ -0.0789 -0.0022 -0.0047
0.50
ˆβ -0.1193 -0.0044 -0.1139
0.90
ˆβ -0.1264 -0.0132 -0.0292
Para alimentos, podemos ver una pendiente más pronunciada, en el sentido de que la saciedad opera
más rápidamente que para otro tipo de bienes.
BIBLIOGRAFÍA
Belsley, D.A., E.Kuh and R.E.Welsch [1980]: Regression Diagnostics: Identifying Influential
Data and Sources of Collinearity. New York. J.Wiley &Sons.
Cameron, A.C. & P.K.Trivedi [2010]: Microeconometrics using Stata. Revised Edition. Texas,
USA, Stata Press.
Hampel, F: [2001]: Robust Statistics: A Brief Introduction and Overview. Research Report N° 94.
Seminar für Statistik. Eidgenössische Technische Hochschule (ETH). Zürich. Switzerland
10
Hansen, L. & T. Sargent [2007]: Robustness. Princeton, N.J. Princeton University Press.
Huber, P.J. [1964]: Robust estimation of a location parameter. Annals of Mathematical Statistics. Vol.35;
73-101.
Huber, P.J. [1981]: Robust Statistics. New York. Wiley & Sons.
Judge, G.G. et al. [1985]: The Theory and Practice of Econometrics. 2
nd
. Ed. New York. John Wiley &
Sons.
Kennedy, P. [2008]: A Guide to Econometrics. Oxford. Blackwell Publishing.
Koenker, R. [2005]: Quantile Regression. Cambridge. Cambridge University Press
Koenker, R. and K.F.Hallock [2001]: Quantile Regression. Journal of Economic Perspectives. Vol.15; 4;
143-156.
Koenker, R. and G.Bassett [1978]: Regression quantiles. Econometrica, 46 (1), 33-50.
Sosa Escudero, W. [2005]: Perspectivas y Avances Recientes en Regresión por Cuantiles. En:
Progresos en Econometría. Asociación Argentina de Economía Política.
Spanos A. [1999]: Probability Theory and Statistical Inference. Econometric Society Monographs.
Cambridge .Cambridge University Press.
Urbisaia, H. y J.Brufman [2005]: La Reforma Tributaria. Implicancias sobre la Distribución del Ingreso y
el Bienestar. Buenos Aires, Ediciones Cooperativas.
Paquetes Informáticos: STATA 8.0 y E-VIEWS 7.1

Weitere ähnliche Inhalte

Was ist angesagt? (20)

Pruebas de bondad de ajuste
Pruebas de bondad de ajustePruebas de bondad de ajuste
Pruebas de bondad de ajuste
 
Mic sesión 8a
Mic sesión 8aMic sesión 8a
Mic sesión 8a
 
Prueba de hipotesis 2018
Prueba de hipotesis 2018Prueba de hipotesis 2018
Prueba de hipotesis 2018
 
Muestra 2020
Muestra 2020Muestra 2020
Muestra 2020
 
Estimación estadística
Estimación estadísticaEstimación estadística
Estimación estadística
 
Estimación estadística
Estimación estadísticaEstimación estadística
Estimación estadística
 
Inferencia estadística. Estimación por intervalos.
Inferencia estadística. Estimación por intervalos.Inferencia estadística. Estimación por intervalos.
Inferencia estadística. Estimación por intervalos.
 
Estadistica MI-23
Estadistica MI-23Estadistica MI-23
Estadistica MI-23
 
Distribuciones de probabilidad
Distribuciones de probabilidadDistribuciones de probabilidad
Distribuciones de probabilidad
 
Ensayo de estimacion fefa
Ensayo de estimacion fefaEnsayo de estimacion fefa
Ensayo de estimacion fefa
 
DISTRIBUCION MUESTRAL
DISTRIBUCION MUESTRALDISTRIBUCION MUESTRAL
DISTRIBUCION MUESTRAL
 
Estimaciones estadisticas en las cc.ss. ccesa007
Estimaciones estadisticas en las cc.ss.  ccesa007Estimaciones estadisticas en las cc.ss.  ccesa007
Estimaciones estadisticas en las cc.ss. ccesa007
 
Mic sesión 10
Mic sesión 10Mic sesión 10
Mic sesión 10
 
Intervalos de confianza (7)
Intervalos de confianza (7)Intervalos de confianza (7)
Intervalos de confianza (7)
 
Estimación de Parámetros
Estimación de ParámetrosEstimación de Parámetros
Estimación de Parámetros
 
Estimación de parámetros para muestras pequeñas
Estimación de parámetros para muestras pequeñasEstimación de parámetros para muestras pequeñas
Estimación de parámetros para muestras pequeñas
 
Propiedades mco
Propiedades mcoPropiedades mco
Propiedades mco
 
Estadistica aplicada
Estadistica aplicadaEstadistica aplicada
Estadistica aplicada
 
Estadística Inferencial
Estadística Inferencial Estadística Inferencial
Estadística Inferencial
 
Mic sesión 8b
Mic sesión 8bMic sesión 8b
Mic sesión 8b
 

Ähnlich wie Urbisaia y brufman estimacion robusta

Curso de-econometria-basica
Curso de-econometria-basicaCurso de-econometria-basica
Curso de-econometria-basicavestaoriginal
 
teoria_de_errores-ia.ppt
teoria_de_errores-ia.pptteoria_de_errores-ia.ppt
teoria_de_errores-ia.pptAlexis255864
 
Nosferi - Perturbaciones no esfericas en el modelo lineal
Nosferi - Perturbaciones no esfericas en el modelo linealNosferi - Perturbaciones no esfericas en el modelo lineal
Nosferi - Perturbaciones no esfericas en el modelo linealMiguel Jerez
 
Tema2. pronosticos de demanda
Tema2. pronosticos de demandaTema2. pronosticos de demanda
Tema2. pronosticos de demandaingRobertoBriceno
 
Regresion Multiple2
Regresion Multiple2Regresion Multiple2
Regresion Multiple2juancasa2791
 
material de apoyo (2).ppt
material de apoyo (2).pptmaterial de apoyo (2).ppt
material de apoyo (2).pptDronesKR
 
TEMAS DE IO.docx
TEMAS DE IO.docxTEMAS DE IO.docx
TEMAS DE IO.docxcero17
 
Analisis de regresion multiple
Analisis de regresion multipleAnalisis de regresion multiple
Analisis de regresion multipleJhosepAlexFernndez
 
Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011Robinho Navarrete
 
Regresion_lineal_simple.pdf
Regresion_lineal_simple.pdfRegresion_lineal_simple.pdf
Regresion_lineal_simple.pdfLolo Nuan
 
Estocreg - Regresores estocasticos en el modelo lineal
Estocreg - Regresores estocasticos en el modelo linealEstocreg - Regresores estocasticos en el modelo lineal
Estocreg - Regresores estocasticos en el modelo linealMiguel Jerez
 
Inferen - Inferencia en el modelo de regresión
Inferen - Inferencia en el modelo de regresiónInferen - Inferencia en el modelo de regresión
Inferen - Inferencia en el modelo de regresiónMiguel Jerez
 
2-el modelo de regresion lineal-2.ppt
2-el modelo de regresion lineal-2.ppt2-el modelo de regresion lineal-2.ppt
2-el modelo de regresion lineal-2.pptssuserd9e9ec1
 
Tema IV Tecnicas de Pronostico Grupo 6.pptx
Tema IV Tecnicas de Pronostico Grupo 6.pptxTema IV Tecnicas de Pronostico Grupo 6.pptx
Tema IV Tecnicas de Pronostico Grupo 6.pptxosdalysmar
 
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...JOSUEELIASLOPEZHERNA
 

Ähnlich wie Urbisaia y brufman estimacion robusta (20)

Curso de-econometria-basica
Curso de-econometria-basicaCurso de-econometria-basica
Curso de-econometria-basica
 
5. regresión lineal multiple
5.  regresión lineal multiple5.  regresión lineal multiple
5. regresión lineal multiple
 
teoria_de_errores-ia.ppt
teoria_de_errores-ia.pptteoria_de_errores-ia.ppt
teoria_de_errores-ia.ppt
 
TEORIA DE ERRORES.ppt
TEORIA DE ERRORES.pptTEORIA DE ERRORES.ppt
TEORIA DE ERRORES.ppt
 
Nosferi - Perturbaciones no esfericas en el modelo lineal
Nosferi - Perturbaciones no esfericas en el modelo linealNosferi - Perturbaciones no esfericas en el modelo lineal
Nosferi - Perturbaciones no esfericas en el modelo lineal
 
Tema2. pronosticos de demanda
Tema2. pronosticos de demandaTema2. pronosticos de demanda
Tema2. pronosticos de demanda
 
Regresion Multiple2
Regresion Multiple2Regresion Multiple2
Regresion Multiple2
 
material de apoyo (2).ppt
material de apoyo (2).pptmaterial de apoyo (2).ppt
material de apoyo (2).ppt
 
TEMAS DE IO.docx
TEMAS DE IO.docxTEMAS DE IO.docx
TEMAS DE IO.docx
 
Unidad V
Unidad VUnidad V
Unidad V
 
Lab1
Lab1Lab1
Lab1
 
Analisis de regresion multiple
Analisis de regresion multipleAnalisis de regresion multiple
Analisis de regresion multiple
 
Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011
 
Regresion_lineal_simple.pdf
Regresion_lineal_simple.pdfRegresion_lineal_simple.pdf
Regresion_lineal_simple.pdf
 
Estocreg - Regresores estocasticos en el modelo lineal
Estocreg - Regresores estocasticos en el modelo linealEstocreg - Regresores estocasticos en el modelo lineal
Estocreg - Regresores estocasticos en el modelo lineal
 
Inferen - Inferencia en el modelo de regresión
Inferen - Inferencia en el modelo de regresiónInferen - Inferencia en el modelo de regresión
Inferen - Inferencia en el modelo de regresión
 
2-el modelo de regresion lineal-2.ppt
2-el modelo de regresion lineal-2.ppt2-el modelo de regresion lineal-2.ppt
2-el modelo de regresion lineal-2.ppt
 
Tema IV Tecnicas de Pronostico Grupo 6.pptx
Tema IV Tecnicas de Pronostico Grupo 6.pptxTema IV Tecnicas de Pronostico Grupo 6.pptx
Tema IV Tecnicas de Pronostico Grupo 6.pptx
 
Topo
TopoTopo
Topo
 
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
 

Mehr von luis Gonzales Pineda

Ley28411 ley de sistema de presupuesto lectura
Ley28411  ley de sistema de presupuesto lecturaLey28411  ley de sistema de presupuesto lectura
Ley28411 ley de sistema de presupuesto lecturaluis Gonzales Pineda
 
Ley28112 ley marco de la administracion financiera lectura
Ley28112  ley marco de la administracion financiera lecturaLey28112  ley marco de la administracion financiera lectura
Ley28112 ley marco de la administracion financiera lecturaluis Gonzales Pineda
 
Comportamiento economia-peruana-2014-iii
Comportamiento economia-peruana-2014-iiiComportamiento economia-peruana-2014-iii
Comportamiento economia-peruana-2014-iiiluis Gonzales Pineda
 

Mehr von luis Gonzales Pineda (6)

Canal de riego casma
Canal de riego casmaCanal de riego casma
Canal de riego casma
 
Ley28411 ley de sistema de presupuesto lectura
Ley28411  ley de sistema de presupuesto lecturaLey28411  ley de sistema de presupuesto lectura
Ley28411 ley de sistema de presupuesto lectura
 
Ley28112 ley marco de la administracion financiera lectura
Ley28112  ley marco de la administracion financiera lecturaLey28112  ley marco de la administracion financiera lectura
Ley28112 ley marco de la administracion financiera lectura
 
Comportamiento economia-peruana-2014-iii
Comportamiento economia-peruana-2014-iiiComportamiento economia-peruana-2014-iii
Comportamiento economia-peruana-2014-iii
 
Breve manual mathematica
Breve manual mathematicaBreve manual mathematica
Breve manual mathematica
 
Metodologia investigacion
Metodologia investigacion Metodologia investigacion
Metodologia investigacion
 

Urbisaia y brufman estimacion robusta

  • 1. ESTIMACION ROBUSTA HERIBERTO L. URBISAIA y JUANA Z. BRUFMAN (UBA) 1.- GENERALIDADES La robustez de un método de estimación se refiere a su condición para obtener estimaciones insensibles ante posibles violaciones de alguno de los supuestos fijados al especificar un modelo, en particular, el relativo a la distribución admitida para la perturbación aleatoria. Un estimador robusto produce “buenas” estimaciones” (en algún sentido), ante una amplia variedad de posibles procesos generadores de datos. De acuerdo con la formalización habitual en la estadística matemática, se supone que las observaciones del fenómeno en estudio son generadas a partir de un proceso aleatorio, representado por un miembro Fθ de la familia paramétrica F de funciones de distribución: { };Fθ θ ∈ΘF = Se admite que el mecanismo es totalmente conocido salvo el parámetro θ , que debe ser estimado utili- zando un estimador ˆθ , con las propiedades desables conocidas: insesgadez y eficiencia. En general el método de Máxima Verosimilitud (MV) satisface tales requerimientos y en gran parte de las aplicaciones se admite la distribución normal ó gaussiana como modelo teórico de distribución. En el modelo lineal general: i i iy = +ε′x β , con errores normales, independientes e idénticamente distri- buidos, el estimador mínimo cuadrático clásico (MCC) ˆββββ es el más eficiente de los estimadores insesga- dos ( best unbiased estimator). Cuando los errores no están normalmente distribuidos, ˆββββ sigue siendo el más eficiente, pero dentro de una clase más restringida de estimadores, esto es, dentro de la clase de estimadores lineales insesgados (best linear unbiased estimator). Ahora bien; si la distribución de los errores es leptocúrtica, en el sentido de generar frecuentemente erro- res grandes, la linealidad es una condición extremadamente restrictiva: se prueba que los estimadores MCC resultan inferiores a otros estimadores no lineales insesgados, que se denominan estimadores robustos. Es sabido que la distribución subyacente de la perturbación aleatoria no se conoce con certeza; de ahí que el área de la estimación robusta que ha merecido mayor atención, dentro del campo econométrico, se refiere a estimadores que si bien son algo menos eficientes que los MCC cuando los errores se hallan normalmente distribuidos, resultan considerablemente más eficientes que los MCC para errores no normales. Otros desarrollos referentes a la robustez incluyen estimadores que son robustos ante es- pecificaciones alternativas de la matriz de varianza-covarianza de los errores y estimadores que son ro- bustos con respecto a la especificación de la forma funcional; también en la Inferencia Bayesiana la elec- ción de un estimador robusto con respecto a la especificación de la distribución a priori, ha sido tema de interés para los econometristas bayesianos. La robustez de las estimaciones constituye actualmente un tema preocupante entre economistas teóri- cos y aplicados, dada la extrema sensibilidad de algunos procedimientos de estimación ante la no nor- malidad del término de error. 2.- OBSERVACIONES ATÍPICAS. OBSERVACIONES INFLUYENTES. Cuando se analizan datos muestrales es fácil captar visualmente discrepancias respecto a una distribu- ción normal: en datos microeconómicos ó financieros de alta frecuencia, se observan a menudo distri- buciones empíricas con colas más densas que la normal.
  • 2. 2 La falta de normalidad obedece a la presencia de datos anómalos (outliers)1 : puede ocurrir que una pequeña fracción de la muestra, digamos entre el 2% y el 10% aparezca como atípica, debido a errores de medición, alteraciones en la metodología de recolección de datos, etc. Valores extremos en la muestra pueden tener, a priori, una incidencia desproporcionada en las estima- ciones MCC; estos valores se denominan observaciones de efecto palanca, que deberán ser analizados a los efectos de decidir sobre el tratamiento más adecuado al objetivo del modelo. Con frecuencia, la función estimada resulta desplazada en exceso, con el correspondiente aumento de los errores están- dar de las estimaciones. En este caso se habla de valores influyentes y su identificación puede realizar- se corriendo dos regresiones: una con la muestra completa y otra quitando la i -ésima observación. Todo dato cuya eliminación altera marcadamente la estimación MCC se considera observación influyen- te. 2.1.- DETECCION DE OBSERVACIONES INFLUYENTES. La metodología para identificar valores influyentes ha sido formalizada por Belsley, Kuh y Welsch, ( )1980 ; los autores utilizan medidas de diagnóstico que apuntan a cuantificar el impacto de observacio- nes potencialmente influyentes en la estimación MCC del Modelo de Regresión. Sea el Modelo = +y X β εβ εβ εβ ε , con K variables explicativas, a ser estimado con n observaciones. La con- tribución de la observación i -ésima en la estimación ˆββββ se define como: ( ) ( ) 1 ˆ ˆ ˆ 1 i i i DFBETA i h ε − ′ ′ = − = − X X x β ββ ββ ββ β expresión que mide diferencias entre los coeficientes ˆββββ , estimados: i) con la totalidad de la información ; ii) quitando la observación i . En esta expresión i ′x es la fila i -ésima de la matriz X y ( ) 1 i i ih − ′ ′= x X X x mide la influencia a priori de la observación i . 2 Del mismo modo, la expresión ( ) ˆ ˆ ˆ 1 i i i i i h DFFIT y y i h ε = − = − mide diferencias entre valores ajustados ˆy : i) con la totalidad de la información ; ii) quitando la observa- ción i . Dado que estas diferencias dependen de las unidades de medición, es conveniente normalizarlas divi- diendo cada una de ellas por sus correspondientes errores estándar. Las medidas estandarizadas se indican como DFBETAS y DFFITS . Por tanto, si se desea medir el cambio en la estimación del coeficiente kβ , originado por la supresión de la información i , se deben calcular: ( ) ( ) ( ) 1 ˆ ˆ ˆ k k ki kk i DFBETAS i β β σ − − = ′X X ; ( ) ( ) ( )( )1 2 1 2 ˆ ˆ ˆ 1 i i i i i i i h DFFITS i h i h ε σ σ ′ ′ = = − x xβ − ββ − ββ − ββ − β 1 Toda observación que no parece seguir el patrón de agrupamiento de la mayoría de los datos recibe el nombre de observación anómala ó atípica. 2 ih es el i -ésimo elemento diagonal de la matriz de proyección MCC: ( ) 1− ′ ′=H X X X X , denominada Matriz “Hat” ; H es matriz idempotente; por tanto 0 1ih≤ ≤ . Además, la traza de H = K , por lo que 1 n i i h K = =∑ . El tamaño promedio de un elemento diagonal es K n.
  • 3. 3 Como regla práctica ó valor de corte, los autores consideran observaciones influyentes cuando: 2 kiDFBETAS n > ; 1 2 2i K DFFITS n   >     La detección de valores influyentes no implica que deban ser desechados del grueso de la información. A menudo, tales valores pueden ser indicio de cambios estructurales cuyos efectos deben ser detectados a partir de las estimaciones del modelo. Completada la etapa de identificación, efectuadas la correcciones que correspondan, por ejemplo, por fallas en la carga de datos ó errores de medición, se procederá a la búsqueda de estimadores robustos que permiten la inclusión de toda observación influyente considerada por el investigador como informa- ción confiable y valiosa. 3.- ESTIMADORES ROBUSTOS Existen propuestas alternativas para la estimación robusta de medidas de posición y de escala. Una cla- sificación apropiada, efectuada por Huber (1964) es la siguiente: 1.- Estimadores M 2.- Estimadores Lp 3.- Estimadores L 4.- Mínimos Cuadrados Recortados 5.- Estimadores con influencia acotada En lo que sigue ejemplificamos cada uno de los estimadores refiriéndonos al campo econométrico, espe- cíficamente al Modelo de Regresión: 0 1 1 2 2 K...i i i K i i i iy = + x + x + + x = +β β β β ε ε′+ x β Estimadores M: Esta clase de estimadores pueden considerarse como generalización de los de Máxima Verosímil; de ahí la denominación “estimadores- M”. Consisten en minimizar la función suma ponderada de errores absolutos: 1 n i i i i w y = ′−∑ x ββββ utilizando diferentes ponderaciones, según la magnitud del error. 3 . Por ejemplo: i) Fijando todas las ponderaciones iguales, esto es 1iw = , ∀ i ; en este caso el estimador minimiza la suma de errores absolutos; el estimador se denomina “Desviación Absoluta Mínima”: 1 n i i i MAD y = ′= −∑ x ββββ ii) Utilizando un esquema de ponderaciones que dependa de la magnitud del error en términos absolu- tos: si éste es menor a un valor arbitrario b, se lo toma como ponderación; en caso contrario, la ponde- ración se estabiliza en b : ( )i i i i i i i i i iy w y y b w b sgn y b′− = − − <′ ′ = − ≥′x x x xββββ β ββ ββ ββ β ββββ si si iii) Aplicando un esquema similar al anterior, pero con valores iw decrecientes hacia cero si i i by ≥− ′x ββββ ; cuando i iy − ′x ββββ alcance un valor arbitrario d , iw se tomará =0. Esta opción implica desechar observaciones que generen errores absolutos mayores que d . 3 En este sentido, los estimadores MCC utilizan como ponderación la magnitud de cada error absoluto.
  • 4. 4 Estimadores Lp : Resultan de minimizar la función 1 n p i i i y = ′−∑ x ββββ ; es decir, la suma de errores abso- lutos elevados a la potencia .p Si 2,p = estamos ante los Estimadores MCC; si 1,p = el estimador coin- cide con el MAD. Como regla práctica para decidir sobre el valor de p , debe tenerse en cuenta que, cuanto más densas son las colas de la distribución empírica, menor debe ser .p Estimadores L: Son combinaciones lineales de estadísticos de orden muestrales. 4 Así, el estadístico de orden 0.25 ó primer cuartil: ( )0.25Yq , separa la distribución de modo que el 25% de las observaciones son menores que ( )0.25Yq y el 75% mayores que ( )0.25Yq ; la mediana es el se- gundo cuartil ó cuantil de orden 0.50, etc. Se recordará que, dada una variable aleatoria Y , con función de distribución ( ) ( )F y P Y y= ≤ , se define el cuantil de orden τ ( )0 1τ< < , como el menor y que satisface la relación ( )F y τ≥ . Formal- mente: { }( ) inf : ( )q y F yτ τ= ≥ Si se dispone de una muestra aleatoria de tamaño n , la función de distribución empírica tradicional vie- ne dada por: ( ) ( )n i k F y I Y y= ≤∑ donde ( )I z es una función indicativa que toma valor 1 cuando el argumento es cierto y 0 en los demás casos. La correspondiente función empírica de los cuantiles viene dada por la expresión: { }( ) inf : ( )n nq y F yτ τ= ≥ o lo que es lo mismo, considerado como un problema de optimización: ( ) : : 1( ) argmin ( ) min ( ) n i i iY iY n i i q Y Y q arg Y ξ ξ ξ ξ τ ττ τ ξ ξ τ ρ ξ ≥ <    −           = − + − = − ∑ ∑ ∑ donde ( ) ( ( 0))u u I uτρ τ= − < se denomina función de chequeo (check function) que pondera asimétri- camente valores positivos y negativos. Los estimadores L se obtienen combinando linealmente cuantiles de diferente orden; de este modo es posible construir estimadores robustos de una medida de posición. Se han propuesto, por ejemplo, las combinaciones: ( ) ( ) ( )% % %0.30 0.25 + 0.40 0.50 + 0.30 0.75q q q ó bien: ( ) ( ) ( )% % %0.25 0.25 + 0.50 0.50 + 0.25 0.75q q q 4 Las observaciones ordenadas de la muestra aleatoria ( )1 2, ,..., ny y y se indican como: ( ) ( ) ( )1 2 , ,..., n y y y siendo ( ) ( ) ( )1 2 ... n y y y≤ ≤ ≤ . Entonces ( ), 1,2,...,i y i n= , se denomina estadístico de orden i de la muestra.
  • 5. 5 Mínimos Cuadrados Recortados: El método consiste, básicamente en desechar algunas observacio- nes. Por ejemplo, después de calcular los cuantiles 0.05 y 0.95, se descartan observaciones con resi- duos negativos respecto a ( )% 0.05q y positivos respecto a ( )% 0.95q . En total se elimina el 10% de las observaciones; se practica una regresión mínimo- cuadrática con las observaciones remanentes y se obtiene un estimador MCC α -recortado, siendo en este caso 0.10α = . Estimadores con influencia acotada : Estos estimadores se diseñan de modo de limitar la incidencia que una observación anómala pueda tener sobre las estimaciones MCC. Se trata de minimizar la suma ponderada de errores cuadráticos, disminuyendo el peso otorgado a la observación atípica, respecto de las restantes, las que conservan ponderación unitaria. La cota se elige generalmente, admitiendo que la eficiencia del nuevo estimador resulte hasta, por ejemplo, un 5% menor que la correspondiente a los estimadores MCC. 4.- REGRESIÓN POR CUANTILES Ó REGRESIÓN CUANTÍLICA La regresión cuantílica, introducida por Koenker y Bassett en 1978, constituye actualmente una metodo- logía de aplicación corriente en estudios socioeconómicos orientados al análisis de la desigualdad. Ello ha sido posible gracias a la mayor disponibilidad de información microeconómica, unida a su procesa- miento electrónico a través de paquetes informáticos cada vez más sofisticados. En la mayoría de los estudios econométricos se modelan momentos condicionales; al especificar por ejemplo, la relación i i iy = +ε′x β , se estima específicamente la función media condicional de y , con- dicionada a las variables regresoras x . Sin embargo, existe actualmente un interés creciente en méto- dos que permitan apreciar otros aspectos de la distribución de y . En esta dirección la regresión por cuantiles apunta a una descripción más detallada al modelizar, no sólo el valor medio condicional, sino la mediana, cuartiles, percentiles, etc., condicionados a los niveles de las variables regresoras. Si se consideran cuantiles equiespaciados, por ejemplo, cada 5% ó 1% de la población, es posible mode- lizar cada una de las posiciones predeterminada de la distribución de y . Por tanto, la regresión por cuantiles amplifica notablemente el análisis de la distribución de la variable respuesta, condicionada al conjunto de variables regresoras. Un caso importante de la regresión por cuantiles es el estimador “Desviación Absoluta Mínima” (MAD), que corresponde al ajuste de la mediana condicional de la variable respuesta. Retomando el modelo i i iy = +ε′x β , donde iε es el error correspondiente a la observación i , resulta que: i) Mínimos Cuadrados Clásicos minimiza la función objetivo 2 ii ε∑ ii) La regresión por la mediana (estimador MAD) minimiza ii ε∑ iii) La regresión por quintiles considera como función objetivo una suma que pondera asimétricamente los errores absolutos: otorga ponderaciónτ a errores por subestimación y ponderación ( )1 τ− para errores por sobreestimación. 5.- EL MODELO DE REGRESIÓN POR CUANTILES Como ya dijimos, en un análisis clásico de regresión lineal, formalizado mediante el modelo i i iy = +ε′x β , se intenta determinar la incidencia de las variables explicativas i ′x sobre el valor medio condicional de y ; la incidencia resulta cuantificada al obtener las estimaciones ˆββββ . En la regresión por cuantiles, en cambio, se analiza la incidencia de las variables explicativas sobre cada uno de los cuantiles de la distribución de y ; se obtiene entonces un vector de estimaciones por cada cuantil, que simbolizamos como τ %ββββ .
  • 6. 6 GRAFICO I En el grafico adjunto se ha representado para dos valores de 1 2: ,x x x la distribución condicionada de y que supondremos en ambos casos normal pero con distinta media y varianza (ambas crecientes con x ). La recta central representa la recta de regresión mínimo cuadrática, es decir, la esperanza condicional de y dado x , que coincide en este caso con la mediana 0.50Q . Las líneas punteadas son las regresio- nes cuantilicas Qτ para 0.05τ = y 0.95τ = . Como puede observarse, las pendientes dadas por los coeficientes τβ resultan crecientes con τ , lo que muestra la presencia de heterocedasticidad a medida que crece x . Si las rectas punteadas fuesen paralelas, 0.05 0.95β β= estaríamos en el caso homocedástico. La regresión por cuantiles condicionales estándar supone una especificación lineal en las variables re- gresoras x : ( / , )i iQ τ ττ ′=x xβ ββ ββ ββ β siendo τββββ el vector de coeficientes asociado al τ cuantil . La función objetivo del párrafo anterior se modifica de manera que el vector cuantílico τ %ββββ resulta de mi- nimizar, respecto a τββββ , la expresión ( ) ( ) : : 1 i i i i n n i i i i i y x i y x y y τ τ τ τ τ β β τ τ ′ ′≥ <    ′ ′− + − −     ∑ ∑x x ββββ β ββ ββ ββ βmin Obsérvese que se utiliza la notación τββββ , y no ββββ como en el caso de MCC, para destacar que diferentes elecciones de τ generan distintas estimaciones de ββββ . Por otra parte, si τ es 0.90, por ejemplo, la pon- deración asimétrica opera con mayor intensidad para observaciones y ′≥ x ββββ que para observaciones donde y ′< x ββββ La función objetivo no es diferenciable, por lo que se utilizan métodos de programación lineal para la búsqueda de la solución. Regresión Cuantílica (Normal)
  • 7. 7 Desde el momento que este enfoque no requiere supuestos fuertes en lo que respecta a la distribución de los errores se lo considera un método robusto para modelizar esas relaciones. Los autores Koenker y Bassett demuestran además la consistencia y normalidad asintótica. 6.- UNA APLICACIÓN AL CÁLCULO DE ELASTICIDADES DEL GASTO En Urbisaia y Brufman (2005), se estimaron elasticidades del Gasto por Deciles de Ingreso. El trabajo se realizó en el marco del Proyecto UBACyT E036 Programación 2001-2004: “La Reforma Tributaria. Impli- cancias sobre la Distribución del Ingreso y el Bienestar”. Se utilizaron datos de la Encuesta Nacional de Gastos de los Hogares 1996-1997, INDEC, correspon- dientes a la Región Metropolitana del Gran Buenos Aires, (Capital Federal y Conurbano Bonaerense), considerándose diversos rubros que componen el presupuesto familiar: Alimentos, Bebidas Alcohólicas, Indumentaria, Vivienda, Equipamiento del Hogar, Salud, Transporte, Esparcimiento, Educación, Bienes y Servicios varios. El análisis y procesamiento de la base de datos estuvo a cargo del Lic. Luis A. Trajtenberg aplicando el programa STATA 8.0. 6.1.- RELEVANCIA DEL TEMA El conocimiento de las elasticidades resulta fundamental para analizar el comportamiento de la demanda ante variaciones de precios e ingresos. La posibilidad de segmentar los estudios según cuantiles de in- greso permite diferenciar aun más las elasticidades y determinar el rango dentro del cuál los bienes se comportan como necesarios o superfluos; en síntesis, en estos casos tendremos, para un mismo bien, el comportamiento de la demanda según tramos de ingreso. Una de las aplicaciones más interesantes de este instrumental se refiere al estudio de la repercusión de los impuestos al consumo (ejemplo el valor agregado), sobre la demanda y finalmente sobre la recauda- ción fiscal. En efecto; un aumento de impuestos, es visto por el consumidor como un aumento de precios, y por ende, una baja en los consumos. La magnitud de este efecto viene dado por las respectivas elasticida- des. Un incremento de precios vía un aumento de impuesto, tiene un efecto doble sobre las cuentas fiscales: uno positivo y otro negativo. El positivo viene dado por la mayor tasa de impuesto, pero dado que simul- táneamente se da el efecto contrario (negativo) por la baja en los consumos, el resultado final puede ser incierto. En este caso, puede establecerse un nuevo nivel del equilibrio de las variables precio- consumo, según elasticidades. Por tanto, el hecho de poder desagregar la demanda por cuantiles, con sus respectivas elasticidades, nos da el instrumento necesario para analizar en forma cuantitativa el resultado final y el impacto social de este tipo de impuestos. 6.2.- CASOS EMBLEMÁTICOS El comportamiento de las elasticidades dentro de cada grupo tiene que ver con el grado de saciedad (medida en unidades físicas) y rapidez y forma con que se llega a la misma, aún cuando luego puede haber un cambio de calidad, que lleva a una extensión de la misma en términos de valor. A partir de es- tos conceptos, cada grupo de bienes sigue su propia dinámica. Así para algunos bienes, la saciedad física llega mas rápidamente que en otros, por ejemplo alimentos respecto a indumentaria, aunque en valores puede la misma puede ser mas extensa. Debemos tener en cuenta, que las elasticidades se refieren al gasto por tipo de bien, lo que implica el efecto conjunto de la cantidad y la calidad. Es decir que al llegar a estratos superiores del ingreso, las cantidades compradas siguen siendo las mismas o aumentan levemente, pero las calidades pueden au- mentar significativamente el valor, acarreando variaciones más pronunciadas en el gasto. Para el rubro Alimentos, como era de esperar, la proporción dedicada a este gasto disminuye a medida que aumenta el ingreso, proporción que no puede ser alterada significativamente por la calidad; ello im-
  • 8. 8 plica que su valor es más o menos cercano al de saciedad: la elasticidad sufre un aplanamiento más pronunciado a medida que aumentan los deciles. Para Bebidas Alcohólicas y Cigarrillos, en virtud de que se trata de consumos que son más bien vicios, tiene un nivel de saciedad elevado, y por ende, su elasticidad se mantiene constante a través de toda la escala. Un aumento de precios, por aplicación de un impuesto, difícilmente tendrá impacto sobre la de- manda. No obstante en este caso el impuesto tendrá un efecto diferente según se lo aplique a las unida- des consumidas (botellas, atados de cigarrillos) ó al valor de los mismos (unidades x calidad). En los restantes bienes, como transporte, esparcimiento y educación, las elasticidades son notoriamen- te decrecientes, se trata de consumos con alto contenido de servicios. El Cuadro adjunto resume los resultados obtenidos en dicha oportunidad ELASTICIDADES POR DECILES DE INGRESO Decil Aliment. B.Alcoh Cigarril. Indumen Viviend Equip Salud Transp Esparc Educ 1 0.7783 0.9020 0.8199 1.1413 0.8772 1.4721 0.9781 1.7017 1.8846 2.9341 2 0.7627 0.9035 0.8410 1.1277 0.8793 1.4197 0.9766 1.6152 1.7588 2.3438 3 0.7479 0.8940 0.8626 1.1287 0.8860 1.3806 0.9758 1.5608 1.6309 2.5217 4 0.7363 0.8998 0.8410 1.1101 0.8775 1.3968 0.9758 1.4916 1.6017 2.0723 5 0.7251 0.8922 0.8238 1.1081 0.8765 1.3610 0.9711 1.4300 1.5328 2.0145 6 0.7088 0.9013 0.8368 1.1129 0.8819 1.3610 0.9732 1.3987 1.5302 1.7087 7 0.6902 0.8904 0.8346 1.1040 0.8734 1.3152 0.9751 1.4033 1.4566 1.6719 8 0.6670 0.8904 0.8299 1.1101 0.8630 1.3122 0.9756 1.3218 1.4329 1.5981 9 0.6397 0.8792 0.7921 1.1058 0.8541 1.2863 0.9771 1.3070 1.4014 1.4609 10 0.5590 0.8769 0.7205 1.1083 0.8358 1.2149 0.9758 1.2904 1.2773 1.3702 Paralelamente se muestran en los Gráficos que siguen, estimaciones de regresión por cuantiles de las Curvas de Engel del tipo: ln , w G i j j α β= − En las que: , w i j representa la proporción del gasto en el rubro i efectuado por el hogar j y jG el gasto total del hogar. Se consideraron los rubros Alimentos, Bebidas Alcohólicas y Cigarrillos. Por razones de claridad visual, sólo se exiben 0.10Q 0.50Q 0.90Q .
  • 9. 9 GRÁFICO II ProporcióndelGastodestinadoaAlimentos Curva de Engel Regresión Cuantílica Log Ingreso Per Cápita Regresión Cuantílica 10th Regresión Cuantílica 50th Regresión Cuantílica 90th Alimentos Share .733569 8.52231 -.013422 1.20053 ProporcióndelGastodestinadoaCigarrillos Curva de Engel Regresión Cuantílica Log Ingreso Per Cápita Regresión Cuantílica 10th Regresión Cuantílica 50th Regresión Cuantílica 90th Cigarrillo Share .733569 8.52231 -.003002 .2494 ProporcióndelGastodestinadoaAlcohol Curva de Engel Regresión Cuantílica Log Ingreso Per Cápita Regresión Cuantílica 10th Regresión Cuantílica 50th Regresión Cuantílica 90th Alcohol Share 1.02185 8.52231 .000094 .242588 Las regresiones cuantílicas, muestran en la generalidad de los casos, una reducción pronunciada de la heterocedasticidad a medida que aumenta el ingreso. Sin embargo esta reducción no es idéntica para todos los bienes, sino que defiere según el tipo de bien. Respecto a los coeficientes τβ (pendientes) de cada una de las regresiones, se obtuvieron: Alimentos Bebidas Alcohólicas Cigarrillos 0.10 ˆβ -0.0789 -0.0022 -0.0047 0.50 ˆβ -0.1193 -0.0044 -0.1139 0.90 ˆβ -0.1264 -0.0132 -0.0292 Para alimentos, podemos ver una pendiente más pronunciada, en el sentido de que la saciedad opera más rápidamente que para otro tipo de bienes. BIBLIOGRAFÍA Belsley, D.A., E.Kuh and R.E.Welsch [1980]: Regression Diagnostics: Identifying Influential Data and Sources of Collinearity. New York. J.Wiley &Sons. Cameron, A.C. & P.K.Trivedi [2010]: Microeconometrics using Stata. Revised Edition. Texas, USA, Stata Press. Hampel, F: [2001]: Robust Statistics: A Brief Introduction and Overview. Research Report N° 94. Seminar für Statistik. Eidgenössische Technische Hochschule (ETH). Zürich. Switzerland
  • 10. 10 Hansen, L. & T. Sargent [2007]: Robustness. Princeton, N.J. Princeton University Press. Huber, P.J. [1964]: Robust estimation of a location parameter. Annals of Mathematical Statistics. Vol.35; 73-101. Huber, P.J. [1981]: Robust Statistics. New York. Wiley & Sons. Judge, G.G. et al. [1985]: The Theory and Practice of Econometrics. 2 nd . Ed. New York. John Wiley & Sons. Kennedy, P. [2008]: A Guide to Econometrics. Oxford. Blackwell Publishing. Koenker, R. [2005]: Quantile Regression. Cambridge. Cambridge University Press Koenker, R. and K.F.Hallock [2001]: Quantile Regression. Journal of Economic Perspectives. Vol.15; 4; 143-156. Koenker, R. and G.Bassett [1978]: Regression quantiles. Econometrica, 46 (1), 33-50. Sosa Escudero, W. [2005]: Perspectivas y Avances Recientes en Regresión por Cuantiles. En: Progresos en Econometría. Asociación Argentina de Economía Política. Spanos A. [1999]: Probability Theory and Statistical Inference. Econometric Society Monographs. Cambridge .Cambridge University Press. Urbisaia, H. y J.Brufman [2005]: La Reforma Tributaria. Implicancias sobre la Distribución del Ingreso y el Bienestar. Buenos Aires, Ediciones Cooperativas. Paquetes Informáticos: STATA 8.0 y E-VIEWS 7.1