Download Report

Econometrı́a I
Tema 3: Modelo múltiple: estimación
Guı́a de respuestas para algunos ejercicios
1.
a. El guión de comandos de Gretl:
Output del guión de comandos:
1
b. Gretl output:
Como observamos en los resultados de la estimación utilizando matrices coincide
con la estimación para los menús. Podemos guardar los residuos con la opción
del menú del output: Save → Residuals
c.
û1 = y1 − βˆ0 − βˆ1 x11 − βˆ2 x12 = 2 − 5, 37 − 0, 74 · (−1) + 1, 68 · 2 = 0, 74.
El valor del residuo coincide con lo que obtendrı́amos utilizando el guión de Gretl.
d.
P5
ûi = 0, 74+0−1, 105+1, 47−1, 105 = 0. También, como tenemos los residuos
5
X
guardados, podemos utilizar el guión de Gretl para comprobar que
ûi = 0
i=1
i=1
escribiendo en el guión el comando: scalars = sum(uhat). Vemos que
2. Consideramos el siguiente modelo:
M odelo(1)
ln(pricei ) = β0 + β1 ln(noxi ) + β2 roomsi + ui
donde price – precio medio de la vivienda en una zona expresado en dólares, nox –
nivel de contaminación medido por la presencia de óxido nitroso, rooms – número de
habitaciones que tienen en promedio las viviendas de la zona.
a. Esperamos que el signo para β1 sea negativo: la contaminación se refleje negativamente en el precio de una casa. Ası́ que esperemos una elasticidad negativa del
precio respecto a la contaminación.
El parámetro β2 es una semielasticidad. Esperamos que β2 sea positivo, ya que
esperamos que tener una habitación adicional estará asociado a tener un precio
más alto en promedio.
b. Después de importar los datos hprice2.xls desde Gretl, hemos de crear los logarı́tmos
de las variables price y nox. Después escribimos el guión de comandos de Gretl:
2
Gretl guión output:
c. Gretl output:
Como vemos, la estimación definiendo las matrices apropiadas o utilizando los
menús de Gretl coinciden.
d. Regresión ajustada:
\ i ) = 9, 2337 − 0, 7176 · ln(noxi ) + 0, 3059 · roomsi
ln(price
R2 = 0, 514
e. Consideramos que una casa A tiene una habitación adicional en comparación a
una casa B, pero las dos estan en la misma zona. Entonces:
\ A ) = 9, 2337 − 0, 7176 · ln(noxA ) + 0, 3059 · (roomsB + 1)
ln(price
\ B ) = 9, 2337 − 0, 7176 · ln(noxB ) + 0, 3059 · (roomsB )
ln(price
\ A ) − ln(price
\ B ) = 0, 3059
ln(price
\ = 0, 3059
∆lnprice
3
Una casa como la A serı́a, en media, 30,59 % más cara que una casa como la B.
f. Dado que la variable dependiente y el regresor estan en logarı́tmos, podemos
interpretar el coeficientes como una elasticidad. Ası́, de acuerdo con nuestras
estimaciones, un 1% más contaminación estará asociado a un precio un 0.718%
más bajo, controlando por el número de habitaciones.
g. Para poder interpretar la estimación de β1 como el efecto causal de la contaminación sobre los precios de las casas, los cambios en la contaminación se han de
realizar bajo condiciones ceteris paribus. Es decir, la contaminación no se ha de
correlacionar con la perturbación. En otras palabras, cuando la contaminación
varı́a, nada más relevante no observado se ha de mover de forma sistemática.
E(u|ln(nox), rooms) = 0
Pensad, que una variable que se incloye en u podrı́a ser el ingreso medio de la
zona en la que se encuentra la casa. Áreas con ingresos más bajoos tienden a
bajar los precios de las casas. Pero, también, se podrı́a pensar que las activitades
contaminantes tienden a situar-se en zonas de ingresos más bajos. En este caso,
ln(nox) se correlacionarı́a con la perturbación, u negativamente. Las condiciones
ceteris paribus no se cumplirı́an.
4.
a. Gretl output:
b. Guión de comandos:
Output:
4
Nota: A pesar de que no era una parte de la pregunta, podemos ver que este
guión de comandos hace todos los cálculos siguientes:


1 1 0
1 3 −1


1 4 0 


1 5 1 

X=
1 7 −1


1 8 0 


1 10 −1
1 10 2
 
10
25
 
32
 
43

y=
58
 
62
 
67
71
Entonces:
βb = (X 0 X)−1 X 0 y

−1 

8 48 0
368
= 48 364 5 2710
0
5 8
35



0, 62 −0, 08
0, 05
368
= −0, 08 0, 01 −0, 008 2710
0, 05 −0, 008 0, 13
35


6, 47
= 6, 59
0, 26
u
b = y − yb = y − X β̂
  

10
1 1 0
25 1 3 −1

  
32 1 4 0  

  
 6, 47
43 1 5 1 
 


= 
58 − 1 7 −1 6, 59
  
 0, 26
62 1 8 0 
  

67 1 10 −1
71
1 10 2

  
 
−3, 06
10
13, 06
25 25, 98 −0, 98
  
 

32 32, 82 −0, 82
  
 

43 39, 67  3, 33 






=  −
 =  5, 67 
58
52,
33
  
 

62 59, 18  2, 82 
  
 

67 72, 10 −5, 10
71
72, 87
−1, 87
Ası́, la estimación de la varianza de las perturbaciones es:
σ̂ 2 =
SRC
û0 û
91, 65
=
=
= 18, 33
n−K
8−3
5
5
La matriz de varianzas estimadas de β̂ es:
b = σ
vd
ar(β)
b2 (X 0 X)−1


0, 62 −0, 08
0, 05
= 18, 33 · −0, 08 0, 01 −0, 008
0, 05 −0, 008 0, 13


11, 34 −1, 51 0, 94
= −1, 51 0, 25 −0, 16
0, 94 −0, 16 2, 39
La varianza estimada de βb0 , βb1 y βb2 es:
Vd
ar(βb0 ) = 11, 34
Vd
ar(βb1 ) = 0, 25
Vd
ar(βb2 ) = 2, 39
Consecuentemente,
ee(βb0 ) =
p
11, 34 = 3, 67
ee(βb1 ) =
p
0, 25 = 0, 5
ee(βb2 ) =
c. El modelo ajustado es:
ybi = 6, 47 + 6, 59·xi1 + 0, 26·xi2
(3,37)
5.
(0,5)
R2 = 0, 97
(1,55)
a. Utilizando menús de Gretl hacemos la siguiente estimación:
b. El guión de comandos de Gretl:
6
p
2, 39 = 1, 55
c. El guión de comandos output:
Como vemos los resultados de la estimación en forma matricial y utilizando Gretl
menús coinciden.
7.
a. Para un modelo con K = 3, SRC asociada a la estimació de este modelo es:
Min
n
X
βe0 ,βe1 ,βe2 i=1
ũ2i
=
n
X
(yi − β̃0 − β̃1 xi1 − β˜2 xi2 )2
,
i=1
y las ecuaciones normales vienen dadas por:
−2
n
X
(yi − β̂0 − β̂1 xi1 − β̂2 xi2 ) = 0
(1)
xi1 (yi − β̂0 − β̂1 xi1 − β̂2 xi2 ) = 0
(2)
xi2 (yi − β̂0 − β̂1 xi1 − β̂2 xi2 ) = 0
(3)
i=1
−2
−2
n
X
i=1
n
X
i=1
Vamos a reorganizar estas ecuaciones un poco:
n
X
yi = β̂0 + β̂1 xi1 + β̂2 xi2
(1)
yi xi1 = β̂0 xi1 + β̂1 x2i1 + β̂2 xi2 xi1
(2)
yi xi2 = β̂0 xi2 + β̂1 xi1 xi2 + β̂2 x2i2
(3)
i=1
n
X
i=1
n
X
i=1
7
Si xi2 = 2xi1 , podemos substituir xi2 p0r xi1 en las ecuaciones 1, 2 y 3. Obtenemos:
n
X
yi = β̂0 + β̂1 xi1 + 2β̂2 xi1
(1’)
yi xi1 = β̂0 xi1 + β̂1 x2i1 + 2β̂2 x2i1
(2’)
yi xi1 = 2β̂0 xi1 + 2β̂1 x2i1 + 4β̂2 x2i1
(3’)
i=1
n
X
i=1
2
n
X
i=1
Podemos ver que las ecuaciones 2’ y 3’ son las mismas. Ası́, tenemos sólo dos
ecuaciones relevantes y tres incógnitas: β̂0 , β̂1 y β̂2 . El sistema es indeterminado,
tiene infinitas soluciones. Por tanto, no se puede obtener una solución única para
β̂0 , β̂1 y β̂2 .
b. Fijémonos que si xi3 = 2xi2 , entonces la matriz X tiene dos columnas en combinación lineal perfecta.


 
1 x11 2 · x11
1 x11 x12
1 x21 x22  1 x21 2 · x21 


 
X =  .. ..
.. 
..  =  .. ..
. .
. 
.  . .
1 xn1 2 · xn1
1 xn1 xn2
Esta caracterı́stica se traspasa a la matriz X 0 X, haciendo que dos columnas y
dos filas guarden también una relación lineal perfecta.

Pn
n
i=1
xi1
2·
Pn
i=1
xi1



 Pn
Pn 2 
Pn 2
2 · i=1 xi1 
XX=
i=1 xi1
i=1 xi1




Pn 2
Pn 2
Pn
2 · i=1 xi1 2 · i=1 xi1 4 · i=1 xi1
0
Ası́, esta matriz no tendrá rango completo. Es una matriz singular.
det(X 0 X) = 0
⇐⇒
rang(X 0 X) < 3
Dado que X 0 X no tiene rango completo,
@(X 0 X)−1
⇒ @β̂
c. Bajo colinealidad perfecta, como es este caso, la muestra no permite estimar los
parámetros asociados a los regresores colineales de forma única. Su estimación es
indeterminada. Existen infinitas estimaciones por M CO de los parámetros β1 y
8
β2 que minimizan la SRC. V ar(βb1 /x) y V ar(βb2 /x) es infinita. Fijémonos que
otra forma de verlo es que:
V ar(βb1 |x) = σ 2 ·
1
1
1
1
·
= σ2 ·
·
=∞
2
ST C1 1 − R1
ST C1 1 − 1
(4)
Dado R12 , que es el coeficiente de determinación de la regresión auxiliar xi1 =
α0 + α1 xi2 + ui .
8.
a. El output de esta estimación es:
b.
\ i = 116, 974 − 0, 4634cigsi + 0, 093 f aminci
bwght
(1,04898)
(0,0915)
R2 = 0, 0298
(0,0292)
c. Bajo el supuesto de que podemos interpretar los parámetros en términos de causalidad, el signo de la estimación obtenida de β1 es el esperado si creemos que un
aumento del consumo de tabaco durante el embarazo tiende a perjudicar la salud
de la madre y por tanto el peso del recién nacido. Bajo el mismo supuesto, el
signo de la estimación obtenida de β2 es el esperado si creemos que un mejor nivel
de renta tiende a beneficiar la dieta de la madre y consecuentemente, el peso del
nacido.
El coeficiente de determinación es 0,0298. Es decir, sólo cerca de un 3% de la
variabilidad observada en el peso de los nacidos en esta muestra se puede explicar
por diferencias en el consumo de cigarrillos de sus madres y de las diferencias en
su renta.
d. Los regresores cigs y f aminc podrı́an estar correlacionados positivamente si consideramos que al aumentar el nivel de renta de la famı́lia, el consumo de tabaco
sube linealmente. Podrı́an estar correlacionados negativamente si consideramos
que el tabac es un bien inferior. Por otro lado, si consideramos que son variables
independientes, que no guardan ninguna relación, entonces su correlación serı́a
cero.
e. Necesitamos estimar la regresión auxiliar:
cigsi = α1 + α2 f aminci + vi
9
Ası́:
F IV2 =
1
= 1, 031
1 − 0.029945
f. Para analizar la correlación dentro de una muestra entre dos variables podemos
utilizar el coeficiente de correlación muestral. En este caso, utilizamos Gretl:
Parece presentar una correlación negativa, pero baja.
g. Utilizando la opción del menú de Gretl:
Fijémonos que tanto F IV1 como F IV2 son muy cercanos a 1, que es el valor
mı́nimo que puede tomar este estadı́stico. Ası́ no parece que la colinealidad sea
un problema en este caso.
h. Gretl output asociado a la estimación del M odelo(2):
Podemos ver que la estimación de β1 casi no ha variado en relación a la obtenida
estimando el M odelo(1), cosa que indica que la correlación presente en la muestra
entre el regresor incluido, cigs, y el excluido, f aminc, es baja.
10
i. Definimos R2 (1) y R2 (2) como el coeficiente de determinación asociado a la estimación del M odelo(1) y M odelo(2) respectivamente:
SRC(1)
ST C(1)
SRC(2)
R2 (2) ≡ 1 −
ST C(2)
R2 (1) ≡ 1 −
Dado que los dos modelos tienen la misma variable dependiente y se estiman con
la misma muestra, ST C(1) = ST C(2). Ası́:
SRC(1)
ST C
SRC(2)
R2 (2) ≡ 1 −
ST C
Fijémonos que el M odelo(2) es una versión restringida del M odelo(1). Es decir,
el M odelo(2) es un caso especial del M odelo(1) cuando imponemos que β2 = 0,
ası́, al estimar el segundo modelo por MCO es equivalente a decir que estamos
estimando el primer modelo bajo la restricción β2 = 0, haciendo que:
R2 (1) ≡ 1 −
SRC(1) ≤ SRC(2)
→
R2 (1) ≥ R2 (2)
Es, por lo tanto, fácil ver que en general, el coeficiente de determinación baja
cuando sacamos regresores de un determinado modelo.
9.
a. Ahora, f aminc∗ = f aminc·1000. Por tanto, la estimación del coeficiente asociado
a los ingresos familiares del M odelo(1)∗ , β̂2∗ , es la del M odelo(1), β̂2 , dividida por
1.000: β̂2∗ = β̂2 /1000. Empleando algebra matricial podemos mostrar que si
β̂ = (X 0 X)−1 X 0 Y y β̂ ∗ = ((1000 · X)0 · (1000 · X))−1 · (1000 · X)0 · Y
entonces
β̂ ∗ =
1000
(X 0 X)−1 X 0 Y
10002
=
1
(X 0 X)−1 X 0 Y
1000
=
1
β̂.
1000
b. El coeficiente de determinación no cambia porque la variabilidad de los regresores
no se ve afectada por un cambio en las unitades de medida de estos regresores.
c. Llamando faminc* en Gretl como “faminc dol” estimamos por MCO el M odelo(1)∗ :
Por tanto, comprobamos que β̂2∗ = β̂2 /1000 = 0, 0927/1000 = 0, 0000927.
10. Vamos a estimar el siguiente modelo:
educi = β0 + β1 sibsi + β2 meduci + β3 f educi + ui
donde educi =años de educación de una persona i, sibsi =número de hermanos de la
persona i, meduci =número de años de educación de la madre y f educi =número de
años de educación del padre.
11
a. Gretl output para la estimación:
b. Recta ajustada de regresión:
[i = 10, 364 − 0, 094 · sibsi + 0, 131 · meduci + 0, 210 · f educi
educ
(0,359)
(0,034)
(0,033)
R2 = 0, 214
(0,027)
c. El signo positivo de la educacion de los padres sobre los hijos es el esperado. De
hecho, la educación de los niños depende mucho de la educación de sus padres.
Los padres con más educación tienden a hijos con más educación. La relación
con el número de hermanos no es tan clara. Por un lado, cuantos más hermanos
menos recursos pueden destinar los padres (tanto en tiempo como en dinero) y
podrı́a afectar negativamente al nivel de educación de una persona. Desde el otro
lado, tener hermanos puede tener un efecto positivo si consideramos que los hermanos enseñan los unos a los otros. El primer efecto parece prevalecer en nuestra
muestra.
La bondad de ajuste es 21,4%, parece baja, indicando otros factores que no tenemos en cuenta, pero son importantes en la determinación de la educación.
d. La educación de la madre y el padre podrı́an estar correlacionadas si hay aparejamiento selectivo. El número de hermanos también se podrı́a correlacionar con
la educación de los padres y madres.
e. Utilizando menús de Gretl, calculamos factores de inflación de varianza asociados
a cada regresor:
En nuestro modelo los valores de F IV s estan entre 1 y 1,5, lo que significa que
no hay multicolinealidad en el modelo. Tenemos la sospecha de multicolinealidad
cuando F IV > 10.
12
f. Ahora calcularemos F IVsibs nosotros mismos:
(a) En primer lugar, se estima la regresión auxiliar para sibs:
sibsi = α0 + α1 · meduci + α2 · f educi + ui
(b) Ahora calculamos:
F IVsibs =
1
1
= 1, 099
=
2
1−R
1 − 0, 09
Este valor coincide con el valor que tenemos en la parte anterior de la estimación con menús de Gretl.
11. Vamos a estimar el siguiente modelo:
M odelo(1)
lnSi = β0 + β1 · edi + β2 · exi + ui
Donde lnSi =el logarı́tmo natural de los salarios de una persona i, edi =años de educación, exi =años de experiencia en el mercado laboral.
a. Gretl output de la estimación:
Recta ajustada analı́tica:
di = 4, 666 + 0, 0932 · edi + 0, 0407 · exi
lnS
(0,0638)
(0,0036)
R2 = 0, 1813
(0,0023)
Los signos son los esperados, ambos, educación y experiencia se relacionan positivamente con el salario. La bondad de ajuste es 18,13%, siendo baixa.
13
b. Un año adicional de educación se espera que esté asociado a un salario un 9,3%
más alto:
d ≈ βb1 · ∆ed = 0, 093 · 1 = 0, 093(9, 3%)
∆lnS
c. Un año adicional de experiencia se espera que aumente el salario en 4,1% :
d ≈ βb2 · ∆ex = 0, 041 · 1 = 0, 041(4, 1%)
∆lnS
d. La diferencia entre los M odelo(1) y M odelo(2) se encuentra en los supuestos de
como la experiencia se relaciona con el salario. En el M odelo(1) se supone que
el efecto marginal de la experiencia sobre los salarios (en forma de tasa) es constante, mientras que en el M odelo(2) el efecto marginal de la experiencia sobre
los salarios varı́a dependiendo del nivel de experiencia.
e. El output para la estimación del M odelo(2):
Recta ajustada de regresión:
di = 4, 469 + 0, 0932 · edi + 0, 0898 · exi − 0, 0025 · ex2
lnS
i
(0,0687)
(0,0036)
(0,0071)
R2 = 0, 1958
(0,0004)
f. El efecto marginal de la experiencia sobre los salarios (com una tasa), para un
nivel dado de educación, se puede estimar:
d
∂ lnS
= βb2 + 2 · βb3 · ex
∂ex
Por tanto, el efecto marginal depende de la experiencia. Dado que β̂3 < 0, podemos ver que el efecto marginal de la experiencia sobre los salarios disminuye con
la experiencia:
Años de experiencia
ex=0
ex=1
ex=2
...
ex=10
Efecto marginal
0, 0898(8, 98%)
0, 0898 − 0, 0025 · 1 = 0, 0873(8, 73%)
0, 0898 − 0, 0025 · 2 = 0, 0848(8, 48%)
...
0, 0898 − 0, 0025 · 10 = 0, 0406(4, 06%)
14