Document

Econometrı́a I
Tema 3: Modelo múltiple: estimación
Guı́a de respuestas para algunos ejercicios
1.
a. El guión de comandos de Gretl:
Output del guión de comandos:
1
b. Gretl output:
Como observamos en los resultados de la estimación utilizando matrices coincide
con la estimación para los menús. Podemos guardar los residuos con la opción
del menú del output: Save → Residuals
c.
û1 = y1 − βˆ0 − βˆ1 x11 − βˆ2 x12 = 2 − 5, 37 − 0, 74 · (−1) + 1, 68 · 2 = 0, 74.
El valor del residuo coincide con lo que obtendrı́amos utilizando el guión de Gretl.
d.
P5
ûi = 0, 74+0−1, 105+1, 47−1, 105 = 0. También, como tenemos los residuos
5
X
guardados, podemos utilizar el guión de Gretl para comprobar que
ûi = 0
i=1
i=1
escribiendo en el guión el comando: scalars = sum(uhat). Vemos que
2. Consideramos el siguiente modelo:
M odelo(1)
ln(pricei ) = β0 + β1 ln(noxi ) + β2 roomsi + ui
donde price – precio medio de la vivienda en una zona expresado en dólares, nox –
nivel de contaminación medido por la presencia de óxido nitroso, rooms – número de
habitaciones que tienen en promedio las viviendas de la zona.
a. Esperamos que el signo para β1 sea negativo: la contaminación se refleje negativamente en el precio de una casa. Ası́ que esperemos una elasticidad negativa del
precio respecto a la contaminación.
El parámetro β2 es una semielasticidad. Esperamos que β2 sea positivo, ya que
esperamos que tener una habitación adicional estará asociado a tener un precio
más alto en promedio.
b. Después de importar los datos hprice2.xls desde Gretl, hemos de crear los logarı́tmos
de las variables price y nox. Después escribimos el guión de comandos de Gretl:
2
Gretl guión output:
c. Gretl output:
Como vemos, la estimación definiendo las matrices apropiadas o utilizando los
menús de Gretl coinciden.
d. Regresión ajustada:
\ i ) = 9, 2337 − 0, 7176 · ln(noxi ) + 0, 3059 · roomsi
ln(price
R2 = 0, 514
e. Consideramos que una casa A tiene una habitación adicional en comparación a
una casa B, pero las dos estan en la misma zona. Entonces:
\ A ) = 9, 2337 − 0, 7176 · ln(noxA ) + 0, 3059 · (roomsB + 1)
ln(price
\ B ) = 9, 2337 − 0, 7176 · ln(noxB ) + 0, 3059 · (roomsB )
ln(price
\ A ) − ln(price
\ B ) = 0, 3059
ln(price
\ = 0, 3059
∆lnprice
3
Una casa como la A serı́a, en media, 30,59 % más cara que una casa como la B.
f. Dado que la variable dependiente y el regresor estan en logarı́tmos, podemos
interpretar el coeficientes como una elasticidad. Ası́, de acuerdo con nuestras
estimaciones, un 1% más contaminación estará asociado a un precio un 0.718%
más bajo, controlando por el número de habitaciones.
g. Para poder interpretar la estimación de β1 como el efecto causal de la contaminación sobre los precios de las casas, los cambios en la contaminación se han de
realizar bajo condiciones ceteris paribus. Es decir, la contaminación no se ha de
correlacionar con la perturbación. En otras palabras, cuando la contaminación
varı́a, nada más relevante no observado se ha de mover de forma sistemática.
E(u|ln(nox), rooms) = 0
Pensad, que una variable que se incloye en u podrı́a ser el ingreso medio de la
zona en la que se encuentra la casa. Áreas con ingresos más bajoos tienden a
bajar los precios de las casas. Pero, también, se podrı́a pensar que las activitades
contaminantes tienden a situar-se en zonas de ingresos más bajos. En este caso,
ln(nox) se correlacionarı́a con la perturbación, u negativamente. Las condiciones
ceteris paribus no se cumplirı́an.
4.
a. Gretl output:
b. Guión de comandos:
Output:
4
Nota: A pesar de que no era una parte de la pregunta, podemos ver que este
guión de comandos hace todos los cálculos siguientes:


1 1 0
1 3 −1


1 4 0 


1 5 1 

X=
1 7 −1


1 8 0 


1 10 −1
1 10 2
 
10
25
 
32
 
43

y=
58
 
62
 
67
71
Entonces:
βb = (X 0 X)−1 X 0 y

−1 

8 48 0
368
= 48 364 5 2710
0
5 8
35



0, 62 −0, 08
0, 05
368
= −0, 08 0, 01 −0, 008 2710
0, 05 −0, 008 0, 13
35


6, 47
= 6, 59
0, 26
u
b = y − yb = y − X β̂
  

10
1 1 0
25 1 3 −1

  
32 1 4 0  

  
 6, 47
43 1 5 1 
 


= 
58 − 1 7 −1 6, 59
  
 0, 26
62 1 8 0 
  

67 1 10 −1
71
1 10 2

  
 
−3, 06
10
13, 06
25 25, 98 −0, 98
  
 

32 32, 82 −0, 82
  
 

43 39, 67  3, 33 






=  −
 =  5, 67 
58
52,
33
  
 

62 59, 18  2, 82 
  
 

67 72, 10 −5, 10
71
72, 87
−1, 87
Ası́, la estimación de la varianza de las perturbaciones es:
σ̂ 2 =
SRC
û0 û
91, 65
=
=
= 18, 33
n−K
8−3
5
5
La matriz de varianzas estimadas de β̂ es:
b = σ
vd
ar(β)
b2 (X 0 X)−1


0, 62 −0, 08
0, 05
= 18, 33 · −0, 08 0, 01 −0, 008
0, 05 −0, 008 0, 13


11, 34 −1, 51 0, 94
= −1, 51 0, 25 −0, 16
0, 94 −0, 16 2, 39
La varianza estimada de βb0 , βb1 y βb2 es:
Vd
ar(βb0 ) = 11, 34
Vd
ar(βb1 ) = 0, 25
Vd
ar(βb2 ) = 2, 39
Consecuentemente,
ee(βb0 ) =
p
11, 34 = 3, 67
ee(βb1 ) =
p
0, 25 = 0, 5
ee(βb2 ) =
c. El modelo ajustado es:
ybi = 6, 47 + 6, 59·xi1 + 0, 26·xi2
(3,37)
5.
(0,5)
R2 = 0, 97
(1,55)
a. Utilizando menús de Gretl hacemos la siguiente estimación:
b. El guión de comandos de Gretl:
6
p
2, 39 = 1, 55
c. El guión de comandos output:
Como vemos los resultados de la estimación en forma matricial y utilizando Gretl
menús coinciden.
7.
a. Para un modelo con K = 3, SRC asociada a la estimació de este modelo es:
Min
n
X
βe0 ,βe1 ,βe2 i=1
ũ2i
=
n
X
(yi − β̃0 − β̃1 xi1 − β˜2 xi2 )2
,
i=1
y las ecuaciones normales vienen dadas por:
−2
n
X
(yi − β̂0 − β̂1 xi1 − β̂2 xi2 ) = 0
(1)
xi1 (yi − β̂0 − β̂1 xi1 − β̂2 xi2 ) = 0
(2)
xi2 (yi − β̂0 − β̂1 xi1 − β̂2 xi2 ) = 0
(3)
i=1
−2
−2
n
X
i=1
n
X
i=1
Vamos a reorganizar estas ecuaciones un poco:
n
X
yi = β̂0 + β̂1 xi1 + β̂2 xi2
(1)
yi xi1 = β̂0 xi1 + β̂1 x2i1 + β̂2 xi2 xi1
(2)
yi xi2 = β̂0 xi2 + β̂1 xi1 xi2 + β̂2 x2i2
(3)
i=1
n
X
i=1
n
X
i=1
7
Si xi2 = 2xi1 , podemos substituir xi2 p0r xi1 en las ecuaciones 1, 2 y 3. Obtenemos:
n
X
yi = β̂0 + β̂1 xi1 + 2β̂2 xi1
(1’)
yi xi1 = β̂0 xi1 + β̂1 x2i1 + 2β̂2 x2i1
(2’)
yi xi1 = 2β̂0 xi1 + 2β̂1 x2i1 + 4β̂2 x2i1
(3’)
i=1
n
X
i=1
2
n
X
i=1
Podemos ver que las ecuaciones 2’ y 3’ son las mismas. Ası́, tenemos sólo dos
ecuaciones relevantes y tres incógnitas: β̂0 , β̂1 y β̂2 . El sistema es indeterminado,
tiene infinitas soluciones. Por tanto, no se puede obtener una solución única para
β̂0 , β̂1 y β̂2 .
b. Fijémonos que si xi3 = 2xi2 , entonces la matriz X tiene dos columnas en combinación lineal perfecta.


 
1 x11 2 · x11
1 x11 x12
1 x21 x22  1 x21 2 · x21 


 
X =  .. ..
.. 
..  =  .. ..
. .
. 
.  . .
1 xn1 2 · xn1
1 xn1 xn2
Esta caracterı́stica se traspasa a la matriz X 0 X, haciendo que dos columnas y
dos filas guarden también una relación lineal perfecta.

Pn
n
i=1
xi1
2·
Pn
i=1
xi1



 Pn
Pn 2 
Pn 2
2 · i=1 xi1 
XX=
i=1 xi1
i=1 xi1




Pn 2
Pn 2
Pn
2 · i=1 xi1 2 · i=1 xi1 4 · i=1 xi1
0
Ası́, esta matriz no tendrá rango completo. Es una matriz singular.
det(X 0 X) = 0
⇐⇒
rang(X 0 X) < 3
Dado que X 0 X no tiene rango completo,
@(X 0 X)−1
⇒ @β̂
c. Bajo colinealidad perfecta, como es este caso, la muestra no permite estimar los
parámetros asociados a los regresores colineales de forma única. Su estimación es
indeterminada. Existen infinitas estimaciones por M CO de los parámetros β1 y
8
β2 que minimizan la SRC. V ar(βb1 /x) y V ar(βb2 /x) es infinita. Fijémonos que
otra forma de verlo es que:
V ar(βb1 |x) = σ 2 ·
1
1
1
1
·
= σ2 ·
·
=∞
2
ST C1 1 − R1
ST C1 1 − 1
(4)
Dado R12 , que es el coeficiente de determinación de la regresión auxiliar xi1 =
α0 + α1 xi2 + ui .
8.
a. El output de esta estimación es:
b.
\ i = 116, 974 − 0, 4634cigsi + 0, 093 f aminci
bwght
(1,04898)
(0,0915)
R2 = 0, 0298
(0,0292)
c. Bajo el supuesto de que podemos interpretar los parámetros en términos de causalidad, el signo de la estimación obtenida de β1 es el esperado si creemos que un
aumento del consumo de tabaco durante el embarazo tiende a perjudicar la salud
de la madre y por tanto el peso del recién nacido. Bajo el mismo supuesto, el
signo de la estimación obtenida de β2 es el esperado si creemos que un mejor nivel
de renta tiende a beneficiar la dieta de la madre y consecuentemente, el peso del
nacido.
El coeficiente de determinación es 0,0298. Es decir, sólo cerca de un 3% de la
variabilidad observada en el peso de los nacidos en esta muestra se puede explicar
por diferencias en el consumo de cigarrillos de sus madres y de las diferencias en
su renta.
d. Los regresores cigs y f aminc podrı́an estar correlacionados positivamente si consideramos que al aumentar el nivel de renta de la famı́lia, el consumo de tabaco
sube linealmente. Podrı́an estar correlacionados negativamente si consideramos
que el tabac es un bien inferior. Por otro lado, si consideramos que son variables
independientes, que no guardan ninguna relación, entonces su correlación serı́a
cero.
e. Necesitamos estimar la regresión auxiliar:
cigsi = α1 + α2 f aminci + vi
9
Ası́:
F IV2 =
1
= 1, 031
1 − 0.029945
f. Para analizar la correlación dentro de una muestra entre dos variables podemos
utilizar el coeficiente de correlación muestral. En este caso, utilizamos Gretl:
Parece presentar una correlación negativa, pero baja.
g. Utilizando la opción del menú de Gretl:
Fijémonos que tanto F IV1 como F IV2 son muy cercanos a 1, que es el valor
mı́nimo que puede tomar este estadı́stico. Ası́ no parece que la colinealidad sea
un problema en este caso.
h. Gretl output asociado a la estimación del M odelo(2):
Podemos ver que la estimación de β1 casi no ha variado en relación a la obtenida
estimando el M odelo(1), cosa que indica que la correlación presente en la muestra
entre el regresor incluido, cigs, y el excluido, f aminc, es baja.
10
i. Definimos R2 (1) y R2 (2) como el coeficiente de determinación asociado a la estimación del M odelo(1) y M odelo(2) respectivamente:
SRC(1)
ST C(1)
SRC(2)
R2 (2) ≡ 1 −
ST C(2)
R2 (1) ≡ 1 −
Dado que los dos modelos tienen la misma variable dependiente y se estiman con
la misma muestra, ST C(1) = ST C(2). Ası́:
SRC(1)
ST C
SRC(2)
R2 (2) ≡ 1 −
ST C
Fijémonos que el M odelo(2) es una versión restringida del M odelo(1). Es decir,
el M odelo(2) es un caso especial del M odelo(1) cuando imponemos que β2 = 0,
ası́, al estimar el segundo modelo por MCO es equivalente a decir que estamos
estimando el primer modelo bajo la restricción β2 = 0, haciendo que:
R2 (1) ≡ 1 −
SRC(1) ≤ SRC(2)
→
R2 (1) ≥ R2 (2)
Es, por lo tanto, fácil ver que en general, el coeficiente de determinación baja
cuando sacamos regresores de un determinado modelo.
9.
a. Ahora, f aminc∗ = f aminc·1000. Por tanto, la estimación del coeficiente asociado
a los ingresos familiares del M odelo(1)∗ , β̂2∗ , es la del M odelo(1), β̂2 , dividida por
1.000: β̂2∗ = β̂2 /1000. Empleando algebra matricial podemos mostrar que si
β̂ = (X 0 X)−1 X 0 Y y β̂ ∗ = ((1000 · X)0 · (1000 · X))−1 · (1000 · X)0 · Y
entonces
β̂ ∗ =
1000
(X 0 X)−1 X 0 Y
10002
=
1
(X 0 X)−1 X 0 Y
1000
=
1
β̂.
1000
b. El coeficiente de determinación no cambia porque la variabilidad de los regresores
no se ve afectada por un cambio en las unitades de medida de estos regresores.
c. Llamando faminc* en Gretl como “faminc dol” estimamos por MCO el M odelo(1)∗ :
Por tanto, comprobamos que β̂2∗ = β̂2 /1000 = 0, 0927/1000 = 0, 0000927.
10. Vamos a estimar el siguiente modelo:
educi = β0 + β1 sibsi + β2 meduci + β3 f educi + ui
donde educi =años de educación de una persona i, sibsi =número de hermanos de la
persona i, meduci =número de años de educación de la madre y f educi =número de
años de educación del padre.
11
a. Gretl output para la estimación:
b. Recta ajustada de regresión:
[i = 10, 364 − 0, 094 · sibsi + 0, 131 · meduci + 0, 210 · f educi
educ
(0,359)
(0,034)
(0,033)
R2 = 0, 214
(0,027)
c. El signo positivo de la educacion de los padres sobre los hijos es el esperado. De
hecho, la educación de los niños depende mucho de la educación de sus padres.
Los padres con más educación tienden a hijos con más educación. La relación
con el número de hermanos no es tan clara. Por un lado, cuantos más hermanos
menos recursos pueden destinar los padres (tanto en tiempo como en dinero) y
podrı́a afectar negativamente al nivel de educación de una persona. Desde el otro
lado, tener hermanos puede tener un efecto positivo si consideramos que los hermanos enseñan los unos a los otros. El primer efecto parece prevalecer en nuestra
muestra.
La bondad de ajuste es 21,4%, parece baja, indicando otros factores que no tenemos en cuenta, pero son importantes en la determinación de la educación.
d. La educación de la madre y el padre podrı́an estar correlacionadas si hay aparejamiento selectivo. El número de hermanos también se podrı́a correlacionar con
la educación de los padres y madres.
e. Utilizando menús de Gretl, calculamos factores de inflación de varianza asociados
a cada regresor:
En nuestro modelo los valores de F IV s estan entre 1 y 1,5, lo que significa que
no hay multicolinealidad en el modelo. Tenemos la sospecha de multicolinealidad
cuando F IV > 10.
12
f. Ahora calcularemos F IVsibs nosotros mismos:
(a) En primer lugar, se estima la regresión auxiliar para sibs:
sibsi = α0 + α1 · meduci + α2 · f educi + ui
(b) Ahora calculamos:
F IVsibs =
1
1
= 1, 099
=
2
1−R
1 − 0, 09
Este valor coincide con el valor que tenemos en la parte anterior de la estimación con menús de Gretl.
11. Vamos a estimar el siguiente modelo:
M odelo(1)
lnSi = β0 + β1 · edi + β2 · exi + ui
Donde lnSi =el logarı́tmo natural de los salarios de una persona i, edi =años de educación, exi =años de experiencia en el mercado laboral.
a. Gretl output de la estimación:
Recta ajustada analı́tica:
di = 4, 666 + 0, 0932 · edi + 0, 0407 · exi
lnS
(0,0638)
(0,0036)
R2 = 0, 1813
(0,0023)
Los signos son los esperados, ambos, educación y experiencia se relacionan positivamente con el salario. La bondad de ajuste es 18,13%, siendo baixa.
13
b. Un año adicional de educación se espera que esté asociado a un salario un 9,3%
más alto:
d ≈ βb1 · ∆ed = 0, 093 · 1 = 0, 093(9, 3%)
∆lnS
c. Un año adicional de experiencia se espera que aumente el salario en 4,1% :
d ≈ βb2 · ∆ex = 0, 041 · 1 = 0, 041(4, 1%)
∆lnS
d. La diferencia entre los M odelo(1) y M odelo(2) se encuentra en los supuestos de
como la experiencia se relaciona con el salario. En el M odelo(1) se supone que
el efecto marginal de la experiencia sobre los salarios (en forma de tasa) es constante, mientras que en el M odelo(2) el efecto marginal de la experiencia sobre
los salarios varı́a dependiendo del nivel de experiencia.
e. El output para la estimación del M odelo(2):
Recta ajustada de regresión:
di = 4, 469 + 0, 0932 · edi + 0, 0898 · exi − 0, 0025 · ex2
lnS
i
(0,0687)
(0,0036)
(0,0071)
R2 = 0, 1958
(0,0004)
f. El efecto marginal de la experiencia sobre los salarios (com una tasa), para un
nivel dado de educación, se puede estimar:
d
∂ lnS
= βb2 + 2 · βb3 · ex
∂ex
Por tanto, el efecto marginal depende de la experiencia. Dado que β̂3 < 0, podemos ver que el efecto marginal de la experiencia sobre los salarios disminuye con
la experiencia:
Años de experiencia
ex=0
ex=1
ex=2
...
ex=10
Efecto marginal
0, 0898(8, 98%)
0, 0898 − 0, 0025 · 1 = 0, 0873(8, 73%)
0, 0898 − 0, 0025 · 2 = 0, 0848(8, 48%)
...
0, 0898 − 0, 0025 · 10 = 0, 0406(4, 06%)
14