Estadistica e Introducción a la Econometria Curso 2012

Estadística e Introducción a la Econometría
Curso 2012-13
Ejercicios del Tema 8
Soluciones
En todos los ejercicios suponga que se cumplen todos los supuestos del modelo
lineal clásico.
1.- El …chero CEOSAL2 del libro de Wooldridge contiene información sobre
directores generales de empresas americanas. La variable salary es la remuneración
anual en miles de dólares y ceoten es el número de años de antigüedad en el puesto
de director general.
a) Proponga un modelo para el que un aumento de un año el cargo de
director general suponga siempre el mismo aumento porcentual en el salario.
b) Estime el modelo del apartado a y presente los parámetros estimados,
los errores estándar, el número de observaciones y el R2 en una ecuación.
c) Interprete la pendiente de la ecuación estimada.
d) Contraste si un aumento de un año en el cargo de director general
supone un aumento del 1% en el salario del director general. Calcule el p-valor e
interprete el resultado.
Solución:
a) Para que un aumento en un año el cargo de director general suponga
siempre el mismo aumento porcentual en el salario tenemos que considerar un
modelo log-lineal
log(salary) = 0 + 1 coeten + u
b) El modelo estimado es:
\
log(salary)
= 6:505 + 0:00972ceoten
(0:068)
n = 177;
(0:00636)
R2 = 0:013
c) La pendiente de esta ecuación supone que un aumento de 1 año en el
número de años que lleva en la empresa el director general implica, en media, un
aumento del salario del 0:972% (100 0:00972 = 0:972).
d) La hipótesis que tenemos que contrastar es
H0 :
H1 :
1
1
= 0:01
6= 0:01
El estadístico de contraste es
t=
b1
0:01
se(b1 )
t175
1
bajo H0
El valor del estadístico en la muestra es
t=
0:00972 0:01
=
0:00636
0:0440
El p-valor del contraste es P rob(jt175 j > j 0:044j) = 0:96 y por tanto no
podemos rechazar la hipótesis nula a ningún nivel de signi…cación razonable. No
hay evidencia para rechazar que un aumento de un año en el cargo de director
general supone un aumento del 1% en el salario del director general.
2.- Para estudiar la demanda de tabaco en jóvenes adultos se considera el
siguiente modelo
ncaj =
0
+
1 precio
+
2 edad
+
3 renta
+u
donde ncaj es el número de cajetillas de tabaco que consume mensualmente el
individuo, precio es el precio de cada cajetilla medido en dólares, edad es la edad
en años, y renta es la renta anual en miles de dólares.
a) ¿Qué signo esperaría que tuviera 1 ?
b) En base a una muestra de 30 individuos se ha obtenido el siguiente
modelo estimado:
[
n
caj =
11:74
(15:09)
0:53 precio + 0:99 edad + 0:08 renta
(6:38)
(0:18)
(0:04)
b1) Interprete los coe…cientes estimados.
b2) Contraste la signi…catividad individual de cada variable.
c) Considere ahora el modelo
log(ncaj) =
0
+
1
log(precio) +
2 edad
+
3 renta
+u
c1) En base a la misma muestra de 30 individuos se ha obtenido el
siguiente modelo estimado:
\ = 1:17
log(ncaj)
0:69 log(precio) + 0:06 edad + 0:009renta
(1:15)
(0:02)
(0:003)
Interprete los coe…cientes estimados.
c2) Contraste si puede a…rmarse que un aumento de 1000 dólares
en la renta anual, manteniendo constante la edad y el precio de cada cajetilla,
produce un aumento menor del 1% en el consumo de tabaco.
Solución:
a) Cabe esperar que 1 tenga signo negativo ya que un aumento en el
precio del tabaco dará lugar a una disminución en el consumo.
b1) El coe…ciente estimado del precio nos indica que, manteniendo
constante la edad y la renta, un aumento de un dólar en el precio de las cajetillas
disminuye el consumo medio estimado de cigarrillos en poco más de media cajetilla
al mes.
2
El coe…ciente estimado de la edad nos indica que, manteniendo constante el
precio y la renta, un aumento de 1 año en la edad aumenta el consumo medio
estimado de cigarrillos en casi una cajetilla al mes.
El coe…ciente estimado de la renta nos indica que, manteniendo constante el
precio y la edad, un aumento de 1000 dólares en la renta anual aumenta el consumo
medio estimado de cigarrillos en 0.08 cajetillas al mes.
b2) Los t ratios son:
t1 =
0:53
=
6:38
0:083;
0:99
= 5:5;
0:18
t2 =
t3 =
0:08
=2
0:04
Si tomamos como nivel de signi…cación el 5%, el valor crítico para estos
contrastes es t26;0:025 = 2:056
Como jt2 j > 2:056, la variable edad es estadísticamente signi…cativa al 5%;
mientras que como jt1 j 2:056; la variable precio no es estadísticamente signi…cativa
al 5%: En cuanto a la variable renta; como jt3 j
2:056; esta variable no es
estadísticamente signi…cativa al 5%; sin embargo, como el p-valor es P rob(jt26 j >
2) = 0:056; la renta es estadísticamente signi…cativa al 6%:
c1) Como ahora la variable dependiente está en logaritmos la interpretación
de los coe…cientes estimados es distinta que en el apartado b1.
El coe…ciente estimado del precio es una elasticidad y nos indica que, manteniendo
constante la edad y la renta, un aumento de un 1% en el precio de las cajetillas
disminuye el consumo de cigarrillos en un 0:69%.
El coe…ciente estimado de la edad nos indica que, manteniendo constante el
precio y la renta, un aumento de 1 año en la edad aumenta el consumo estimado
de cigarrillos en un 6%.
El coe…ciente estimado de la renta nos indica que, manteniendo constante el
precio y la edad, un aumento de 1000 dólares en la renta anual aumenta el consumo
estimado de cigarrillos en un 0:9%.
c2) Tenemos que contrastar
H0 :
H1 :
El estadístico t es
t=
b
3
3
0:01
se(b )
3
= 0:01
< 0:01
t26 bajo H0
3
0:01
El valor del estadístico de contraste en la muestra es t = 0:009
= 0:33 y
0:003
el p-valor del contraste es P rob(t26 < 0:33) = 0:37: Por tanto no hay evidencia
su…ciente para a…rmar que un aumento de 1000 dólares en la renta anual, manteniendo
constante la edad y el precio, produce un aumento en el consumo de tabaco de
menos del 1%.
3.- El siguiente modelo hace depender el rendimiento de la educación de la
suma de los años de educación del padre y la madre (pareduc)
3
log(wage) =
0
+
1 educ
+
2 pareduc
educ +
3 exper
+
4 tenure
+u
a) Demuestre que el rendimiento de un año más de educación en este
modelo es
100( 1 + 2 pareduc)
¿Qué signo se espera para 2 ? ¿Por qué?
b) Usando los datos del …chero WAGE2 del libro de Wooldridge, la
ecuación estimada es
\
log(wage)
= 5:65 + 0:047educ + 0:00078pareduc educ + 0:019exper + 0:010tenure
(0:13)
(0:010)
(0:00021)
(0:004)
(0:003)
2
R = 0:169
n = 722;
Nótese que solamente 722 observaciones tienen información completa sobre la
educación de los padres. Interprete el coe…ciente del término de interacción. Puede
ser de ayuda elegir dos valores especí…cos para pareduc (por ejemplo, pareduc = 32
si ambos padres tienen formación universitaria y, pareduc = 24 si ambos padres
tienen una educación secundaria) y comparar la estimación del rendimiento de
educ.
c) Cuando añadimos pareduc a la ecuación como variable separada, obtenemos
\
log(wage)
= 4:94 + 0:097educ + 0:033pareduc
(0:38)
(0:027)
(0:017)
0:0016pareduc educ
(0:0012)
+0:020exper + 0:010tenure
(0:004)
n = 722;
(0:003)
R2 = 0:174
¿El rendimiento de la educación depende ahora positivamente de la educación de
los padres? Contraste la hipótesis nula de que el rendimiento de la educación no
depende de la educación de los padres.
Solución:
a) El rendimiento de la educación , manteniendo constante exper; pareduc
y tenure, es
@ log(wage)
= 100( 1 + 2 pareduc)
100
educ
No está claro cuál ha de ser el signo de 2 , aunque si creemos que cuanto mayor
es el nivel de educación de los padres, mayor es el rendimiento de un año adicinal
de educación para los hijos, tendríamos que 2 > 0.
b) Como el rendimiento de la educación depende de los años de educación
de los padres, calculamos el rendimiento para pareduc = 32 y pareduc = 24: Si
pareduc = 32; el rendimiento de la educación, manteniendo constante exper y
tenure, es del 7:2% (100(0:047 + 0:00078 32)) y si pareduc = 24; el rendimiento
de la educación , manteniendo constante exper y tenure, es del 6:6% (100(0:047 +
0:00078 24)). Por tanto la diferencia es de 0:6 puntos porcentuales.
4
c) No, ya que el coe…ciente de la interacción es ahora negativo. El término
de interacción no es estadísticamente signi…cativo ya que el t-ratio es t = 1:33 y
el p-valor es P rob(jt716 j > 1:33) = 0:18: La variable pareduc si es signi…cativa.
Este es un buen ejemplo de que omitir el efecto del nivel (la variable pareduc en
este caso) puede dar lugar a una estimación sesgada del efecto de la interacción.
Siempre que se incluya una interacción entre dos variables, debe incluirse también
las dos variables por separado en el modelo.
4.- La tasa de desecho de una empresa manufacturera es el número de artículos
defectuosos que deben desecharse por cada 100 artículos producidos. Así, una
disminución en la tasa de desecho re‡eja una mayor productividad. Consideremos
el siguiente modelo que utiliza la tasa de desecho (scrap) para medir el efecto de
la formación de los trabajadores sobre la productividad
log(scrap) =
0
+
1 hrsemp
+
2
log(sales) +
3
log(employ) + u
(1)
donde hrsemp son las horas anuales de formación por empleado, sales son las
ventas anuales de la empresa en dólares y employ es el número de empleados de
la empresa.
Utilizando las 43 observaciones para 1987 de la muestra de empresas manufactureras
de Michigan (…chero JTRAIN del libro de Wooldridge) se han obtenido los siguientes
resultados
\
log(scrap)
= 11:74
0:042hrsemp
(4:57)
0:951 log(sales) + 0:992 log(employ)
(0:019)
(0:370)
(0:360)
2
n = 43;
R = 0:310
a) Interprete el coe…ciente estimado de la variable hrsemp y contraste si
puede a…rmarse que una mayor formación disminuye la tasa de deshecho.
b) Contraste la signi…catividad global del modelo.
c) Demuestre que el modelo (1) también puede escribirse como
log(scrap) =
0
+
1 hrsemp
+
2
log(sales=employ) + log(employ) + u
(2)
Interprete la hipótesis H0 : = 0.
d) Utilizando la misma muestra se ha estimado el modelo reparametrizado
(2) y se han obtenido los siguientes resultados:
\
log(scrap)
= 11:74
(4:57)
n = 43;
0:042hrsemp
(0:019)
0:951 log(sales=employ) + 0:041 log(employ)
(0:370)
(0:205)
2
R = 0:310
Si tenemos en cuenta el efecto de las horas anuales de formación por empleado y
las ventas por empleado (en logaritmos) sobre la tasa de deshecho, contraste si
las empresas con más trabajadores tienen una mayor tasa de desecho.
e) Contraste la hipótesis de que, manteniendo constante las horas anuales
de formación por empleado y el número de empleados de la empresa, un incremento
5
de un 1% en el cociente de ventas por empleado está asociado con una disminución
del 1% en la tasa de deshecho.
solución:
a) Puesto que el coe…ciente estimado de hrsemp es 0:042; una hora
adicional de formación por empleado reduce la tasa de desecho en un 4:2%:
El contraste que tenemos que hacer es
H0 :
H1 :
1
1
=0
<0
El estadístico de contraste es
t=
b
1
t39 bajo H0
se(b1 )
0:042
= 2:21, el p-valor del
El valor del estadístico en la muestra es t = 0:019
contraste es P rob(t39 < 2:21) = 0:0165 y por tanto podemos rechazar H0 al
2% y concluimos que una mayor formación disminuye la tasa de desecho.
b) Tenemos que contrastar
H0 :
H1 :
1
1
= 2=
6 0 y/o
=
=0
2 6= 0 y/o
3
3
6= 0
El estadístico de contraste es
F =
(1
R2 =3
R2 ) =(43
3
1)
F3;39 Bajo H0
El valor del estadístico de contraste en la muestra es
F =
0:31=3
= 5:84
(1 0:31) =39
y el p-valor es P rob(F3;39 > 5:84) = 0:0021. Por tanto podemos rechazar H0 al
1% y las variables del modelo son conjuntamente signi…cativas.
c) Si de…nimos = 2 + 3 y sustituimos 3 =
2 en el modelo (1)
tenemos
log(scrap) =
=
=
+
0+
0+
0
1 hrsemp
+
1 hrsemp +
1 hrsemp +
log(sales) + (
2 ) log(employ) + u
2 log(sales) + log(employ)
2 log(employ) + u
2 log(sales=employ) + log(employ) + u
2
La hipótesis = 0 quiere decir que, una vez que controlamos por las horas anuales
de formación por empleado y las ventas por empleado (en logaritmos), un aumento
en el porcentaje de empleados no tiene ningún efecto sobre la tasa de desecho.
6
d) El contraste que tenemos que hacer es
H0 :
H1 :
=0
>0
El estadístico de contraste es
t=
b
t39 bajo H0
se(b)
El valor del estadístico en la muestra es t = 0:041
= 0:2 y el p-valor es
0:205
P rob(t39 > 0:2) = 0:42. Por tanto, no podemos rechazar H0 a ningún nivel de
signi…cación razonable, no hay su…ciente evidencia para a…rmar que, si tenemos en
cuenta el efecto de las horas anuales de formación por empleado y las ventas por
empleado (en logaritmos), las empresas con más trabajadores tienen una mayor
tasa de desecho.
e) Tenemos que contrastar en el modelo (2)
H0 :
H1 :
2
2
=
6
=
1
1
El estadístico de contraste es
t=
b2 + 1
t39 Bajo H0
se(b2 )
= 0:13 y el p-valor
El valor del estadístico en la muestra es t = 0:951+1
0:37
es P rob(jt39 j > 0:13) = 0:897. Por tanto, no podemos rechazar H0 a ningún
nivel de signi…cación razonable, no hay su…ciente evidencia para rechazar que,
manteniendo constante las horas anuales de formación por empleado y el número
de empleados de la empresa, un incremento de un 1% en el cociente de ventas por
empleado está asociado con una disminución del 1% en la tasa de deshecho.
5.- En el ejercicio 3 del tema 2 consideramos el siguiente modelo estimadado
[ = 3638:25
sleep
(112:28)
n = 706;
0:148torwrk
(0:017)
11:13educ + 2:20 age
(5:88)
(1:45)
2
R = 0:113
a) ¿Son educ y age individualmente signi…cativas al 5%?
b) Al eliminar educ y age de la ecuación se obtienen los siguientes resultados:
[ = 3586:38
sleep
(38:91)
0:151torwrk
(0:017)
R2 = 0:103
n = 706;
¿Son educ y age conjuntamente signi…cativas al 5% en la ecuación original?
7
c) El incluir educ y age ¿afecta mucho a la disyuntiva (trade-o¤) estimada
entre dormir y trabajar?
d) Suponga que la varianza de las horas de sueño depende de alguno de
los regresores del modelo, ¿Qué implicación tiene esto sobre los contrastes de los
apartados anteriores?
Solución:
2:2
= 1:89 y t3 = 1:45
= 1:52. El valor crítco
a) Los t-ratios son t2 = 11:13
5:88
es t702;0:025 = 1:96. Como ninguno de los dos t-ratios es mayor en valor absoluto
que el valor crítico, ninguna de las dos variables es estadísticamente signi…cativa
al 5%.
b) Tenemos que contrastar
H0 :
H1 :
2
2
= 3=0
6 0 y/o
=
3
6= 0
Para hacer este contraste tenemos que comparar los R-cuadrado del modelo restringido
y no restringido mediante un estadístico F . El estadístico de contraste es
F =
(1
2
(Rnr
Rr2 ) =2
2 )=(706
Rnr
3
Por tanto
F =
1)
F2;702 bajo H0
(0:113 0:103) =2
= 3:96
(1 0:113)=702
El valor crítico es F2;702:0:05 = 3:01: Puesto que F = 3:96 > F2;702:0:05 = 3:01,
podemos rechazar la nula al 5%, las variables son conjuntamente signi…cativas al
5%.
c) El incluir educ y age no afecta mucho a la disyuntiva (trade-o¤)
estimada entre dormir y trabajar ya que, al incluirlas, el parámetro estimado
pasa de 0:151 a 0:148.
d) Los estadísticos de contraste t y F se basan en la hipótesis de homoscedasticidad.
Si la varianza de la variable dependiente depende de alguno de los regresores del
modelo, los estádisticos que hemos utilizado en los apartados anteriores no son
válidos.
6.- Considere el siguiente modelo para el precio de la vivienda
log(price) =
0
+
1 sqrf t
+
2 bdrms
+u
donde price es el precio de la vivienda en miles de dólares, sqrf t es la super…cie de
la vivienda en pies cuadrados (1 pie cuadrado es 0:093 m2 ), y bdrms es el número
de dormitorios.
a) Utilice los datos del …chero HPRICE1 del libro de Wooldridge para
estimar el modelo y presente los resultados de la forma habitual.
8
b) ¿Cuál es el cambio porcentual estimado en el precio de una vivienda,
de un incremento de 150 pies cuadrados en su super…cie, si mantenemos constante
el número de habitaciones?
c) Obtenga un intervalo de con…anza al 95% para el cambio porcentual
estimado en el precio de una vivienda de un incremento de 150 pies cuadrados en
su super…cie, si mantenemos constante el número de habitaciones.
d) ¿Cuál es el cambio porcentual estimado en los precios si se añade un
dormitorio adicional de 150 pies cuadrados?
e) Obtenga un intervalo de con…anza al 95% para el cambio porcentual
estimado en los precios si se añade un dormitorio adicional de 150 pies cuadrados.
Solución:
a) El modelo estimado es
\
log(price)
=
4:77 + 0:00038sqrf t + 0:029 bdrms
(0:097)
(0:000043)
(0:0296)
2
n = 88;
R = 0:588
b) Si mantenemos …jo el número de habitaciones, un incremento de 150
pies cuadrados en su super…cie supone un incremento estimado en el precio de la
vivienda del 5:7% (100 0:00038 150 = 5:7).
c) Tenemos que obtener un intervalo de con…anza al 95% para 100 150
1 = 15000 1 : Puesto que t85;0:025 = 1:99; el intervalo de con…anza es
[15000(0:00038
= [4:42; 6:98]
1:99 0:000043); 15000(0:00038 + 1:99 0:000043)]
d) Un incremento de un dormitorio de 150 pies cuadrados supone un
incremento estimado en el precio de la vivienda del 8:6% (100 (0:00038 150 +
0:029) = 8:6):
e) Para obtener el intervalo de con…anza tenemos que reparametrizar el
modelo. Sea
= 150 1 + 2
tenemos que
2
=
150
1
y substituyendo en el modelo tenemos que
log(price) =
=
=
+
0+
0+
1 sqrf t
+(
150 1 )bdrms + u
150 1 bdrms + u
1 sqrf t + bdrms
150bdrms) + bdrms + u
1 (sqrf t
0
El modelo estimado es
\
log(price)
=
4:77 + 0:00038(sqrf t
(0:097)
n = 88;
(0:000043)
2
R = 0:588
9
150bdrms) + 0:0858bdrms
(0:0268)
y el intervalo de con…anza es
[100(0:0858
[3:25; 13:91]
1:99 0:0268); 100(0:0858 + 1:99 0:0268)]
7.- Consideremos un modelo en el que el rendimiento de la educación depende
de la experiencia laboral (y viceversa):
log(wage) =
0
+
1 educ
+
2 exper
+
3 educ
exper + u
donde wage es el salario mensual en cientos de dólares, educ son los años de
educación del individuo, exper son los años de experiencia laboral.
a) Demuestre que el rendimiento de un año adicional de educación, manteniendo
exper constante, es
100( 1 + 3 exper)
b) Especi…que la hipótesis nula de que el rendimiento de la educación no
depende del nivel de exper. ¿Cuál es la hipótesis alternativa adecuada?
c) Utilice los datos del …chero WAGE2 del libro de Wooldridge para
contrastar la hipótesis nula del apartado b frente a la alternativa propuesta.
d) Obtenga un intervalo de con…anza al 95% para el rendimiento de la
educación cuando exper = 10:
Solución:
a) El rendimiento de un año adicional de educación, manteniendo exper
constante, es
@ log(wage)
= 100( 1 + 3 exper)
100
educ
b) La hipótesis nula es 3 = 0: Si creemos que hay una interacción
positiva entre educación y experiencia, en el sentido de que el efecto de los años
de educación sobre el salario aumenta con la experiencia, la hipótesis alternativa
apropiada es 3 > 0:
c) El modelo estimado es
\
log(wage)
= 5:94 + 0:044educ
(0:017)
n = 935;
0:021exper + 0:0032educexper
(0:020)
(0:0015)
2
R = 0:135
El valor del estadístico de contraste en la muestra es t = 2:095 y el p-valor es
1
0:0365 = 0:01825, y por tanto podemos rechazar H0 al 2%.
2
d) De…nimos = 1 + 10 3 ; y substituyendo 1 =
10 3 en el modelo
tenemos que
log(wage) =
=
+(
10 3 ) educ + 2 exper + 3 educ exper + u
10) + u
0 + educ + 2 exper + 3 educ(exper
0
10
El modelo estimado es:
\
log(wage)
= 5:94 + 0:076 educ
0:021exper + 0:0032educ(exper
(0:0066)
n = 935;
(0:020)
(0:0015)
10)
R2 = 0:135
y puesto que t931;0:025 = 1:96; el intervalo de con…anza al 95% para el rendimiento
de la educación cuando exper = 10 es
[100(0:076
= [6:3; 8:9]
1:96 0:0066); 100(0:076 + 1:96 0:0066)]
8.- Utilice los datos del …chero GPA2 del libro de Wooldridge para este
ejercicio.
a) Estime el modelo
sat =
0
+
1 hsize
+
2 hsize
2
+ u;
donde hsize es el número de alumnos en la promoción de bachillerato (en centenares)
y sat es el resultado de un test, y presente los resultados de la forma habitual.
b) Contraste la hipótesis nula de que el resultado del test depende linealmente
del tamaño de la promoción de bachillerato frente a una alternativa bilateral.
c) Usando la ecuación estimada en a, ¿cuál sería el tamaño óptimo de la
clase? Justi…que la respuesta.
d) Calcule el tamaño óptimo usando ahora log(sat) como variable dependiente
¿Es parecido al obtenido en el apartado c?
Solución:
a) Los resultados de la estimación son:
c = 998:0 + 19:81hsize
sat
(6:20)
(3:99)
n = 4137;
2:13 hsize2
(0:549)
R2 = 0:0077
b) Tenemos que contrastar
H0 :
H1 :
2
2
=0
6= 0
El valor del estadístico t en la muestra es 3:881 y el p-valor es 0:0001: Por tanto
podemos rechazar la hipótesis nula de que la relación es lineal.
c) El efecto marginal de hsize sobre sat es
@sat
= 1 + 2 2 hsize
@hsize
El tamaño óptimo se alcanza cuando 1 + 2 2 hsize = 0; es decir cuando hsize =
1
: En base a los resultados del apartado a se estima que el tamaño óptimo
2
2
11
= 4:65; como la variable hsize esta medida en cientos de alumnos. el
es 219:81
2:13
tamaño óptimo estimado es 465 alumnos.
d) Usando ahora log(sat) como variable dependiente, tenemos que
\ =
log(sat)
6:90 + 0:0196hsize
(0:0062)
(0:0040)
0:0021 hsize2
(0:00054)
R2 = 0:0078
n = 4137;
= 467
En base a estos resultados se estima que el tamaño óptimo es 100 20:0196
0:0021
alumnos; casi el mismo número que el que obtuvimos en el apartado anteror.
9.- El siguiente modelo puede servir para estudiar si los gastos de campaña
afectan a los resultados electorales:
voteA =
0
+
1
log(expendA) +
2
log(expendB) +
3 prtystrA
+u
donde voteA es el porcentaje de votos del candidato A, expendA y expendB son
los gastos de campaña de los candidatos A y B; y prtystrA es una medida de la
fuerza del partido del candidato A:
a) ¿Cuál es la interpretación de 1 ?
b) Especi…que, en términos de los parámetros del modelo, la hipótesis de
que el efecto sobre el porcentaje de votos del candidato A de un incremento de
un 1% en los gastos de campaña de A se ve compensado por un incremento de un
1% en los gastos de campaña de B:
c) Estime el modelo utilizando los datos del …chero VOTE1 del libro de
Wooldridge sobre los resultados electorales en 173 contiendas electorales entre dos
partidos para las elecciones a la cámara de representantes de Estados Unidos en
1988 y presente los resultados en la forma habitual.
d) ¿Cómo afectan los gastos de campaña del candidato A a sus resultados
electorales? ¿y los gastos de campaña de B?.
e) Contraste la hipótesis del apartado b frente a una alternativa bilateral
utilizando un estadístico t.
f) Escriba el modelo restringido imponiendo la restricción del apartado
b. Estime dicho modelo y utilice un estadístico F para contrastar de nuevo la
hipótesis del apartado b. ¿Qué relación hay entre el estadístico t del apartado e
y el estadístico F que acaba de calcular?.
Solución:
a) Manteniendo todos los demás factores …jos un aumento de un 1%
en los gastos de la campaña electoral supone un incremento de 0:01 1 puntos
porcentuales en el porcentaje de votos del candidato A: Nótese que como la
variable de gasto en la campaña electoral está en logaritmos, un incremento de un
1% en esta variable es aproximadamente equivalente a un incremento de 0:01 en
log(expendA):
b) La hipótesis en términos de los parámetros de modelo es
H0 :
1
+
12
2
=0
c) El modelo estimado es
\ = 45:1 + 6:08 log(expendA)
voteA
6:62 log(expendB) + 0:152prtystrA;
(0:382)
(0:379)
(0:062)
2
n = 173;
R = 0:7925
d) Un aumento de 10% en los gastos de campaña del candidato A,
manteniendo constante los gastos de campaña del candidato B y la fuerza del
partido del candidato A; supone un incremento en el porcentaje de votos del
candidato A de 0:608 puntos porcentuales.
Un aumento de 10% en los gastos de campaña del candidato B, manteniendo
constante los gastos de campaña del candidato A y la fuerza del partido del
candidato A; supone una disminución en el porcentaje de votos del candidato
A de 0:662 puntos porcentuales.
e) Para contrastar esta hipótesis tenemos que reparametrizar el modelo.
Sea = 1 + 2 ; entonces 2 =
1 y substituyendo en el modelo tenemos
voteA =
=
+
0+
0
log(expendA) + (
1 ) log(expendB) + 3 prtystrA + u
log(expendB)) + log(expendB) + 3 prtystrA + u
1 (log(expendA)
1
Si de…nimos d log(exp) = log(expendA) log(expendB); el modelo reparametrizado
es
voteA = 0 + 1 d log(exp) + log(expendB) + 3 prtystrA + u
y la hipótesis es que tenemos que contrastar es ahora H0 : = 0:
Estimamos el modelo reparametrizado obteniendo los siguientes resultados
\ = 45:1 + 6:08 d log(exp)
voteA
(0:382)
n = 173;
0:534 log(expendB) + 0:152prtystrA;
(0:533)
(0:062)
2
R = 0:7925
El estadístico t es
t=
b
se(b)
t169 bajo H0
0:534
El valor del estadístico de contraste en la muestra es t = 0:533
= 1:002 y
el p-valor del contraste bilateral aparece en la tabla es 0:3180: Por tanto, no
podemos rechazar la hipótesis nula a ningún nivel de signi…cación razonable,
no hay su…ciente evidencia para rechazar la hipótesis de que el efecto sobre el
porcentaje de votos del candidato A de un incremento de un 1% en los gastos de
campaña de A se ve compensado por un incremento de un 1% en los gastos de
campaña de B:
f) El modelo restringido es
voteA =
0
+
1 d log(exp)
13
+
3 prtystrA
+u
El estadístico F es
F =
(SCRr SCRnr ) =1
SCRnr =(173 3 1)
F1;169 bajo H0
Utilizando los resultados de la estimación del modelo restringido y no restringido
vemos que SCRnr = 10055:08 y SCRr = 10114:76; y por tanto
F =
(10114:76 10055:08)
= 1:003
10055:08=169
Podemos calcular el p-valor del contraste P rob(F1;169 > 1:003) = 0:318 y vemos
que coincide con el p-valor que obteníamos utilizando el estadístico t. Los dos
contrastes son equivalentes y la relación entre los estadísticos de contraste es que
F = t2 .
10.- Considere el siguiente modelo para los salarios
log(wage) =
0
+
1 educ
+
2 f educ
+
3 meduc
+
4 exper
+u
(3)
donde wage son los ingresos mensuales en dólares, educ son los años de educación,
f educ son los años de educación del padre, meduc son los años de educación de
la madre y exper los años de experiencia laboral.
a) Estime el modelo utilizando los datos del …chero WAGE2 del libro de
Wooldridge y presente los resultados en forma de ecuación.
b) Interprete el coe…ciente estimado de f educ y contraste si esta variable
es signi…cativa.
c) Interprete el coe…ciente estimado de meduc y contraste si esta variable
es signi…cativa.
d) Contraste la hipótesis de que, teniendo en cuenta el nivel de educación
y la experiencia laboral, ni los años de educación del padre ni los de la madre
in‡uyen en el salario de los hijos. Compare este resultado con los resultados que
ha obtenido en los apartados b) y c).
e) Contraste frente a una alternativa bilateral si, una vez que hemos tenido
en cuenta el nivel de educación y la experiencia laboral, los años de educación del
padre y la madre tienen el mismo efecto sobre el salario de los hijos.
Solución:
a) Los resultados de la estimación son:
\
log(wage)
= 5:397 + 0:0654educ + 0:0115f educ + 0:0117meduc + 0:0234exper
(0:0078)
n = 722;
(0:0056)
(0:0063)
(0:0038)
2
R = 0:158
b) El coe…ciente estimado de f educ indica que, manteniendo …jos los
años de educación, la experiencia laboral y los años de educación de la madre, un
aumento de un año en los años de educación del padre supone un aumento de un
14
1:15% en el salario del hijo. Puesto que el p-valor del contraste de signifcatividad
para esa variable es 0:038 la variable es signi…cativa al 4%:
c) El coe…ciente estimado de meduc indica que, manteniendo …jos los años
de educación, la experiencia laboral y los años de educación del padre, un aumento
de un año en los años de educación de la madre supone un aumento de un 1:17%
en el salario del hijo. Puesto que el p-valor del contraste de signifcatividad para
esa variable es 0:064 la variable es signi…cativa al 7%:
d) Tenemos que contrastar
H0 :
H1 :
2
2
= 3=0
6 0 o 3 6= 0
=
Para hacer este contraste tenemos que imponer estas dos restricciones, estimar el
modelo restringido y comparar las sumas cuadráticas del modelo restringido y no
restringido mediante un estadístico F . El modelo restringido es
log(wage) =
0
+
1 educ
+
4 exper
+u
El estadístico de contraste es
F =
(SCRr SCRnr ) =2
SCRnr =(722 4 1)
F2;717 bajo H0
donde SCRnr es la suma cuadrática residual del modelo no restringido y SCRr
es la suma cuadrática residual del modelo restringido. Utilizando los resultados
de la estimación del modelo no restringido y del modelo restringido tenemos que
SCRnr = 106:781997 y SCRr = 109:073975; y por tanto
F =
(109:073975 106:781997) =2
= 7:69
106:781997=717
El p-valor del contraste es P rob(F2;717 > 7:69) = 0:00049 y podemos rechazar la
hipótesis nula a cualquier nivel de signi…cación razonable: Nótese que el p-valor
de este contraste es mucho más pequeño que los p-valores de los contrastes de
signi…catividad individual de las dos variables utilizados en los apartados anteriores.
El motivo es que los años de educación del padre y la madre están fuertemente
correlacionados y por tanto los errores estándar de los coe…cientes estimados de
estas dos variables son relativamente grandes.
e) Tenemos que contrastar
H0 :
H1 :
2
2
=
6=
3
3
para eso tenemos que reparametrizar el modelo.
sustituimos 2 = + 3 en el modelo (3)
log(wage) =
=
=
+
0+
0+
0
1 educ
De…nimos
=
2
3
+ 2 f educ + 3 meduc + 4 exper + u
1 educ + ( + 3 ) f educ + 3 meduc + 4 exper + u
1 educ + f educ + 3 (f educ + meduc) + 4 exper + u
15
y
De…niendo peduc = f educ + meduc; el modelo reparametrizado que tenemos que
estimar es:
log(wage) =
0
+
1 educ
+ f educ +
3 peduc
+
4 exper
+u
y la hipótesis que tenemos que contrastar es
H0 :
H1 :
=0
6= 0
Utilizando los resultados de la estimación vemos que el p-valor del contraste
es 0:98 y por tanto no podemos rechazar la hipótesis nula a ningún nivel de
signi…cación razonable. Concluimos que una vez que hemos tenido en cuenta el
nivel de educación y la experiencia laboral, los años de educación del padre y la
madre tienen el mismo efecto sobre el salario de los hijos.
16