Estadística e Introducción a la Econometría Curso 2012-13 Ejercicios del Tema 8 Soluciones En todos los ejercicios suponga que se cumplen todos los supuestos del modelo lineal clásico. 1.- El …chero CEOSAL2 del libro de Wooldridge contiene información sobre directores generales de empresas americanas. La variable salary es la remuneración anual en miles de dólares y ceoten es el número de años de antigüedad en el puesto de director general. a) Proponga un modelo para el que un aumento de un año el cargo de director general suponga siempre el mismo aumento porcentual en el salario. b) Estime el modelo del apartado a y presente los parámetros estimados, los errores estándar, el número de observaciones y el R2 en una ecuación. c) Interprete la pendiente de la ecuación estimada. d) Contraste si un aumento de un año en el cargo de director general supone un aumento del 1% en el salario del director general. Calcule el p-valor e interprete el resultado. Solución: a) Para que un aumento en un año el cargo de director general suponga siempre el mismo aumento porcentual en el salario tenemos que considerar un modelo log-lineal log(salary) = 0 + 1 coeten + u b) El modelo estimado es: \ log(salary) = 6:505 + 0:00972ceoten (0:068) n = 177; (0:00636) R2 = 0:013 c) La pendiente de esta ecuación supone que un aumento de 1 año en el número de años que lleva en la empresa el director general implica, en media, un aumento del salario del 0:972% (100 0:00972 = 0:972). d) La hipótesis que tenemos que contrastar es H0 : H1 : 1 1 = 0:01 6= 0:01 El estadístico de contraste es t= b1 0:01 se(b1 ) t175 1 bajo H0 El valor del estadístico en la muestra es t= 0:00972 0:01 = 0:00636 0:0440 El p-valor del contraste es P rob(jt175 j > j 0:044j) = 0:96 y por tanto no podemos rechazar la hipótesis nula a ningún nivel de signi…cación razonable. No hay evidencia para rechazar que un aumento de un año en el cargo de director general supone un aumento del 1% en el salario del director general. 2.- Para estudiar la demanda de tabaco en jóvenes adultos se considera el siguiente modelo ncaj = 0 + 1 precio + 2 edad + 3 renta +u donde ncaj es el número de cajetillas de tabaco que consume mensualmente el individuo, precio es el precio de cada cajetilla medido en dólares, edad es la edad en años, y renta es la renta anual en miles de dólares. a) ¿Qué signo esperaría que tuviera 1 ? b) En base a una muestra de 30 individuos se ha obtenido el siguiente modelo estimado: [ n caj = 11:74 (15:09) 0:53 precio + 0:99 edad + 0:08 renta (6:38) (0:18) (0:04) b1) Interprete los coe…cientes estimados. b2) Contraste la signi…catividad individual de cada variable. c) Considere ahora el modelo log(ncaj) = 0 + 1 log(precio) + 2 edad + 3 renta +u c1) En base a la misma muestra de 30 individuos se ha obtenido el siguiente modelo estimado: \ = 1:17 log(ncaj) 0:69 log(precio) + 0:06 edad + 0:009renta (1:15) (0:02) (0:003) Interprete los coe…cientes estimados. c2) Contraste si puede a…rmarse que un aumento de 1000 dólares en la renta anual, manteniendo constante la edad y el precio de cada cajetilla, produce un aumento menor del 1% en el consumo de tabaco. Solución: a) Cabe esperar que 1 tenga signo negativo ya que un aumento en el precio del tabaco dará lugar a una disminución en el consumo. b1) El coe…ciente estimado del precio nos indica que, manteniendo constante la edad y la renta, un aumento de un dólar en el precio de las cajetillas disminuye el consumo medio estimado de cigarrillos en poco más de media cajetilla al mes. 2 El coe…ciente estimado de la edad nos indica que, manteniendo constante el precio y la renta, un aumento de 1 año en la edad aumenta el consumo medio estimado de cigarrillos en casi una cajetilla al mes. El coe…ciente estimado de la renta nos indica que, manteniendo constante el precio y la edad, un aumento de 1000 dólares en la renta anual aumenta el consumo medio estimado de cigarrillos en 0.08 cajetillas al mes. b2) Los t ratios son: t1 = 0:53 = 6:38 0:083; 0:99 = 5:5; 0:18 t2 = t3 = 0:08 =2 0:04 Si tomamos como nivel de signi…cación el 5%, el valor crítico para estos contrastes es t26;0:025 = 2:056 Como jt2 j > 2:056, la variable edad es estadísticamente signi…cativa al 5%; mientras que como jt1 j 2:056; la variable precio no es estadísticamente signi…cativa al 5%: En cuanto a la variable renta; como jt3 j 2:056; esta variable no es estadísticamente signi…cativa al 5%; sin embargo, como el p-valor es P rob(jt26 j > 2) = 0:056; la renta es estadísticamente signi…cativa al 6%: c1) Como ahora la variable dependiente está en logaritmos la interpretación de los coe…cientes estimados es distinta que en el apartado b1. El coe…ciente estimado del precio es una elasticidad y nos indica que, manteniendo constante la edad y la renta, un aumento de un 1% en el precio de las cajetillas disminuye el consumo de cigarrillos en un 0:69%. El coe…ciente estimado de la edad nos indica que, manteniendo constante el precio y la renta, un aumento de 1 año en la edad aumenta el consumo estimado de cigarrillos en un 6%. El coe…ciente estimado de la renta nos indica que, manteniendo constante el precio y la edad, un aumento de 1000 dólares en la renta anual aumenta el consumo estimado de cigarrillos en un 0:9%. c2) Tenemos que contrastar H0 : H1 : El estadístico t es t= b 3 3 0:01 se(b ) 3 = 0:01 < 0:01 t26 bajo H0 3 0:01 El valor del estadístico de contraste en la muestra es t = 0:009 = 0:33 y 0:003 el p-valor del contraste es P rob(t26 < 0:33) = 0:37: Por tanto no hay evidencia su…ciente para a…rmar que un aumento de 1000 dólares en la renta anual, manteniendo constante la edad y el precio, produce un aumento en el consumo de tabaco de menos del 1%. 3.- El siguiente modelo hace depender el rendimiento de la educación de la suma de los años de educación del padre y la madre (pareduc) 3 log(wage) = 0 + 1 educ + 2 pareduc educ + 3 exper + 4 tenure +u a) Demuestre que el rendimiento de un año más de educación en este modelo es 100( 1 + 2 pareduc) ¿Qué signo se espera para 2 ? ¿Por qué? b) Usando los datos del …chero WAGE2 del libro de Wooldridge, la ecuación estimada es \ log(wage) = 5:65 + 0:047educ + 0:00078pareduc educ + 0:019exper + 0:010tenure (0:13) (0:010) (0:00021) (0:004) (0:003) 2 R = 0:169 n = 722; Nótese que solamente 722 observaciones tienen información completa sobre la educación de los padres. Interprete el coe…ciente del término de interacción. Puede ser de ayuda elegir dos valores especí…cos para pareduc (por ejemplo, pareduc = 32 si ambos padres tienen formación universitaria y, pareduc = 24 si ambos padres tienen una educación secundaria) y comparar la estimación del rendimiento de educ. c) Cuando añadimos pareduc a la ecuación como variable separada, obtenemos \ log(wage) = 4:94 + 0:097educ + 0:033pareduc (0:38) (0:027) (0:017) 0:0016pareduc educ (0:0012) +0:020exper + 0:010tenure (0:004) n = 722; (0:003) R2 = 0:174 ¿El rendimiento de la educación depende ahora positivamente de la educación de los padres? Contraste la hipótesis nula de que el rendimiento de la educación no depende de la educación de los padres. Solución: a) El rendimiento de la educación , manteniendo constante exper; pareduc y tenure, es @ log(wage) = 100( 1 + 2 pareduc) 100 educ No está claro cuál ha de ser el signo de 2 , aunque si creemos que cuanto mayor es el nivel de educación de los padres, mayor es el rendimiento de un año adicinal de educación para los hijos, tendríamos que 2 > 0. b) Como el rendimiento de la educación depende de los años de educación de los padres, calculamos el rendimiento para pareduc = 32 y pareduc = 24: Si pareduc = 32; el rendimiento de la educación, manteniendo constante exper y tenure, es del 7:2% (100(0:047 + 0:00078 32)) y si pareduc = 24; el rendimiento de la educación , manteniendo constante exper y tenure, es del 6:6% (100(0:047 + 0:00078 24)). Por tanto la diferencia es de 0:6 puntos porcentuales. 4 c) No, ya que el coe…ciente de la interacción es ahora negativo. El término de interacción no es estadísticamente signi…cativo ya que el t-ratio es t = 1:33 y el p-valor es P rob(jt716 j > 1:33) = 0:18: La variable pareduc si es signi…cativa. Este es un buen ejemplo de que omitir el efecto del nivel (la variable pareduc en este caso) puede dar lugar a una estimación sesgada del efecto de la interacción. Siempre que se incluya una interacción entre dos variables, debe incluirse también las dos variables por separado en el modelo. 4.- La tasa de desecho de una empresa manufacturera es el número de artículos defectuosos que deben desecharse por cada 100 artículos producidos. Así, una disminución en la tasa de desecho re‡eja una mayor productividad. Consideremos el siguiente modelo que utiliza la tasa de desecho (scrap) para medir el efecto de la formación de los trabajadores sobre la productividad log(scrap) = 0 + 1 hrsemp + 2 log(sales) + 3 log(employ) + u (1) donde hrsemp son las horas anuales de formación por empleado, sales son las ventas anuales de la empresa en dólares y employ es el número de empleados de la empresa. Utilizando las 43 observaciones para 1987 de la muestra de empresas manufactureras de Michigan (…chero JTRAIN del libro de Wooldridge) se han obtenido los siguientes resultados \ log(scrap) = 11:74 0:042hrsemp (4:57) 0:951 log(sales) + 0:992 log(employ) (0:019) (0:370) (0:360) 2 n = 43; R = 0:310 a) Interprete el coe…ciente estimado de la variable hrsemp y contraste si puede a…rmarse que una mayor formación disminuye la tasa de deshecho. b) Contraste la signi…catividad global del modelo. c) Demuestre que el modelo (1) también puede escribirse como log(scrap) = 0 + 1 hrsemp + 2 log(sales=employ) + log(employ) + u (2) Interprete la hipótesis H0 : = 0. d) Utilizando la misma muestra se ha estimado el modelo reparametrizado (2) y se han obtenido los siguientes resultados: \ log(scrap) = 11:74 (4:57) n = 43; 0:042hrsemp (0:019) 0:951 log(sales=employ) + 0:041 log(employ) (0:370) (0:205) 2 R = 0:310 Si tenemos en cuenta el efecto de las horas anuales de formación por empleado y las ventas por empleado (en logaritmos) sobre la tasa de deshecho, contraste si las empresas con más trabajadores tienen una mayor tasa de desecho. e) Contraste la hipótesis de que, manteniendo constante las horas anuales de formación por empleado y el número de empleados de la empresa, un incremento 5 de un 1% en el cociente de ventas por empleado está asociado con una disminución del 1% en la tasa de deshecho. solución: a) Puesto que el coe…ciente estimado de hrsemp es 0:042; una hora adicional de formación por empleado reduce la tasa de desecho en un 4:2%: El contraste que tenemos que hacer es H0 : H1 : 1 1 =0 <0 El estadístico de contraste es t= b 1 t39 bajo H0 se(b1 ) 0:042 = 2:21, el p-valor del El valor del estadístico en la muestra es t = 0:019 contraste es P rob(t39 < 2:21) = 0:0165 y por tanto podemos rechazar H0 al 2% y concluimos que una mayor formación disminuye la tasa de desecho. b) Tenemos que contrastar H0 : H1 : 1 1 = 2= 6 0 y/o = =0 2 6= 0 y/o 3 3 6= 0 El estadístico de contraste es F = (1 R2 =3 R2 ) =(43 3 1) F3;39 Bajo H0 El valor del estadístico de contraste en la muestra es F = 0:31=3 = 5:84 (1 0:31) =39 y el p-valor es P rob(F3;39 > 5:84) = 0:0021. Por tanto podemos rechazar H0 al 1% y las variables del modelo son conjuntamente signi…cativas. c) Si de…nimos = 2 + 3 y sustituimos 3 = 2 en el modelo (1) tenemos log(scrap) = = = + 0+ 0+ 0 1 hrsemp + 1 hrsemp + 1 hrsemp + log(sales) + ( 2 ) log(employ) + u 2 log(sales) + log(employ) 2 log(employ) + u 2 log(sales=employ) + log(employ) + u 2 La hipótesis = 0 quiere decir que, una vez que controlamos por las horas anuales de formación por empleado y las ventas por empleado (en logaritmos), un aumento en el porcentaje de empleados no tiene ningún efecto sobre la tasa de desecho. 6 d) El contraste que tenemos que hacer es H0 : H1 : =0 >0 El estadístico de contraste es t= b t39 bajo H0 se(b) El valor del estadístico en la muestra es t = 0:041 = 0:2 y el p-valor es 0:205 P rob(t39 > 0:2) = 0:42. Por tanto, no podemos rechazar H0 a ningún nivel de signi…cación razonable, no hay su…ciente evidencia para a…rmar que, si tenemos en cuenta el efecto de las horas anuales de formación por empleado y las ventas por empleado (en logaritmos), las empresas con más trabajadores tienen una mayor tasa de desecho. e) Tenemos que contrastar en el modelo (2) H0 : H1 : 2 2 = 6 = 1 1 El estadístico de contraste es t= b2 + 1 t39 Bajo H0 se(b2 ) = 0:13 y el p-valor El valor del estadístico en la muestra es t = 0:951+1 0:37 es P rob(jt39 j > 0:13) = 0:897. Por tanto, no podemos rechazar H0 a ningún nivel de signi…cación razonable, no hay su…ciente evidencia para rechazar que, manteniendo constante las horas anuales de formación por empleado y el número de empleados de la empresa, un incremento de un 1% en el cociente de ventas por empleado está asociado con una disminución del 1% en la tasa de deshecho. 5.- En el ejercicio 3 del tema 2 consideramos el siguiente modelo estimadado [ = 3638:25 sleep (112:28) n = 706; 0:148torwrk (0:017) 11:13educ + 2:20 age (5:88) (1:45) 2 R = 0:113 a) ¿Son educ y age individualmente signi…cativas al 5%? b) Al eliminar educ y age de la ecuación se obtienen los siguientes resultados: [ = 3586:38 sleep (38:91) 0:151torwrk (0:017) R2 = 0:103 n = 706; ¿Son educ y age conjuntamente signi…cativas al 5% en la ecuación original? 7 c) El incluir educ y age ¿afecta mucho a la disyuntiva (trade-o¤) estimada entre dormir y trabajar? d) Suponga que la varianza de las horas de sueño depende de alguno de los regresores del modelo, ¿Qué implicación tiene esto sobre los contrastes de los apartados anteriores? Solución: 2:2 = 1:89 y t3 = 1:45 = 1:52. El valor crítco a) Los t-ratios son t2 = 11:13 5:88 es t702;0:025 = 1:96. Como ninguno de los dos t-ratios es mayor en valor absoluto que el valor crítico, ninguna de las dos variables es estadísticamente signi…cativa al 5%. b) Tenemos que contrastar H0 : H1 : 2 2 = 3=0 6 0 y/o = 3 6= 0 Para hacer este contraste tenemos que comparar los R-cuadrado del modelo restringido y no restringido mediante un estadístico F . El estadístico de contraste es F = (1 2 (Rnr Rr2 ) =2 2 )=(706 Rnr 3 Por tanto F = 1) F2;702 bajo H0 (0:113 0:103) =2 = 3:96 (1 0:113)=702 El valor crítico es F2;702:0:05 = 3:01: Puesto que F = 3:96 > F2;702:0:05 = 3:01, podemos rechazar la nula al 5%, las variables son conjuntamente signi…cativas al 5%. c) El incluir educ y age no afecta mucho a la disyuntiva (trade-o¤) estimada entre dormir y trabajar ya que, al incluirlas, el parámetro estimado pasa de 0:151 a 0:148. d) Los estadísticos de contraste t y F se basan en la hipótesis de homoscedasticidad. Si la varianza de la variable dependiente depende de alguno de los regresores del modelo, los estádisticos que hemos utilizado en los apartados anteriores no son válidos. 6.- Considere el siguiente modelo para el precio de la vivienda log(price) = 0 + 1 sqrf t + 2 bdrms +u donde price es el precio de la vivienda en miles de dólares, sqrf t es la super…cie de la vivienda en pies cuadrados (1 pie cuadrado es 0:093 m2 ), y bdrms es el número de dormitorios. a) Utilice los datos del …chero HPRICE1 del libro de Wooldridge para estimar el modelo y presente los resultados de la forma habitual. 8 b) ¿Cuál es el cambio porcentual estimado en el precio de una vivienda, de un incremento de 150 pies cuadrados en su super…cie, si mantenemos constante el número de habitaciones? c) Obtenga un intervalo de con…anza al 95% para el cambio porcentual estimado en el precio de una vivienda de un incremento de 150 pies cuadrados en su super…cie, si mantenemos constante el número de habitaciones. d) ¿Cuál es el cambio porcentual estimado en los precios si se añade un dormitorio adicional de 150 pies cuadrados? e) Obtenga un intervalo de con…anza al 95% para el cambio porcentual estimado en los precios si se añade un dormitorio adicional de 150 pies cuadrados. Solución: a) El modelo estimado es \ log(price) = 4:77 + 0:00038sqrf t + 0:029 bdrms (0:097) (0:000043) (0:0296) 2 n = 88; R = 0:588 b) Si mantenemos …jo el número de habitaciones, un incremento de 150 pies cuadrados en su super…cie supone un incremento estimado en el precio de la vivienda del 5:7% (100 0:00038 150 = 5:7). c) Tenemos que obtener un intervalo de con…anza al 95% para 100 150 1 = 15000 1 : Puesto que t85;0:025 = 1:99; el intervalo de con…anza es [15000(0:00038 = [4:42; 6:98] 1:99 0:000043); 15000(0:00038 + 1:99 0:000043)] d) Un incremento de un dormitorio de 150 pies cuadrados supone un incremento estimado en el precio de la vivienda del 8:6% (100 (0:00038 150 + 0:029) = 8:6): e) Para obtener el intervalo de con…anza tenemos que reparametrizar el modelo. Sea = 150 1 + 2 tenemos que 2 = 150 1 y substituyendo en el modelo tenemos que log(price) = = = + 0+ 0+ 1 sqrf t +( 150 1 )bdrms + u 150 1 bdrms + u 1 sqrf t + bdrms 150bdrms) + bdrms + u 1 (sqrf t 0 El modelo estimado es \ log(price) = 4:77 + 0:00038(sqrf t (0:097) n = 88; (0:000043) 2 R = 0:588 9 150bdrms) + 0:0858bdrms (0:0268) y el intervalo de con…anza es [100(0:0858 [3:25; 13:91] 1:99 0:0268); 100(0:0858 + 1:99 0:0268)] 7.- Consideremos un modelo en el que el rendimiento de la educación depende de la experiencia laboral (y viceversa): log(wage) = 0 + 1 educ + 2 exper + 3 educ exper + u donde wage es el salario mensual en cientos de dólares, educ son los años de educación del individuo, exper son los años de experiencia laboral. a) Demuestre que el rendimiento de un año adicional de educación, manteniendo exper constante, es 100( 1 + 3 exper) b) Especi…que la hipótesis nula de que el rendimiento de la educación no depende del nivel de exper. ¿Cuál es la hipótesis alternativa adecuada? c) Utilice los datos del …chero WAGE2 del libro de Wooldridge para contrastar la hipótesis nula del apartado b frente a la alternativa propuesta. d) Obtenga un intervalo de con…anza al 95% para el rendimiento de la educación cuando exper = 10: Solución: a) El rendimiento de un año adicional de educación, manteniendo exper constante, es @ log(wage) = 100( 1 + 3 exper) 100 educ b) La hipótesis nula es 3 = 0: Si creemos que hay una interacción positiva entre educación y experiencia, en el sentido de que el efecto de los años de educación sobre el salario aumenta con la experiencia, la hipótesis alternativa apropiada es 3 > 0: c) El modelo estimado es \ log(wage) = 5:94 + 0:044educ (0:017) n = 935; 0:021exper + 0:0032educexper (0:020) (0:0015) 2 R = 0:135 El valor del estadístico de contraste en la muestra es t = 2:095 y el p-valor es 1 0:0365 = 0:01825, y por tanto podemos rechazar H0 al 2%. 2 d) De…nimos = 1 + 10 3 ; y substituyendo 1 = 10 3 en el modelo tenemos que log(wage) = = +( 10 3 ) educ + 2 exper + 3 educ exper + u 10) + u 0 + educ + 2 exper + 3 educ(exper 0 10 El modelo estimado es: \ log(wage) = 5:94 + 0:076 educ 0:021exper + 0:0032educ(exper (0:0066) n = 935; (0:020) (0:0015) 10) R2 = 0:135 y puesto que t931;0:025 = 1:96; el intervalo de con…anza al 95% para el rendimiento de la educación cuando exper = 10 es [100(0:076 = [6:3; 8:9] 1:96 0:0066); 100(0:076 + 1:96 0:0066)] 8.- Utilice los datos del …chero GPA2 del libro de Wooldridge para este ejercicio. a) Estime el modelo sat = 0 + 1 hsize + 2 hsize 2 + u; donde hsize es el número de alumnos en la promoción de bachillerato (en centenares) y sat es el resultado de un test, y presente los resultados de la forma habitual. b) Contraste la hipótesis nula de que el resultado del test depende linealmente del tamaño de la promoción de bachillerato frente a una alternativa bilateral. c) Usando la ecuación estimada en a, ¿cuál sería el tamaño óptimo de la clase? Justi…que la respuesta. d) Calcule el tamaño óptimo usando ahora log(sat) como variable dependiente ¿Es parecido al obtenido en el apartado c? Solución: a) Los resultados de la estimación son: c = 998:0 + 19:81hsize sat (6:20) (3:99) n = 4137; 2:13 hsize2 (0:549) R2 = 0:0077 b) Tenemos que contrastar H0 : H1 : 2 2 =0 6= 0 El valor del estadístico t en la muestra es 3:881 y el p-valor es 0:0001: Por tanto podemos rechazar la hipótesis nula de que la relación es lineal. c) El efecto marginal de hsize sobre sat es @sat = 1 + 2 2 hsize @hsize El tamaño óptimo se alcanza cuando 1 + 2 2 hsize = 0; es decir cuando hsize = 1 : En base a los resultados del apartado a se estima que el tamaño óptimo 2 2 11 = 4:65; como la variable hsize esta medida en cientos de alumnos. el es 219:81 2:13 tamaño óptimo estimado es 465 alumnos. d) Usando ahora log(sat) como variable dependiente, tenemos que \ = log(sat) 6:90 + 0:0196hsize (0:0062) (0:0040) 0:0021 hsize2 (0:00054) R2 = 0:0078 n = 4137; = 467 En base a estos resultados se estima que el tamaño óptimo es 100 20:0196 0:0021 alumnos; casi el mismo número que el que obtuvimos en el apartado anteror. 9.- El siguiente modelo puede servir para estudiar si los gastos de campaña afectan a los resultados electorales: voteA = 0 + 1 log(expendA) + 2 log(expendB) + 3 prtystrA +u donde voteA es el porcentaje de votos del candidato A, expendA y expendB son los gastos de campaña de los candidatos A y B; y prtystrA es una medida de la fuerza del partido del candidato A: a) ¿Cuál es la interpretación de 1 ? b) Especi…que, en términos de los parámetros del modelo, la hipótesis de que el efecto sobre el porcentaje de votos del candidato A de un incremento de un 1% en los gastos de campaña de A se ve compensado por un incremento de un 1% en los gastos de campaña de B: c) Estime el modelo utilizando los datos del …chero VOTE1 del libro de Wooldridge sobre los resultados electorales en 173 contiendas electorales entre dos partidos para las elecciones a la cámara de representantes de Estados Unidos en 1988 y presente los resultados en la forma habitual. d) ¿Cómo afectan los gastos de campaña del candidato A a sus resultados electorales? ¿y los gastos de campaña de B?. e) Contraste la hipótesis del apartado b frente a una alternativa bilateral utilizando un estadístico t. f) Escriba el modelo restringido imponiendo la restricción del apartado b. Estime dicho modelo y utilice un estadístico F para contrastar de nuevo la hipótesis del apartado b. ¿Qué relación hay entre el estadístico t del apartado e y el estadístico F que acaba de calcular?. Solución: a) Manteniendo todos los demás factores …jos un aumento de un 1% en los gastos de la campaña electoral supone un incremento de 0:01 1 puntos porcentuales en el porcentaje de votos del candidato A: Nótese que como la variable de gasto en la campaña electoral está en logaritmos, un incremento de un 1% en esta variable es aproximadamente equivalente a un incremento de 0:01 en log(expendA): b) La hipótesis en términos de los parámetros de modelo es H0 : 1 + 12 2 =0 c) El modelo estimado es \ = 45:1 + 6:08 log(expendA) voteA 6:62 log(expendB) + 0:152prtystrA; (0:382) (0:379) (0:062) 2 n = 173; R = 0:7925 d) Un aumento de 10% en los gastos de campaña del candidato A, manteniendo constante los gastos de campaña del candidato B y la fuerza del partido del candidato A; supone un incremento en el porcentaje de votos del candidato A de 0:608 puntos porcentuales. Un aumento de 10% en los gastos de campaña del candidato B, manteniendo constante los gastos de campaña del candidato A y la fuerza del partido del candidato A; supone una disminución en el porcentaje de votos del candidato A de 0:662 puntos porcentuales. e) Para contrastar esta hipótesis tenemos que reparametrizar el modelo. Sea = 1 + 2 ; entonces 2 = 1 y substituyendo en el modelo tenemos voteA = = + 0+ 0 log(expendA) + ( 1 ) log(expendB) + 3 prtystrA + u log(expendB)) + log(expendB) + 3 prtystrA + u 1 (log(expendA) 1 Si de…nimos d log(exp) = log(expendA) log(expendB); el modelo reparametrizado es voteA = 0 + 1 d log(exp) + log(expendB) + 3 prtystrA + u y la hipótesis es que tenemos que contrastar es ahora H0 : = 0: Estimamos el modelo reparametrizado obteniendo los siguientes resultados \ = 45:1 + 6:08 d log(exp) voteA (0:382) n = 173; 0:534 log(expendB) + 0:152prtystrA; (0:533) (0:062) 2 R = 0:7925 El estadístico t es t= b se(b) t169 bajo H0 0:534 El valor del estadístico de contraste en la muestra es t = 0:533 = 1:002 y el p-valor del contraste bilateral aparece en la tabla es 0:3180: Por tanto, no podemos rechazar la hipótesis nula a ningún nivel de signi…cación razonable, no hay su…ciente evidencia para rechazar la hipótesis de que el efecto sobre el porcentaje de votos del candidato A de un incremento de un 1% en los gastos de campaña de A se ve compensado por un incremento de un 1% en los gastos de campaña de B: f) El modelo restringido es voteA = 0 + 1 d log(exp) 13 + 3 prtystrA +u El estadístico F es F = (SCRr SCRnr ) =1 SCRnr =(173 3 1) F1;169 bajo H0 Utilizando los resultados de la estimación del modelo restringido y no restringido vemos que SCRnr = 10055:08 y SCRr = 10114:76; y por tanto F = (10114:76 10055:08) = 1:003 10055:08=169 Podemos calcular el p-valor del contraste P rob(F1;169 > 1:003) = 0:318 y vemos que coincide con el p-valor que obteníamos utilizando el estadístico t. Los dos contrastes son equivalentes y la relación entre los estadísticos de contraste es que F = t2 . 10.- Considere el siguiente modelo para los salarios log(wage) = 0 + 1 educ + 2 f educ + 3 meduc + 4 exper +u (3) donde wage son los ingresos mensuales en dólares, educ son los años de educación, f educ son los años de educación del padre, meduc son los años de educación de la madre y exper los años de experiencia laboral. a) Estime el modelo utilizando los datos del …chero WAGE2 del libro de Wooldridge y presente los resultados en forma de ecuación. b) Interprete el coe…ciente estimado de f educ y contraste si esta variable es signi…cativa. c) Interprete el coe…ciente estimado de meduc y contraste si esta variable es signi…cativa. d) Contraste la hipótesis de que, teniendo en cuenta el nivel de educación y la experiencia laboral, ni los años de educación del padre ni los de la madre in‡uyen en el salario de los hijos. Compare este resultado con los resultados que ha obtenido en los apartados b) y c). e) Contraste frente a una alternativa bilateral si, una vez que hemos tenido en cuenta el nivel de educación y la experiencia laboral, los años de educación del padre y la madre tienen el mismo efecto sobre el salario de los hijos. Solución: a) Los resultados de la estimación son: \ log(wage) = 5:397 + 0:0654educ + 0:0115f educ + 0:0117meduc + 0:0234exper (0:0078) n = 722; (0:0056) (0:0063) (0:0038) 2 R = 0:158 b) El coe…ciente estimado de f educ indica que, manteniendo …jos los años de educación, la experiencia laboral y los años de educación de la madre, un aumento de un año en los años de educación del padre supone un aumento de un 14 1:15% en el salario del hijo. Puesto que el p-valor del contraste de signifcatividad para esa variable es 0:038 la variable es signi…cativa al 4%: c) El coe…ciente estimado de meduc indica que, manteniendo …jos los años de educación, la experiencia laboral y los años de educación del padre, un aumento de un año en los años de educación de la madre supone un aumento de un 1:17% en el salario del hijo. Puesto que el p-valor del contraste de signifcatividad para esa variable es 0:064 la variable es signi…cativa al 7%: d) Tenemos que contrastar H0 : H1 : 2 2 = 3=0 6 0 o 3 6= 0 = Para hacer este contraste tenemos que imponer estas dos restricciones, estimar el modelo restringido y comparar las sumas cuadráticas del modelo restringido y no restringido mediante un estadístico F . El modelo restringido es log(wage) = 0 + 1 educ + 4 exper +u El estadístico de contraste es F = (SCRr SCRnr ) =2 SCRnr =(722 4 1) F2;717 bajo H0 donde SCRnr es la suma cuadrática residual del modelo no restringido y SCRr es la suma cuadrática residual del modelo restringido. Utilizando los resultados de la estimación del modelo no restringido y del modelo restringido tenemos que SCRnr = 106:781997 y SCRr = 109:073975; y por tanto F = (109:073975 106:781997) =2 = 7:69 106:781997=717 El p-valor del contraste es P rob(F2;717 > 7:69) = 0:00049 y podemos rechazar la hipótesis nula a cualquier nivel de signi…cación razonable: Nótese que el p-valor de este contraste es mucho más pequeño que los p-valores de los contrastes de signi…catividad individual de las dos variables utilizados en los apartados anteriores. El motivo es que los años de educación del padre y la madre están fuertemente correlacionados y por tanto los errores estándar de los coe…cientes estimados de estas dos variables son relativamente grandes. e) Tenemos que contrastar H0 : H1 : 2 2 = 6= 3 3 para eso tenemos que reparametrizar el modelo. sustituimos 2 = + 3 en el modelo (3) log(wage) = = = + 0+ 0+ 0 1 educ De…nimos = 2 3 + 2 f educ + 3 meduc + 4 exper + u 1 educ + ( + 3 ) f educ + 3 meduc + 4 exper + u 1 educ + f educ + 3 (f educ + meduc) + 4 exper + u 15 y De…niendo peduc = f educ + meduc; el modelo reparametrizado que tenemos que estimar es: log(wage) = 0 + 1 educ + f educ + 3 peduc + 4 exper +u y la hipótesis que tenemos que contrastar es H0 : H1 : =0 6= 0 Utilizando los resultados de la estimación vemos que el p-valor del contraste es 0:98 y por tanto no podemos rechazar la hipótesis nula a ningún nivel de signi…cación razonable. Concluimos que una vez que hemos tenido en cuenta el nivel de educación y la experiencia laboral, los años de educación del padre y la madre tienen el mismo efecto sobre el salario de los hijos. 16
© Copyright 2024