PROBLEMAS RESUELTOS Y PROPUESTOS. TEMA 2. PROBLEMAS RESUELTOS PROBLEMA 1 En un muestreo efectuado entre 100 grandes empresas de la industria química se ha obtenido el siguiente modelo de regresión estimado: Ê = 2,3 +0,05 T –2,4 C +1,9 F (0,37) (0,53) (0,61) donde E es el número de empleados de la empresa (en cientos de personas), T es igual a 1 si la empresa incorpora los últimos adelantos tecnológicos y 0 en caso contrario, C es igual a 1 si existen empresas competidoras en un radio de 50 Km de la empresa en cuestión y 0 en otro caso y F es igual a 1 si hay una empresa complementaria en un radio de 50 Km y 0 en otro caso. A partir de aquí, y suponiendo que el modelo ha superado la etapa de validación, indique razonadamente si las siguientes afirmaciones son verdaderas o falsas: 1.1. Una empresa con tecnología punta tiene por término medio 5 empleados más que una que no incorpora los últimos adelantos tecnológicos. 1.2. Por cada empresa de la competencia existente en un radio de 50 Km, una empresa de la industria química contrata 240 trabajadores menos. 1.3. El coeficiente que acompaña a la variable C indica el efecto diferencial provocado por la competencia. SOLUCION Dado que los números entre paréntesis representan las desviaciones típicas estimadas de los estimadores de los parámetros de posición, podemos calcular el t-ratio asociado a cada parámetro de posición individual, resultando: t-ratio asociado al parámetro que acompaña a la variable T → 0,13. t-ratio asociado al parámetro que acompaña a la variable C → 4,52. t-ratio asociado al parámetro que acompaña a la variable F → 3,11. en consecuencia la variable T que recoge la incorporación por parte de la empresa de las últimas tecnologías no resulta significativa. 1.1. Falsa, dado que dicha variable no es significativa para la explicación de la variable endógena y no nos permite obtener ningún tipo de información. 1.2. Falsa, la interpretación no es por cada empresa de la competencia, sino que por término medio la existencia de empresas competidoras hace que las empresas químicas contraten 240 empleados menos. 1.3. Verdadera, ya que el hecho de que exista competencia o no tiene una influencia sobre el empleo autónomo reflejado por el coeficiente de la variable C. 1 PROBLEMA 2 Con el objetivo de analizar la variable salario percibido se ha estimado por MCO el siguiente modelo en base a la información obtenida de 528 personas: Ln (si) = 0,5372 + 0,1009 Educi + 0,0116 Expi (0,1264) (0,0085) (0,0017) R2 = 0,2219 (1) donde Ln (si) representa el logaritmo del salario percibido (en euros) por hora trabajada; Educ son los años de educación y Exp son los años de experiencia laboral potencial calculados como Expi = edadi – (Educi + 6), siendo edadi la edad del individuo i-esimo de la muestra. Posteriormente, para analizar si existe algún tipo de discriminación salarial por razones de sexo o de afiliación sindical se ha estimado por MCO, con la misma muestra que la utilizada para el modelo (1), el siguiente modelo: Ln (si) = 0,56038 + 0,1010 Educi + 0,0117 Expi – 0,2307Mujeri + 0,2108Afili (0,1207) (0,0081) (0,0017) (0,0388) (0,0504) (2) R2 = 0,3062 donde Mujer representa la variable ficticia que vale 1 si la persona i-esima de la muestra es mujer y 0 si es hombre y Afil es otra variable ficticia que vale 1 si la persona i-esima está afiliada a algún sindicato y 0 en caso contrario. A partir de esta información, se pide razonar la verdad o falsedad de las afirmaciones siguientes. En caso de razonar que son falsas, determine la conclusión correcta. a) Según el modelo (2), para los mismos niveles de educación y experiencia y el mismo sexo, se estima que una persona no afiliada a un sindicato gana por hora un 21,08% menos que una persona afiliada. b) Según el modelo (2), la diferencia entre el salario percibido por una mujer y un hombre, para los mismos niveles de educación y experiencia y la misma situación de afiliación laboral, se estima en 0,2307 euros menos por hora. c) El contraste de la hipótesis nula: los salarios no difieren significativamente entre sí ni por razones de sexo no por razones de afiliación sindical, se concreta en establecer H0: β3 + β4 = 0, siendo β3 el coeficiente que acompaña a la variable Mujer y β4 el coeficiente que acompaña a la variable Afil. d) Un investigador comenta que el ha estimado los mismos dos modelos pero incluyendo la edad como variable explicativa adicional y que ha mejorado la precisión de los estimadores de los parámetros de posición en el sentido de disminuir su error estandar. SOLUCION a) CIERTA. Como se está planteando un modelo semilogaritmico, el coeficiente de la ficticia, al multiplicarlo por 100, recoge la variación porcentual en el salario entre una persona afiliada y otra no afiliada. b) FALSA. Dado que se está razonando con un modelo semilogaritmico, los coeficientes no tienen la interpretación de propensiones. La interpretación correcta sería que, para los mismos niveles de educación y experiencia y la misma situación de afiliación laboral, la diferencia entre el salario percibido entre una mujer y un hombre es del 23,07% menos para la primera 2 c) FALSA. La hipótesis nula que plantea el enunciado implica β3 = - β4, es decir, que el efecto sobre el salario del sexo y de la afiliación es el mismo (aunque cambiado de signo). La hipótesis que recoge que los salarios no difieren significativamente entre sí ni por razones de sexo no por razones de afiliación sindical, se concreta como H0: β3 = 0; β4 = 0. d) FALSA. Si se incluye la edad como variable explicativa, teniendo en cuenta la definición de la variable experiencia laboral potencial, se estaría incluyendo entre las explicativas del modelo una relación lineal exacta, es decir, colinealidad perfecta lo que no permite estimar de forma única los parámetros de posición. PROBLEMA 3 Los datos del cuadro adjunto recogen información de una variable Y para dos grupos diferenciados de individuos (Grupo 1: i = 1, ... , N1 ; Grupo 2: i = N1 + 1, ... , N1 + N 2 ). Grupo 1 Grupo 2 100,0000 100,0000 112,8302 105,8264 175,0404 138,5850 296,5499 170,5707 335,3100 193,3413 400,3234 214,7444 427,9245 258,5612 479,1375 282,8775 340,3774 313,2580 234,5553 335,8502 Tras estimar por MCO el modelo: yi = α + β Di + ui i = 1, ..... , N1 + N 2 donde Di es una variable ficticia definida de la siguiente manera: ⎧1 i ∈Grupo 1 Di = ⎨ ⎩0 i ∈Grupo 2 a) Interprete los coeficientes del modelo en términos de los valores medios de la variable Y. 3 b) Teniendo en cuenta que de la estimación del modelo resulta α̂ = 211,36147 y β̂ = 78,8433, Verifique empíricamente las relaciones existentes entre estas estimaciones y los valores medios muestrales de cada grupo. c) Contraste la hipótesis de igualdad de medias poblacionales de los dos grupos. d) Demuestre analíticamente el resultado para β̂ obtenido en el apartado b). SOLUCION a) Para interpretar los parámetros consideraremos el valor esperado de la variable dependiente condicionado a los dos valores que toma la variable Di . E [ yi | Di = 1] = α + β E [ yi | Di = 0] = α De este modo, el término independiente del modelo puede interpretarse como el valor medio del segundo grupo; mientras que el parámetro β de la regresión representa el diferencial existente entre las medias poblacionales de ambos grupos. b) A partir de la información suministrada si se calcula la media muestral del segundo grupo se verifica que coincide con α̂ ; mientras que la media muestral del segundo grupo coincide con α̂ + β̂ . c) El contraste de la hipótesis de igualdad de medias poblacionales supone verificar H0: β = 0, a través del t-ratio correspondiente. d) Se parte de la expresión general del estimador MCO de β : β̂ = N N i =1 N i =1 N N ∑ X i2 − X ∑ X i i =1 N N N ∑ X iYi − ∑ X i ∑ Yi ∑ X iYi − X ∑ Yi i =1 = i =1 i =1 ⎛ ⎞ N ∑ X − ⎜ ∑ Xi ⎟ i =1 ⎝ i =1 ⎠ N N 2 2 i i =1 Al concretar esta expresión para una variable exógena como Di , resulta: N β̂ = N N N ∑ DiYi − ∑ Di ∑ Yi i =1 i =1 i =1 ⎛ ⎞ N ∑ Di2 − ⎜ ∑ Di ⎟ i =1 ⎝ i =1 ⎠ N N 2 N1 N i =1 i =1 2 1 N1 N ∑ Yi − N1 ∑ Yi = NN1 − ( N ) N ( N1 + N 2 )∑ Yi − N1 ∑ Yi = i =1 NN1 − ( N1 ) i =1 2 N1 N1 N N1 N ⎛ N1 ⎞ N1 ∑ Yi + N 2 ∑ Yi − N1 ⎜ ∑ Yi + ∑ Yi ⎟ N 2 ∑ Yi − N1 ∑ Yi i =1 i =1 i = N1 +1 ⎝ i =1 ⎠ = i =1 i =1 = 2 N1 ( N − N1 ) NN1 − ( N1 ) 4 = N 2 N1Y1 − N1 N 2Y2 = Y1 − Y2 N1 N 2 De este modo, la estimación de la pendiente refleja la diferencia en el valor medio del primer grupo respecto al segundo. PROBLEMA 4 El gerente de una empresa desea conocer como se determina la venta de ropa deportiva, Vi , en función de la renta, Ri , y la edad de los consumidores, Ei , para lo que ha estimado el siguiente modelo de regresión con una muestra de 50 individuos: Vˆi = 344,9 + 0,00245 Ri - 7,72 Ei (72,38) (0,0006) R 2 = 0,3401 ∑ uˆ 2 í = 632292 (1) (2,32) a) Uno de los consejeros baraja la hipótesis de que la propensión marginal a comprar ropa de deporte puede depender de la edad, por lo que estima el siguiente modelo con la muestra disponible: Vˆi = 164,4 + 0,0091 Ri - 3,15 Ei - 0,00016 ( Ri · Ei ) (120,79) (0,0037) (3,36) R 2 = 0,3966 ∑ uˆ 2 í = 581822,2 (0,00009) a.1) ¿Cuál es la propensión marginal a comprar estimada?. ¿Cuál es la propensión marginal a comprar para un individuo de 50 años?. a.2) ¿Cuál es el efecto marginal de la edad sobre las ventas?. ¿Cuál es el efecto marginal de un incremento unitario de la edad para un individuo cuya renta es de 27500 euros?. ¿Y para uno de 48000?. a.3) ¿Existe evidencia en la muestra para rechazar la hipótesis del gerente?. b) Otro asesor considera que, dado que los hombres hacen más deporte que las mujeres, las ventas de ropa deportiva dependerán del sexo del cliente. Con los siguientes resultados del modelo estimado incluyendo la variable ficticia M i que toma el valor 1 si el cliente es mujer: Vˆi = 461,2 + 0,0024 Ri - 8,57 Ei - 169,81 M i (58,69) (0,00046) (1,76) R 2 = 0,63489 ∑ uˆ 2 í = 352063 (31,49) b.1) Interprete los coeficientes del modelo. 5 b.2) ¿Es significativa la variable sexo a la hora de determinar las ventas de ropa deportiva?. b.3) Dada la conclusión del apartado anterior, ¿qué puede decir de la calidad de los estimadores MCO en el modelo dado en (1)?. c) Para contrastar la hipótesis de que el efecto marginal de la edad sobre las ventas depende del sexo se ha estimado el siguiente modelo: Vˆi = 494,8 + 0,0023 Ri - 9,44 Ei - 251,24 M i + 2,44 ( Ei · M i ) (74,03) (0,00047) (2,11) (112,95) (3,25) R 2 = 0,6406 ∑ uˆ 2 í = 346477,5 c.1) ¿Cuál es el efecto marginal estimado de la edad sobre las ventas para una mujer?. ¿Y para un hombre?. c.2) ¿Apoya la muestra la hipótesis planteada?. c.3) ¿Es significativa la variable sexo?. d) A pesar del resultado obtenido en el apartado anterior, el gerente sigue pensando que las ventas de ropa deportiva tienen diferente estructura para los hombres y las mujeres y que ambos no solo tienen diferente nivel promedio de consumo sino que también responden de forma diferente ante un incremento de renta o diferentes edades. Dado que en la muestra hay 25 hombres y 25 mujeres, estima la función de ventas para cada grupo por separado con los siguientes resultados: Vˆi =225,5 + 0,0019 Ri - 5,95 Ei i ∈ mujer ∑ uˆ 2 í = 107659,1 (69,01) (0,00047) (2,32) Vˆi =491,5 + 0,0029 Ri - 10,26 Ei i ∈hombre (85,97) (0,0009) ∑ uˆ 2 í = 226577,5 (2,59) d.1) Contraste la hipótesis del gerente. d.2) Explique otra manera alternativa de hacer el contraste. e) Dados los resultados obtenidos, ¿con qué modelo se quedaría para determinar las ventas de ropa de deporte de la empresa?. SOLUCION a.1) En el modelo estimado, la propensión marginal a vender estimada viene dada por: 6 ∂Vˆi = 0,0091 – 0,00016 Ei ∂Ri De modo que la propensión marginal a vender no es constante sino que depende de la edad del cliente. Así, para un individuo de 50 años tal propensión es: ∂Vˆi = 0,0091 – 0,00016 · 50 = 0,0011 ∂Ri a.2) El efecto marginal estimado de la edad sobre las ventas es: ∂Vˆi = -3,15 – 0,00016 Ri ∂Ei Por tanto la variación estimada en las ventas ante un incremento unitario de la edad no es constante, sino que depende de la renta del individuo. Así, para un individuo con una renta de 27500 euros tal efecto es: ∂Vˆi = -3,15 – 0,00016 · 27500 = - 7,55 ∂Ei a.3) La propensión marginal a comprar ropa depende de la edad si la variable interacción incluida en el modelo es significativa. Para contrastar esta hipótesis se utiliza el correspondiente t-ratio, dado por: t= −0, 00016 = - 1,78 0, 00009 Como |-1,78| < t0,025 (46) = 2,02 ⇒ hay evidencia para aceptar la hipótesis nula, al nivel de significación del 5%. Es decir, no hay evidencia en la muestra a favor de la hipótesis del consejero de que existe efecto interacción entre renta y edad. b.1) En el modelo estimado resulta: 461, 2 + 0, 0024 Ri − 8,57 Ei Mi = 0 ⎧ Vˆi = ⎨ ⎩461, 2 + 0, 0024 Ri − 8,57 Ei − 169,81 M i = 1 Por lo tanto, 461,2 es el consumo autónomo para los hombres, mientras que la diferencia en la venta de renta deportiva entre hombres y mujeres, manteniéndose constante la renta y la edad, se estima en –169,81. La propensión marginal a consumir estimada es 0,0024, manteniéndose todo los demás constante. El efecto marginal de la edad, dadas las variables sexo y renta, es –8,57. b.2) Para verificar la significatividad de la variable sexo se calcula el correspondiente tratio: 7 t= −169,81 = - 5,39 31, 49 Como |-5,39| > t0,025 (46) = 2,02 ⇒ hay evidencia para no aceptar la hipótesis nula, al nivel de significación del 5%. Es decir, las ventas dependen del sexo del cliente. b.3) Suponiendo que el modelo del apartado b) satisface las hipótesis ideales, el resultado anterior indicaría que en el modelo (1) se ha omitido una variable relevante como es el sexo por lo que los estimadores obtenidos en dicho modelo resultaran sesgados y la inferencia realizada no será válida. c.1) El efecto marginal estimado de la edad sobre las ventas para los hombres es: ∂Vˆi = - 9,44 ∂Ei y para las mujeres: ∂Vˆi = - 9,44 + 2,44 = - 7 ∂Ei c.2) La muestra contendrá evidencia para apoyar la hipótesis planteada si el coeficiente de la variable interacción resulta estadísticamente significativo. Calculando el correspondiente t-ratio, se obtiene: t= 2, 44 = -0,75 3, 25 Como 0,75 < t0,025 (45) = 2,02 ⇒ hay evidencia para aceptar la hipótesis nula, al nivel de significación del 5%. Es decir, no hay efecto interacción entre sexo y edad. c.3) La significatividad de la variable sexo se analiza planteando la hipótesis de que su coeficiente y el de la variable interacción son conjuntamente igual a cero. Utilizando el contraste F de diferencia de sumas residuales se tiene en cuenta que el modelo restringido es el planteado inicialmente. Por tanto: F= (632292 − 346477,5) / 2 = 18,56 346477,5 / 45 Como 18,56 > F0,05 (2, 45) = 3,23 ⇒ hay evidencia para no aceptar la hipótesis nula, al nivel de significación del 5%. Es decir, las ventas dependen del sexo del cliente. d.1) Para contrastar la hipótesis de estabilidad de los coeficientes a lo largo de la muestra, se puede utilizar el contraste de Chow que, en este caso, trata de verificar: H0: β 0M = β 0H = β 0 y β1M = β1H = β1 y β 2M = β 2H = β 2 HA: No H0 8 El estadístico de contrate viene dado por: F= [uˆ R′ uˆR − (uˆM′ uˆM + uˆH′ uˆH ) / 3 (uˆM′ uˆM + uˆ ′H uˆH ) / 50 − (2·3) donde uˆ ′R uˆ R es la suma residual del modelo que asume estabilidad, es decir, el modelo recogido en (1); mientras que las otras sumas residuales se refieren a las resultantes delas regresiones que se efectúan por separado entre hombres y mujeres. Sustituyendo por la información disponible, resulta: F= [632292 − (107659,1 + 226577,5) / 3 = 13,08 (107659,1 + 226577,5) / 44 Como 13,08 > F0,05 (3, 44) = 2,84 ⇒ hay evidencia para no aceptar la hipótesis nula, al nivel de significación del 5%. Es decir, las regresiones para hombres y mujeres no son equivalentes. d.2) Una forma equivalente de plantear este contraste sería utilizando variables ficticias, es decir, planteando el modelo: Vi = β 0 + γ 0 M i + β1 Ri + γ 1 ( Ri · M i ) + β 2 Ei + γ 2 ( Ei · M i ) + ui (2) Teniendo en cuenta que: E [ Vi | M i = 0] = β 0 + β1 Ri + β 2 Ei E [ Vi | M i = 1] = ( β 0 + γ 0 ) + ( β1 + γ 1 ) Ri + ( β 2 + γ 2 ) Ei La hipótesis de que la función de ventas es la misma para mujeres y hombres se concreta, ahora, en contrastar: H0: γ 0 = γ 1 = γ 2 = 0 HA: No H0 El contraste se llevaría a cabo a través del estadístico F de diferencia de sumas residuales, siendo ahora el modelo restringido el modelo dado en (1) y el modelo no restringido el expresado en (2). e) El modelo apropiado para las ventas de ropa deportiva de esta empresa es el modelo planteado en el apartado d) en el que las ventas se determinan en función de la edad y la renta, con estructuras diferentes para hombres y mujeres. 9 PROBLEMA 5 Se trata de estudiar la relación entre el precio alcanzado en las subastas (y) y la cantidad total ofrecida de carne de vacuno (x), utilizando datos semanales. Especifique el modelo econométrico, suponiendo linealidad, que mejor se ajuste al planteamiento siguiente: la reacción del precio con respecto al volumen ofertado de carne de vacuno parece diferente en aquellas semanas en las que se producen importaciones de carne de porcino. SOLUCION Para recoger el comportamiento planteado se define una variable ficticia denominada Impor tal que valdrá 1 en aquellas semanas que se produzca importación y 0 en el resto de semanas. El modelo econométrico será: yt = α + βxt + γ (Import · xt) + ut Para comprobar que tal modelo recoge adecuadamente el planteamiento efectuado, se calculan las líneas de regresión poblacional correspondientes a las semanas con importación y a las semanas sin importación, esto es: E [yt | Import = 1] = α + βxt + γ xt = α + (β + γ) xt E [yt | Import = 0] = α + βxt = α + β xt Con lo cual, la reacción el precio ante el volumen ofertado de carne de vacuno será β en las semanas que no hay importación y (β + γ) en las semanas en las que se produce importación. 10 PROBLEMAS PROPUESTOS PROBLEMA 1 Se ha estimado una función de consumo de la economía española para el periodo 19711995 con los siguientes resultados: M0: Ĉ t = 40,63 + 0,72 Yt SR = 110 También se han resuelto estas otras estimaciones: SR = 88 M1: Ĉ t = 38,59 +0,62 Yt + 0,15 Z t M2: Ĉ t = 48,23 – 12,94 Dt + 0,68 Yt SR = 100 M3: Ĉ t = 45,63 –8,34 Dt +0,65 Yt + 0,10 Z t SR = 85 donde Dt =1 para t > 1985 y cero en otro caso, tratando de recoger la entrada de España en la Comunidad Económica Europea. Además, Z t = Yt · Dt . Especifique y resuelva las siguientes hipótesis: 1.1. La entrada de la economía española en la CEE ocasionó una ruptura total de la estructura en el comportamiento de la función de consumo. 1.2. La entrada de la economía española en la CEE solo afectó a la distribución entre consumo y ahorro de una unidad adicional de renta. 1.3. La escala de la función de consumo fue el único elemento afectado por la adhesión a la CEE. PROBLEMA 2 Con objeto de analizar las diferencias salariales entre los empleados de una empresa, se ha tomado una muestra de 500 empleados de los cuales 300 son licenciados. Especifique el modelo que le permita contrastar si existe diferencia salarial entre los licenciados y los no licenciados. Plantee la hipótesis a contrastar y el estadístico que utilizaría para resolver el contraste. PROBLEMA 3 Para analizar la relación entre las ventas de helados, yt , y la temperatura de una determinada ciudad costera, xt , se han utilizado 100 datos diarios de ambas variables para el año 2002 y se han estimado las siguientes rectas de regresión: M1: yˆt = 1663,6 + 0,75 xt (0,028) R 2 = 0,878 M2 : yˆt = 186,12 + 0,82 xt + 832,09 Dt (0,049) (32,82) R 2 = 0,984 11 M3: yˆt = 709,18+ 0,79 xt + 0,05 Dt xt (0,044) (0,002) R 2 = 0,983 M4: yˆt = -184,7 + 0,83 xt + 1757,99 Dt - 0,06 Dt xt (0,062) (491,37) (0,024) R 2 = 0,985 donde Dt es una variable ficticia que toma el valor 1 si t es un día de verano y 0 en caso contrario. a) Interprete los coeficientes del modelo M4. b) Contraste si el ser verano o no es un factor explicativo de la variable ventas de helados. c) Contraste si el efecto marginal de un incremento unitario en la temperatura sobre las ventas de helados es diferente según sea verano o no. d) Contraste la hipótesis de que las ventas de helados son totalmente independientes del hecho de estar o no en verano. PROBLEMA 4 Dado un modelo de regresión simple yt = α + β xt + ut, para el que se dispone de 40 observaciones temporales, se considera que existe una ruptura estructural en el periodo 15 que afecta a los dos parámetros de posición. Para especificar un modelo que tenga en cuenta este hecho se definen dos ficticias D1t y D2t de la siguiente forma: ⎧1 t = 1,...,15 ⎧0 t = 1,...,15 D1t = ⎨ D2t = ⎨ ⎩0 t = 16,..., 40 ⎩1 t = 16,..., 40 Indique cuál o cuáles de las siguientes especificaciones pueden considerarse adecuadas para tener en cuenta la ruptura. Razone en cada caso su respuesta, tanto si cree que la especificación es adecuada como si piensa lo contrario. a) yt = α1 + β1 xt + α2 D2t + β2 (D1t · xt ) + β3 (D2t · xt ) + ut b) yt = α1 D1t + α2 D2t + β1 xt + β2 (D1t · xt ) + ut c) yt = α1 D1t + α2 D2t + β1 (D1t · xt ) + β2 (D2t · xt ) + ut d) yt = α0 + α1 D1t + α2 D2t + β1 xt + β2 (D2t · xt ) + ut 12
© Copyright 2024