PROBLEMAS RESUELTOS Y PROPUESTOS. TEMA 2.

PROBLEMAS RESUELTOS Y PROPUESTOS.
TEMA 2.
PROBLEMAS RESUELTOS
PROBLEMA 1
En un muestreo efectuado entre 100 grandes empresas de la industria química se ha
obtenido el siguiente modelo de regresión estimado:
Ê = 2,3 +0,05 T –2,4 C +1,9 F
(0,37) (0,53)
(0,61)
donde E es el número de empleados de la empresa (en cientos de personas), T es igual a
1 si la empresa incorpora los últimos adelantos tecnológicos y 0 en caso contrario, C es
igual a 1 si existen empresas competidoras en un radio de 50 Km de la empresa en
cuestión y 0 en otro caso y F es igual a 1 si hay una empresa complementaria en un
radio de 50 Km y 0 en otro caso.
A partir de aquí, y suponiendo que el modelo ha superado la etapa de validación,
indique razonadamente si las siguientes afirmaciones son verdaderas o falsas:
1.1. Una empresa con tecnología punta tiene por término medio 5 empleados
más que una que no incorpora los últimos adelantos tecnológicos.
1.2. Por cada empresa de la competencia existente en un radio de 50 Km, una
empresa de la industria química contrata 240 trabajadores menos.
1.3. El coeficiente que acompaña a la variable C indica el efecto diferencial
provocado por la competencia.
SOLUCION
Dado que los números entre paréntesis representan las desviaciones típicas estimadas de
los estimadores de los parámetros de posición, podemos calcular el t-ratio asociado a
cada parámetro de posición individual, resultando:
t-ratio asociado al parámetro que acompaña a la variable T → 0,13.
t-ratio asociado al parámetro que acompaña a la variable C → 4,52.
t-ratio asociado al parámetro que acompaña a la variable F → 3,11.
en consecuencia la variable T que recoge la incorporación por parte de la empresa de las
últimas tecnologías no resulta significativa.
1.1. Falsa, dado que dicha variable no es significativa para la explicación de la variable
endógena y no nos permite obtener ningún tipo de información.
1.2. Falsa, la interpretación no es por cada empresa de la competencia, sino que por
término medio la existencia de empresas competidoras hace que las empresas químicas
contraten 240 empleados menos.
1.3. Verdadera, ya que el hecho de que exista competencia o no tiene una influencia
sobre el empleo autónomo reflejado por el coeficiente de la variable C.
1
PROBLEMA 2
Con el objetivo de analizar la variable salario percibido se ha estimado por MCO el
siguiente modelo en base a la información obtenida de 528 personas:
Ln (si) = 0,5372 + 0,1009 Educi + 0,0116 Expi
(0,1264) (0,0085)
(0,0017)
R2 = 0,2219
(1)
donde Ln (si) representa el logaritmo del salario percibido (en euros) por hora
trabajada; Educ son los años de educación y Exp son los años de experiencia laboral
potencial calculados como Expi = edadi – (Educi + 6), siendo edadi la edad del
individuo i-esimo de la muestra.
Posteriormente, para analizar si existe algún tipo de discriminación salarial por razones
de sexo o de afiliación sindical se ha estimado por MCO, con la misma muestra que la
utilizada para el modelo (1), el siguiente modelo:
Ln (si) = 0,56038 + 0,1010 Educi + 0,0117 Expi – 0,2307Mujeri + 0,2108Afili
(0,1207) (0,0081)
(0,0017)
(0,0388)
(0,0504)
(2)
R2 = 0,3062
donde Mujer representa la variable ficticia que vale 1 si la persona i-esima de la muestra
es mujer y 0 si es hombre y Afil es otra variable ficticia que vale 1 si la persona i-esima
está afiliada a algún sindicato y 0 en caso contrario.
A partir de esta información, se pide razonar la verdad o falsedad de las afirmaciones
siguientes. En caso de razonar que son falsas, determine la conclusión correcta.
a) Según el modelo (2), para los mismos niveles de educación y experiencia y el
mismo sexo, se estima que una persona no afiliada a un sindicato gana por hora
un 21,08% menos que una persona afiliada.
b) Según el modelo (2), la diferencia entre el salario percibido por una mujer y un
hombre, para los mismos niveles de educación y experiencia y la misma
situación de afiliación laboral, se estima en 0,2307 euros menos por hora.
c) El contraste de la hipótesis nula: los salarios no difieren significativamente entre
sí ni por razones de sexo no por razones de afiliación sindical, se concreta en
establecer H0: β3 + β4 = 0, siendo β3 el coeficiente que acompaña a la variable
Mujer y β4 el coeficiente que acompaña a la variable Afil.
d) Un investigador comenta que el ha estimado los mismos dos modelos pero
incluyendo la edad como variable explicativa adicional y que ha mejorado la
precisión de los estimadores de los parámetros de posición en el sentido de
disminuir su error estandar.
SOLUCION
a) CIERTA. Como se está planteando un modelo semilogaritmico, el coeficiente de
la ficticia, al multiplicarlo por 100, recoge la variación porcentual en el salario
entre una persona afiliada y otra no afiliada.
b) FALSA. Dado que se está razonando con un modelo semilogaritmico, los
coeficientes no tienen la interpretación de propensiones. La interpretación
correcta sería que, para los mismos niveles de educación y experiencia y la
misma situación de afiliación laboral, la diferencia entre el salario percibido
entre una mujer y un hombre es del 23,07% menos para la primera
2
c) FALSA. La hipótesis nula que plantea el enunciado implica β3 = - β4, es decir,
que el efecto sobre el salario del sexo y de la afiliación es el mismo (aunque
cambiado de signo). La hipótesis que recoge que los salarios no difieren
significativamente entre sí ni por razones de sexo no por razones de afiliación
sindical, se concreta como H0: β3 = 0; β4 = 0.
d) FALSA. Si se incluye la edad como variable explicativa, teniendo en cuenta la
definición de la variable experiencia laboral potencial, se estaría incluyendo
entre las explicativas del modelo una relación lineal exacta, es decir,
colinealidad perfecta lo que no permite estimar de forma única los parámetros de
posición.
PROBLEMA 3
Los datos del cuadro adjunto recogen información de una variable Y para dos grupos
diferenciados de individuos (Grupo 1: i = 1, ... , N1 ; Grupo 2: i = N1 + 1, ... , N1 + N 2 ).
Grupo 1
Grupo 2
100,0000
100,0000
112,8302
105,8264
175,0404
138,5850
296,5499
170,5707
335,3100
193,3413
400,3234
214,7444
427,9245
258,5612
479,1375
282,8775
340,3774
313,2580
234,5553
335,8502
Tras estimar por MCO el modelo:
yi = α + β Di + ui
i = 1, ..... , N1 + N 2
donde Di es una variable ficticia definida de la siguiente manera:
⎧1 i ∈Grupo 1
Di = ⎨
⎩0 i ∈Grupo 2
a) Interprete los coeficientes del modelo en términos de los valores medios de la
variable Y.
3
b) Teniendo en cuenta que de la estimación del modelo resulta α̂ = 211,36147 y
β̂ = 78,8433, Verifique empíricamente las relaciones existentes entre estas
estimaciones y los valores medios muestrales de cada grupo.
c) Contraste la hipótesis de igualdad de medias poblacionales de los dos grupos.
d) Demuestre analíticamente el resultado para β̂ obtenido en el apartado b).
SOLUCION
a) Para interpretar los parámetros consideraremos el valor esperado de la variable
dependiente condicionado a los dos valores que toma la variable Di .
E [ yi | Di = 1] = α + β
E [ yi | Di = 0] = α
De este modo, el término independiente del modelo puede interpretarse como el valor
medio del segundo grupo; mientras que el parámetro β de la regresión representa el
diferencial existente entre las medias poblacionales de ambos grupos.
b) A partir de la información suministrada si se calcula la media muestral del segundo
grupo se verifica que coincide con α̂ ; mientras que la media muestral del segundo
grupo coincide con α̂ + β̂ .
c) El contraste de la hipótesis de igualdad de medias poblacionales supone verificar H0:
β = 0, a través del t-ratio correspondiente.
d) Se parte de la expresión general del estimador MCO de β :
β̂ =
N
N
i =1
N
i =1
N
N
∑ X i2 − X ∑ X i
i =1
N
N
N ∑ X iYi − ∑ X i ∑ Yi
∑ X iYi − X ∑ Yi
i =1
=
i =1
i =1
⎛
⎞
N ∑ X − ⎜ ∑ Xi ⎟
i =1
⎝ i =1 ⎠
N
N
2
2
i
i =1
Al concretar esta expresión para una variable exógena como Di , resulta:
N
β̂ =
N
N
N ∑ DiYi − ∑ Di ∑ Yi
i =1
i =1
i =1
⎛
⎞
N ∑ Di2 − ⎜ ∑ Di ⎟
i =1
⎝ i =1 ⎠
N
N
2
N1
N
i =1
i =1
2
1
N1
N ∑ Yi − N1 ∑ Yi
=
NN1 − ( N
)
N
( N1 + N 2 )∑ Yi − N1 ∑ Yi
=
i =1
NN1 − ( N1 )
i =1
2
N1
N1
N
N1
N
⎛ N1
⎞
N1 ∑ Yi + N 2 ∑ Yi − N1 ⎜ ∑ Yi + ∑ Yi ⎟
N 2 ∑ Yi − N1 ∑ Yi
i =1
i =1
i = N1 +1
⎝ i =1
⎠ =
i =1
i =1
=
2
N1 ( N − N1 )
NN1 − ( N1 )
4
=
N 2 N1Y1 − N1 N 2Y2
= Y1 − Y2
N1 N 2
De este modo, la estimación de la pendiente refleja la diferencia en el valor medio del
primer grupo respecto al segundo.
PROBLEMA 4
El gerente de una empresa desea conocer como se determina la venta de ropa deportiva,
Vi , en función de la renta, Ri , y la edad de los consumidores, Ei , para lo que ha
estimado el siguiente modelo de regresión con una muestra de 50 individuos:
Vˆi = 344,9 + 0,00245 Ri - 7,72 Ei
(72,38)
(0,0006)
R 2 = 0,3401
∑ uˆ
2
í
= 632292
(1)
(2,32)
a) Uno de los consejeros baraja la hipótesis de que la propensión marginal a comprar
ropa de deporte puede depender de la edad, por lo que estima el siguiente modelo con la
muestra disponible:
Vˆi = 164,4 + 0,0091 Ri - 3,15 Ei - 0,00016 ( Ri · Ei )
(120,79) (0,0037) (3,36)
R 2 = 0,3966
∑ uˆ
2
í
= 581822,2
(0,00009)
a.1) ¿Cuál es la propensión marginal a comprar estimada?. ¿Cuál es la propensión
marginal a comprar para un individuo de 50 años?.
a.2) ¿Cuál es el efecto marginal de la edad sobre las ventas?. ¿Cuál es el efecto marginal
de un incremento unitario de la edad para un individuo cuya renta es de 27500 euros?.
¿Y para uno de 48000?.
a.3) ¿Existe evidencia en la muestra para rechazar la hipótesis del gerente?.
b) Otro asesor considera que, dado que los hombres hacen más deporte que las mujeres,
las ventas de ropa deportiva dependerán del sexo del cliente. Con los siguientes
resultados del modelo estimado incluyendo la variable ficticia M i que toma el valor 1 si
el cliente es mujer:
Vˆi = 461,2 + 0,0024 Ri - 8,57 Ei - 169,81 M i
(58,69) (0,00046) (1,76)
R 2 = 0,63489
∑ uˆ
2
í
= 352063
(31,49)
b.1) Interprete los coeficientes del modelo.
5
b.2) ¿Es significativa la variable sexo a la hora de determinar las ventas de ropa
deportiva?.
b.3) Dada la conclusión del apartado anterior, ¿qué puede decir de la calidad de los
estimadores MCO en el modelo dado en (1)?.
c) Para contrastar la hipótesis de que el efecto marginal de la edad sobre las ventas
depende del sexo se ha estimado el siguiente modelo:
Vˆi = 494,8 + 0,0023 Ri - 9,44 Ei - 251,24 M i + 2,44 ( Ei · M i )
(74,03) (0,00047) (2,11)
(112,95) (3,25)
R 2 = 0,6406
∑ uˆ
2
í
= 346477,5
c.1) ¿Cuál es el efecto marginal estimado de la edad sobre las ventas para una mujer?.
¿Y para un hombre?.
c.2) ¿Apoya la muestra la hipótesis planteada?.
c.3) ¿Es significativa la variable sexo?.
d) A pesar del resultado obtenido en el apartado anterior, el gerente sigue pensando que
las ventas de ropa deportiva tienen diferente estructura para los hombres y las mujeres y
que ambos no solo tienen diferente nivel promedio de consumo sino que también
responden de forma diferente ante un incremento de renta o diferentes edades.
Dado que en la muestra hay 25 hombres y 25 mujeres, estima la función de ventas para
cada grupo por separado con los siguientes resultados:
Vˆi =225,5 + 0,0019 Ri - 5,95 Ei i ∈ mujer
∑ uˆ
2
í
= 107659,1
(69,01) (0,00047) (2,32)
Vˆi =491,5 + 0,0029 Ri - 10,26 Ei i ∈hombre
(85,97)
(0,0009)
∑ uˆ
2
í
= 226577,5
(2,59)
d.1) Contraste la hipótesis del gerente.
d.2) Explique otra manera alternativa de hacer el contraste.
e) Dados los resultados obtenidos, ¿con qué modelo se quedaría para determinar las
ventas de ropa de deporte de la empresa?.
SOLUCION
a.1) En el modelo estimado, la propensión marginal a vender estimada viene dada por:
6
∂Vˆi
= 0,0091 – 0,00016 Ei
∂Ri
De modo que la propensión marginal a vender no es constante sino que depende de la
edad del cliente. Así, para un individuo de 50 años tal propensión es:
∂Vˆi
= 0,0091 – 0,00016 · 50 = 0,0011
∂Ri
a.2) El efecto marginal estimado de la edad sobre las ventas es:
∂Vˆi
= -3,15 – 0,00016 Ri
∂Ei
Por tanto la variación estimada en las ventas ante un incremento unitario de la edad no
es constante, sino que depende de la renta del individuo. Así, para un individuo con una
renta de 27500 euros tal efecto es:
∂Vˆi
= -3,15 – 0,00016 · 27500 = - 7,55
∂Ei
a.3) La propensión marginal a comprar ropa depende de la edad si la variable
interacción incluida en el modelo es significativa. Para contrastar esta hipótesis se
utiliza el correspondiente t-ratio, dado por:
t=
−0, 00016
= - 1,78
0, 00009
Como |-1,78| < t0,025 (46) = 2,02 ⇒ hay evidencia para aceptar la hipótesis nula, al nivel
de significación del 5%. Es decir, no hay evidencia en la muestra a favor de la hipótesis
del consejero de que existe efecto interacción entre renta y edad.
b.1) En el modelo estimado resulta:
461, 2 + 0, 0024 Ri − 8,57 Ei
Mi = 0
⎧
Vˆi = ⎨
⎩461, 2 + 0, 0024 Ri − 8,57 Ei − 169,81 M i = 1
Por lo tanto, 461,2 es el consumo autónomo para los hombres, mientras que la
diferencia en la venta de renta deportiva entre hombres y mujeres, manteniéndose
constante la renta y la edad, se estima en –169,81.
La propensión marginal a consumir estimada es 0,0024, manteniéndose todo los demás
constante.
El efecto marginal de la edad, dadas las variables sexo y renta, es –8,57.
b.2) Para verificar la significatividad de la variable sexo se calcula el correspondiente tratio:
7
t=
−169,81
= - 5,39
31, 49
Como |-5,39| > t0,025 (46) = 2,02 ⇒ hay evidencia para no aceptar la hipótesis nula, al
nivel de significación del 5%. Es decir, las ventas dependen del sexo del cliente.
b.3) Suponiendo que el modelo del apartado b) satisface las hipótesis ideales, el
resultado anterior indicaría que en el modelo (1) se ha omitido una variable relevante
como es el sexo por lo que los estimadores obtenidos en dicho modelo resultaran
sesgados y la inferencia realizada no será válida.
c.1) El efecto marginal estimado de la edad sobre las ventas para los hombres es:
∂Vˆi
= - 9,44
∂Ei
y para las mujeres:
∂Vˆi
= - 9,44 + 2,44 = - 7
∂Ei
c.2) La muestra contendrá evidencia para apoyar la hipótesis planteada si el coeficiente
de la variable interacción resulta estadísticamente significativo. Calculando el
correspondiente t-ratio, se obtiene:
t=
2, 44
= -0,75
3, 25
Como 0,75 < t0,025 (45) = 2,02 ⇒ hay evidencia para aceptar la hipótesis nula, al nivel
de significación del 5%. Es decir, no hay efecto interacción entre sexo y edad.
c.3) La significatividad de la variable sexo se analiza planteando la hipótesis de que su
coeficiente y el de la variable interacción son conjuntamente igual a cero. Utilizando el
contraste F de diferencia de sumas residuales se tiene en cuenta que el modelo
restringido es el planteado inicialmente. Por tanto:
F=
(632292 − 346477,5) / 2
= 18,56
346477,5 / 45
Como 18,56 > F0,05 (2, 45) = 3,23 ⇒ hay evidencia para no aceptar la hipótesis nula, al
nivel de significación del 5%. Es decir, las ventas dependen del sexo del cliente.
d.1) Para contrastar la hipótesis de estabilidad de los coeficientes a lo largo de la
muestra, se puede utilizar el contraste de Chow que, en este caso, trata de verificar:
H0: β 0M = β 0H = β 0 y β1M = β1H = β1 y β 2M = β 2H = β 2
HA: No H0
8
El estadístico de contrate viene dado por:
F=
[uˆ R′ uˆR − (uˆM′ uˆM + uˆH′ uˆH ) / 3
(uˆM′ uˆM + uˆ ′H uˆH ) / 50 − (2·3)
donde uˆ ′R uˆ R es la suma residual del modelo que asume estabilidad, es decir, el modelo
recogido en (1); mientras que las otras sumas residuales se refieren a las resultantes
delas regresiones que se efectúan por separado entre hombres y mujeres. Sustituyendo
por la información disponible, resulta:
F=
[632292 − (107659,1 + 226577,5) / 3
= 13,08
(107659,1 + 226577,5) / 44
Como 13,08 > F0,05 (3, 44) = 2,84 ⇒ hay evidencia para no aceptar la hipótesis nula, al
nivel de significación del 5%. Es decir, las regresiones para hombres y mujeres no son
equivalentes.
d.2) Una forma equivalente de plantear este contraste sería utilizando variables ficticias,
es decir, planteando el modelo:
Vi = β 0 + γ 0 M i + β1 Ri + γ 1 ( Ri · M i ) + β 2 Ei + γ 2 ( Ei · M i ) + ui
(2)
Teniendo en cuenta que:
E [ Vi | M i = 0] = β 0 + β1 Ri + β 2 Ei
E [ Vi | M i = 1] = ( β 0 + γ 0 ) + ( β1 + γ 1 ) Ri + ( β 2 + γ 2 ) Ei
La hipótesis de que la función de ventas es la misma para mujeres y hombres se
concreta, ahora, en contrastar:
H0: γ 0 = γ 1 = γ 2 = 0
HA: No H0
El contraste se llevaría a cabo a través del estadístico F de diferencia de sumas
residuales, siendo ahora el modelo restringido el modelo dado en (1) y el modelo no
restringido el expresado en (2).
e) El modelo apropiado para las ventas de ropa deportiva de esta empresa es el modelo
planteado en el apartado d) en el que las ventas se determinan en función de la edad y la
renta, con estructuras diferentes para hombres y mujeres.
9
PROBLEMA 5
Se trata de estudiar la relación entre el precio alcanzado en las subastas (y) y la cantidad
total ofrecida de carne de vacuno (x), utilizando datos semanales. Especifique el modelo
econométrico, suponiendo linealidad, que mejor se ajuste al planteamiento siguiente: la
reacción del precio con respecto al volumen ofertado de carne de vacuno parece
diferente en aquellas semanas en las que se producen importaciones de carne de
porcino.
SOLUCION
Para recoger el comportamiento planteado se define una variable ficticia denominada
Impor tal que valdrá 1 en aquellas semanas que se produzca importación y 0 en el resto
de semanas. El modelo econométrico será:
yt = α + βxt + γ (Import · xt) + ut
Para comprobar que tal modelo recoge adecuadamente el planteamiento efectuado, se
calculan las líneas de regresión poblacional correspondientes a las semanas con
importación y a las semanas sin importación, esto es:
E [yt | Import = 1] = α + βxt + γ xt = α + (β + γ) xt
E [yt | Import = 0] = α + βxt = α + β xt
Con lo cual, la reacción el precio ante el volumen ofertado de carne de vacuno será β en
las semanas que no hay importación y (β + γ) en las semanas en las que se produce
importación.
10
PROBLEMAS PROPUESTOS
PROBLEMA 1
Se ha estimado una función de consumo de la economía española para el periodo 19711995 con los siguientes resultados:
M0: Ĉ t = 40,63 + 0,72 Yt
SR = 110
También se han resuelto estas otras estimaciones:
SR = 88
M1: Ĉ t = 38,59 +0,62 Yt + 0,15 Z t
M2: Ĉ t = 48,23 – 12,94 Dt + 0,68 Yt
SR = 100
M3: Ĉ t = 45,63 –8,34 Dt +0,65 Yt + 0,10 Z t
SR = 85
donde Dt =1 para t > 1985 y cero en otro caso, tratando de recoger la entrada de España
en la Comunidad Económica Europea. Además, Z t = Yt · Dt . Especifique y resuelva las
siguientes hipótesis:
1.1. La entrada de la economía española en la CEE ocasionó una ruptura
total de la estructura en el comportamiento de la función de consumo.
1.2. La entrada de la economía española en la CEE solo afectó a la
distribución entre consumo y ahorro de una unidad adicional de renta.
1.3. La escala de la función de consumo fue el único elemento afectado por
la adhesión a la CEE.
PROBLEMA 2
Con objeto de analizar las diferencias salariales entre los empleados de una empresa, se
ha tomado una muestra de 500 empleados de los cuales 300 son licenciados.
Especifique el modelo que le permita contrastar si existe diferencia salarial entre los
licenciados y los no licenciados. Plantee la hipótesis a contrastar y el estadístico que
utilizaría para resolver el contraste.
PROBLEMA 3
Para analizar la relación entre las ventas de helados, yt , y la temperatura de una
determinada ciudad costera, xt , se han utilizado 100 datos diarios de ambas variables
para el año 2002 y se han estimado las siguientes rectas de regresión:
M1: yˆt = 1663,6 + 0,75 xt
(0,028)
R 2 = 0,878
M2 : yˆt = 186,12 + 0,82 xt + 832,09 Dt
(0,049) (32,82)
R 2 = 0,984
11
M3: yˆt = 709,18+ 0,79 xt + 0,05 Dt xt
(0,044) (0,002)
R 2 = 0,983
M4: yˆt = -184,7 + 0,83 xt + 1757,99 Dt - 0,06 Dt xt
(0,062) (491,37)
(0,024)
R 2 = 0,985
donde Dt es una variable ficticia que toma el valor 1 si t es un día de verano y 0 en caso
contrario.
a) Interprete los coeficientes del modelo M4.
b) Contraste si el ser verano o no es un factor explicativo de la variable ventas de
helados.
c) Contraste si el efecto marginal de un incremento unitario en la temperatura sobre
las ventas de helados es diferente según sea verano o no.
d) Contraste la hipótesis de que las ventas de helados son totalmente
independientes del hecho de estar o no en verano.
PROBLEMA 4
Dado un modelo de regresión simple yt = α + β xt + ut, para el que se dispone de 40
observaciones temporales, se considera que existe una ruptura estructural en el periodo
15 que afecta a los dos parámetros de posición. Para especificar un modelo que tenga en
cuenta este hecho se definen dos ficticias D1t y D2t de la siguiente forma:
⎧1 t = 1,...,15
⎧0 t = 1,...,15
D1t = ⎨
D2t = ⎨
⎩0 t = 16,..., 40
⎩1 t = 16,..., 40
Indique cuál o cuáles de las siguientes especificaciones pueden considerarse adecuadas
para tener en cuenta la ruptura. Razone en cada caso su respuesta, tanto si cree que la
especificación es adecuada como si piensa lo contrario.
a) yt = α1 + β1 xt + α2 D2t + β2 (D1t · xt ) + β3 (D2t · xt ) + ut
b) yt = α1 D1t + α2 D2t + β1 xt + β2 (D1t · xt ) + ut
c) yt = α1 D1t + α2 D2t + β1 (D1t · xt ) + β2 (D2t · xt ) + ut
d) yt = α0 + α1 D1t + α2 D2t + β1 xt + β2 (D2t · xt ) + ut
12