Trabajo de Modelos Lineales 1 Regresión Lineal Simple

Trabajo de Modelos Lineales
1 Regresión Lineal Simple
Todos los ejercicios se refieren al modelo Y = β0 + β1 X + ϵ.
1. En el modelo lineal dado, ¿qué representa el término del error?.
2. Encuentre los estimadores de mı́nimos cuadrados para β0 y β1 .
3. Diga si los siguientes enunciados son verdaderos o falsos:
(a) Los estimadores de mı́nimos cuadrados son lineales.
(b) Los estimadores de mı́nimos cuadrados son sesgados.
(c) Ŷ = b0 + b1 X1 , es el estimador lineal insesgado de menor varianza de Y de
entre todos los estimadores lineales de Y .
(d) La recta de regresión pasa por el punto (x, y).
(e) Un alto valor del coeficiente de determinación R2 es suficiente para medir la
adecuación del modelo.
(f) Se asume que los errores tienen: linealidad, igualdad de varianzas, no correlación y normalidad.
(g) Los residuos estandarizados siguen una ley normal N (0, 1).
4. ¿Qué mide el coeficiente de determinación R2 ?
5. Estudie la Utilidad Neta (UTI) en dólares en función de las ventas (VEN) en
dólares, de una industria atunera ecuatoriana (puede usar cualquier paquete estadı́stico). Los datos mensuales desde enero de 2001 hasta abril de 2004 son:
i
1
2
3
4
5
6
7
8
9
10
UTI
6017
8049
8551
6720
7391
8045
5814
4954
5564
7160
VEN
13270
17127
17814
16000
18026
17877
13214
10321
12365
15235
i
11
12
13
14
15
16
17
18
19
20
UTI
7345
8333
5241
4606
6744
5274
8331
4710
5297
6440
VEN
15301
19841
12782
10236
15326
10987
18512
10020
11036
15333
i
21
22
23
24
25
26
27
28
29
30
UTI
7333
8306
6781
7254
5969
5008
8979
6437
7672
8146
VEN
17885
18458
15412
15112
13265
10654
18706
15327
18103
18102
i
31
32
33
34
35
36
37
38
39
40
UTI
4664
8151
5206
9088
5388
4437
4552
8093
6495
8812
(a) Realice un gráfico de dispersión (X-Y).
(b) Encuentre la recta de regresión correspondiente al modelo lineal.
1
VEN
10600
16981
11568
19712
11225
10564
11103
17984
15104
18749
(c) Grafique la recta de regresión (junto con el gráfico de dispersión)
(d) Calcule las varianzas de los estimadores (expresada en función de la la varianza
de Y , σ 2 ).
(e) Calcule el error estándar de los estimadores.
(f) Si las ventas se incrementan en un dólar, ¿en cuánto se incrementa la utilidad
neta?
(g) ¿Se puede decir que la utilidad media es el 44% de las ventas?
(h) ¿Se puede decir que si las ventas son nulas, la utilidad neta promedio es
137.09?
(i) Encuentre intervalos de confianza de nivel 95% para los estimadores del modelo.
(j) Realice pruebas de hipótesis para H0 : β̂0 = 0 y para H0 : β̂1 = 0
(k) Calcule e interprete R2 .
(l) Grafique los residuos ϵi versus los valores estimados Yi
(m) Grafique los residuos ϵi versus los datos Xi
(n) Comente los dos gráficos anteriores y haga un análisis tan completo como le
sea posible de los residuos.
(o) Escriba la tabla ANOVA
(p) Calcule la razón F y compare con el fractil 95 de la correspondiente ley. ¿Qué
decisión tomarı́a con respecto a la significación de la regresión?
(q) Con toda la información de los literales anteriores, determine el modelo definitivo que expresa la utilidad neta en función de las ventas.
(r) ¿Cuál será la utilidad cuando las ventas asciendan a 21000?. Dé un intervalo
de confianza del 95% para su predicción.
(s) ¿Cuál será la utilidad media cuando las ventas asciendan a 21000?. Dé un
intervalo de confianza del 95% para su predicción.
6. Para tratar de explicar el salario (en dólares) en función del PIB (en miles de
dólares), se cuenta con datos trimestrales, desde el primer trimestre de 1994 hasta
el segundo trimestre de 2002. Fuente Banco Central del Ecuador. Haga un análisis
sobre la relación entre las dos variables indicando si es que posible explicarla con
un modelo lineal (puede usar cualquier paquete estadı́stico).
2
Año
1994
1995
1996
Tri.
1
2
3
4
1
2
3
4
1
2
3
4
Salario
82.67
76.70
97.23
92.77
104.57
98.50
107.80
103.37
115.77
109.17
118.00
111.47
PIB
4394.68
4077.48
5169.06
4931.61
5098.05
4802.27
5255.69
5039.54
5415.38
5109.47
5522.91
5217.12
Año
1997
1998
1999
Tri.
1
2
3
4
1
2
3
4
1
2
3
4
Salario
113.40
107.23
111.83
106.00
105.47
96.80
101.70
102.67
99.80
86.60
93.30
83.33
PIB
6112.83
5780.42
6028.38
5713.93
6031.58
5535.94
5816.17
5871.45
4583.92
3977.63
4285.37
3827.59
Año
2000
2001
2002
Tri.
1
2
3
4
1
2
3
4
1
2
Salario
70.10
87.23
100.27
91.75
102.57
98.13
96.60
92.90
103.10
100.03
7. Suponga que el verdadero modelo que explica la variable Y está dado por
Yi = β0 + β1 Xi + β2 Xi2 + ϵi
sin embargo, Y se ha ajustado al modelo
Yi = α0 + α1 Xi + µi
¿Qué esperarı́a encontrar en su análisis del modelo lineal ajustado que le indique
que el modelo está mal especificado?
8. Las calificaciones de un grupo de nueve estudiantes en un trabajo de mitad de
curso X y en el examen final Y son las siguientes:
X
Y
77
82
50
66
71
78
72
34
81
47
94
85
96
99
99
99
67
68
Sin usar un paquete estadı́stico, conteste las siguientes preguntas:
(a) Encuentre la recta de regresión lineal.
(b) Escriba la tabla ANOVA. Calcule R2 . ¿Qué puede decir de la bondad de
ajuste?
(c) Encuentre intervalos de confianza de nivel 95% para los coeficientes de la recta
de regresión, pruebe su nulidad.
(d) ¿Cuál es el intervalo de confianza del 95% para la calificación final de un
estudiante que obtuvo 85 en el trabajo de mitad de curso?.
(e) Haga un análisis tan completo como le sea posible de los residuos.
3
PIB
3197.22
3978.67
4573.11
4184.67
5526.32
5287.45
5204.83
5005.48
6117.48
5935.52