Medidas de asociación lineal y el modelo lineal con dos variables

Medidas de asociación lineal
y el modelo lineal con dos variables
Mariana Marchionni
[email protected]
Mariana Marchionni
El modelo lineal con dos variables
1 / 28
Introducción
Nos interesa la relación entre dos variables económicas
Naturaleza social de los fenómenos económicos:
Relaciones no exactas
Fenómenos complejos (muchas unidades decisorias, alto grado
de interacción)
Datos observacionales (6= experimentales)
Mariana Marchionni
El modelo lineal con dos variables
2 / 28
La relación entre 2 variables económicas grácamente
¾En qué sentido decimos que hay una relación entre Y y X?
¾Cómo podemos caracterizarla?
Mariana Marchionni
El modelo lineal con dos variables
3 / 28
En la clase de hoy
1
Medidas de asociación lineal
2
El modelo lineal con dos variables
Mariana Marchionni
El modelo lineal con dos variables
4 / 28
Medidas de asociación lineal: covarianza y correlación
Objetivos:
Caracterizar la relación entre dos variables Y y X
Medir la dirección (positiva o negativa) y la fuerza de esa
relación
Datos: realización de una muestra aleatoria
i
(Y i , Xi )
con
= 1, ...N
Mariana Marchionni
El modelo lineal con dos variables
5 / 28
Ejemplos
Mariana Marchionni
El modelo lineal con dos variables
6 / 28
Las fórmulas
Covarianza muestral
N
X
Cov
(Y , X ) = i =1
Yi
−Y
N
Xi
−X
−1
Coeciente de correlación muestral
r
donde
σY =
PN
i =1
Yi
rY ,X
=
−Y
2
N −1
Mariana Marchionni
(Y , X )
σY σX
r
Cov
y
σX =
PN
i =1
Xi
−X
2
N −1
El modelo lineal con dos variables
7 / 28
Propiedades de la covarianza y la correlación
Simetría
Cov (Y , X )
= Cov (X , Y )
y rY ,X
= rX ,Y
El signo de la covarianza es igual al signo de la correlación.
El signo indica la dirección de la asociación. ¾Por qué?.
Mariana Marchionni
El modelo lineal con dos variables
8 / 28
Mariana Marchionni
El modelo lineal con dos variables
9 / 28
Propiedades de la covarianza y la correlación
La covarianza depende de las unidades de medida, pero la
correlación no.
Sean a y b constantes positivas:
Cov (aY , bX )
raY ,aX
= a.b.Cov (Y , X )
= rX ,Y
Esto último implica una ventaja del coeciente de correlación
muestral.
Mariana Marchionni
El modelo lineal con dos variables
10 / 28
Propiedades de la covarianza y la correlación
Además, el coeciente de correlación
es menor o igual a 1 en valor absoluto:
−1 ≤ rY ,X ≤ 1
es igual a 1 sólo cuando existe una relación lineal exacta y
directa entre las variables Y y X :
rY ,X
= 1 ⇒ Yi = α + β Xi
= 1, ...N
para algún
α
y
β>0
y para todo i
es igual a -1 sólo cuando existe una relación lineal exacta e
indirecta entre las variables Y y X :
rY ,X
= −1 ⇒ Yi = α + β Xi
= 1, ...N
para algún
α
y
β<0
y para todo i
Mariana Marchionni
El modelo lineal con dos variables
11 / 28
Ejemplos
Mariana Marchionni
El modelo lineal con dos variables
12 / 28
La correlación sólo mide relaciones lineales
Si no hay relación
Mariana Marchionni
⇒r =0
El modelo lineal con dos variables
13 / 28
La correlación sólo mide relaciones lineales
La recíproca no se cumple: r
Que r
=0
=0 ;
que no haya relación
implica únicamente que no hay relación lineal
(pero puede haber alguna relación no lineal)
Mariana Marchionni
El modelo lineal con dos variables
14 / 28
Correlación no implica causalidad
Ejemplo: relación entre la inversión en ciencia y tecnología (CyT) y
el crecimiento de un país
Resultado empírico: están correlacionadas positivamente
Hay que invertir en CyT para que el país crezca?
O cuando el país crece se invierte más en CyT?
El coeciente de correlación no responde.
Mariana Marchionni
El modelo lineal con dos variables
15 / 28
El modelo lineal con dos variables
Objetivo: modelar una relación lineal no exacta entre Y y X .
Modelo propuesto:
Yi
= α + β Xi + µ i
i
= 1, ..., N
Y i : variable explicada o dependiente. Observable.
X i : variable explicativa. Observable.
α
y
µi :
β:
parámetros desconocidos.
representa a todas las variables inobservables. Lo
consideramos como un término aleatorio.
Supondremos que E
(µi ) = 0
Datos: realización de la muestra aleatoria
(Y i , Xi )
i
= 1, ..., N
Mariana Marchionni
El modelo lineal con dos variables
16 / 28
La función de regresión
La función
α + β Xi
es conocida como función de regresión y
representa la parte sistemática de la relación.
El término aleatorio
µi
representa la parte no sistemática
(aleatoriedad).
Interpretación
Es como si Y i se determinase en dos pasos. Dado un valor de
X
= X0
1
La parte sistemática es
2
El verdadero valor de Y i es la parte sistemática más un
α + β X0
término aleatorio.
Mariana Marchionni
El modelo lineal con dos variables
17 / 28
La función de regresión
La función
α + β Xi
es conocida como función de regresión y
representa la parte sistemática de la relación.
El término aleatorio
µi
representa la parte no sistemática
(aleatoriedad).
Interpretación
Es como si Y i se determinase en dos pasos. Dado un valor de
X
= X0
1
La parte sistemática es
2
El verdadero valor de Y i es la parte sistemática más un
α + β X0
término aleatorio.
Mariana Marchionni
El modelo lineal con dos variables
17 / 28
Grácamente
(Y i , Xi ) se determina
α + β Xi
shock aleatorio (µi )
Cada uno de los N puntos
por
un valor sobre la recta
más/menos un
Mariana Marchionni
El modelo lineal con dos variables
18 / 28
Ejemplo: consumo de las familias
Datos de N familias.
Xi es el ingreso de la familia i .
Y i es el consumo de la familia i .
µi
son factores no observables que afectan al consumo de la
familia i .
β?
Mariana Marchionni
El modelo lineal con dos variables
19 / 28
El rol de µi
Si
µi = 0,
la relación entre Y y X es perfectamente lineal
(determinística).
µi
representa al conjunto de factores no observable que
afectan a Y i .
Heterogeneidad no observable .
Si E
(µi ) = 0,
E
(Y i ) = α + β Xi .
La relación es lineal en
promedio.
Lo aleatorio como representación de lo no exacto.
Mariana Marchionni
El modelo lineal con dos variables
20 / 28
El rol de β
β
contiene información muy importante:
E
(Y i ) = α + β Xi
Entonces, si es posible mover X marginalmente:
dE (Y i )
dXi = β
β
para todo i
contiene información cuantitativa y cualitativa acerca de
cómo X afecta a Y.
β
mide en cuánto cambia Y ante cambios marginales en X, en
promedio: efecto marginal
Las unidades de medida son cruciales
Vale la regla de tres : si X aumenta en m unidades, Y
aumenta en m β veces las unidades en las que Y esta medido.
Mariana Marchionni
El modelo lineal con dos variables
21 / 28
Ejemplo: consumo de las familias (cont.)
Supongamos otra vez nuestro modelo Y i
= α + β Xi + µ i
Supongamos que el consumo y el ingreso de las familias están
medidos en pesos y que
β = 0.8
Cuando el ingreso de una familia aumenta en una unidad (en
este caso $1), el valor esperado de su consumo aumenta en
$0.8
¾Y si el consumo y el ingreso estuviesen medidos en miles de
pesos?
Errores de interpretación comunes (por omisión o trivialidad)
Cuando
Cuando
X aumenta, Y aumenta (trivial).
X aumenta, Y aumenta en 0.8 (¾en cuánto aumenta
X?, ¾0.8 qué?)
Mariana Marchionni
El modelo lineal con dos variables
22 / 28
¾Por qué un modelo lineal?
Puede ser que los datos sugieran una relación no lineal entre las
variables
Mariana Marchionni
El modelo lineal con dos variables
23 / 28
Candidato 2: modelo logarítmico (log-log)
Yi
donde A y
β
= AX βi exp (µi )
son parámetros desconocidos.
Interpretación de
β
Aplicamos una transformación logarítmica:
lnY i
= lnA + β lnX i + µi
Entonces, si µi se mantiene
β=
β
constante cuando Xi cambia:
dlnY i
dlnX i
∼
=
4Yi/Yi
4Xi/Xi
es una elasticidad: porcentaje en el que cambia Y ante un
aumento de un 1% en X .
Mariana Marchionni
El modelo lineal con dos variables
24 / 28
Ejemplo: modelo de demanda logarítmica
Qi
= AP βi exp (µi )
con
β = −0.5
Cuando el precio aumenta en 1%, la demanda cae en 0.5%.
En este tipo de modelo las unidades de medida no importan,
ya que los cambios son porcentuales.
Cuidado con los errores de interpretación.
Mariana Marchionni
El modelo lineal con dos variables
25 / 28
Candidato 3: modelo semi-logarítmico (log-lin)
Yi
donde
α
y
β
= exp (α + β Xi + µi )
son parámetros desconocidos.
Interpretación de
β
Aplicamos una transformación logarítmica:
lnY i
= α + β X i + µi
Entonces, si µi se mantiene
β=
β
constante cuando Xi cambia:
dlnY i
dX i
es una semielasticidad:
∼
=
4Yi/Yi
β ∗ 100
4Xi
es el porcentaje en el que
cambia Y cuando X aumenta en una unidad.
Mariana Marchionni
El modelo lineal con dos variables
26 / 28
Ejemplo: modelo semilogarítmico de salarios y educación
Wi
= exp (α + β edui + µi )
con
β = 0.07
Supongamos que los salarios están medidos en pesos por mes,
y la educación en años.
Cuando la educación aumenta en un año, los ingresos
aumentan en 7% (0.07x100%).
En este tipo de modelo las unidades de medida de Y no
importan, ya que los cambios son porcentuales, pero sí las de
X.
Cuidado con los errores de interpretación.
Mariana Marchionni
El modelo lineal con dos variables
27 / 28
Vamos cerrando...
Existen varios modelos no lineales, los veremos a lo largo del
curso.
También discutiremos criterios acerca de cual utilizar.
En la próxima clase nos vamos a concentrar en cómo estimar
los parámetros desconocidos del modelo lineal con dos
variables.
Mariana Marchionni
El modelo lineal con dos variables
28 / 28