Medidas de asociación lineal y el modelo lineal con dos variables Mariana Marchionni [email protected] Mariana Marchionni El modelo lineal con dos variables 1 / 28 Introducción Nos interesa la relación entre dos variables económicas Naturaleza social de los fenómenos económicos: Relaciones no exactas Fenómenos complejos (muchas unidades decisorias, alto grado de interacción) Datos observacionales (6= experimentales) Mariana Marchionni El modelo lineal con dos variables 2 / 28 La relación entre 2 variables económicas grácamente ¾En qué sentido decimos que hay una relación entre Y y X? ¾Cómo podemos caracterizarla? Mariana Marchionni El modelo lineal con dos variables 3 / 28 En la clase de hoy 1 Medidas de asociación lineal 2 El modelo lineal con dos variables Mariana Marchionni El modelo lineal con dos variables 4 / 28 Medidas de asociación lineal: covarianza y correlación Objetivos: Caracterizar la relación entre dos variables Y y X Medir la dirección (positiva o negativa) y la fuerza de esa relación Datos: realización de una muestra aleatoria i (Y i , Xi ) con = 1, ...N Mariana Marchionni El modelo lineal con dos variables 5 / 28 Ejemplos Mariana Marchionni El modelo lineal con dos variables 6 / 28 Las fórmulas Covarianza muestral N X Cov (Y , X ) = i =1 Yi −Y N Xi −X −1 Coeciente de correlación muestral r donde σY = PN i =1 Yi rY ,X = −Y 2 N −1 Mariana Marchionni (Y , X ) σY σX r Cov y σX = PN i =1 Xi −X 2 N −1 El modelo lineal con dos variables 7 / 28 Propiedades de la covarianza y la correlación Simetría Cov (Y , X ) = Cov (X , Y ) y rY ,X = rX ,Y El signo de la covarianza es igual al signo de la correlación. El signo indica la dirección de la asociación. ¾Por qué?. Mariana Marchionni El modelo lineal con dos variables 8 / 28 Mariana Marchionni El modelo lineal con dos variables 9 / 28 Propiedades de la covarianza y la correlación La covarianza depende de las unidades de medida, pero la correlación no. Sean a y b constantes positivas: Cov (aY , bX ) raY ,aX = a.b.Cov (Y , X ) = rX ,Y Esto último implica una ventaja del coeciente de correlación muestral. Mariana Marchionni El modelo lineal con dos variables 10 / 28 Propiedades de la covarianza y la correlación Además, el coeciente de correlación es menor o igual a 1 en valor absoluto: −1 ≤ rY ,X ≤ 1 es igual a 1 sólo cuando existe una relación lineal exacta y directa entre las variables Y y X : rY ,X = 1 ⇒ Yi = α + β Xi = 1, ...N para algún α y β>0 y para todo i es igual a -1 sólo cuando existe una relación lineal exacta e indirecta entre las variables Y y X : rY ,X = −1 ⇒ Yi = α + β Xi = 1, ...N para algún α y β<0 y para todo i Mariana Marchionni El modelo lineal con dos variables 11 / 28 Ejemplos Mariana Marchionni El modelo lineal con dos variables 12 / 28 La correlación sólo mide relaciones lineales Si no hay relación Mariana Marchionni ⇒r =0 El modelo lineal con dos variables 13 / 28 La correlación sólo mide relaciones lineales La recíproca no se cumple: r Que r =0 =0 ; que no haya relación implica únicamente que no hay relación lineal (pero puede haber alguna relación no lineal) Mariana Marchionni El modelo lineal con dos variables 14 / 28 Correlación no implica causalidad Ejemplo: relación entre la inversión en ciencia y tecnología (CyT) y el crecimiento de un país Resultado empírico: están correlacionadas positivamente Hay que invertir en CyT para que el país crezca? O cuando el país crece se invierte más en CyT? El coeciente de correlación no responde. Mariana Marchionni El modelo lineal con dos variables 15 / 28 El modelo lineal con dos variables Objetivo: modelar una relación lineal no exacta entre Y y X . Modelo propuesto: Yi = α + β Xi + µ i i = 1, ..., N Y i : variable explicada o dependiente. Observable. X i : variable explicativa. Observable. α y µi : β: parámetros desconocidos. representa a todas las variables inobservables. Lo consideramos como un término aleatorio. Supondremos que E (µi ) = 0 Datos: realización de la muestra aleatoria (Y i , Xi ) i = 1, ..., N Mariana Marchionni El modelo lineal con dos variables 16 / 28 La función de regresión La función α + β Xi es conocida como función de regresión y representa la parte sistemática de la relación. El término aleatorio µi representa la parte no sistemática (aleatoriedad). Interpretación Es como si Y i se determinase en dos pasos. Dado un valor de X = X0 1 La parte sistemática es 2 El verdadero valor de Y i es la parte sistemática más un α + β X0 término aleatorio. Mariana Marchionni El modelo lineal con dos variables 17 / 28 La función de regresión La función α + β Xi es conocida como función de regresión y representa la parte sistemática de la relación. El término aleatorio µi representa la parte no sistemática (aleatoriedad). Interpretación Es como si Y i se determinase en dos pasos. Dado un valor de X = X0 1 La parte sistemática es 2 El verdadero valor de Y i es la parte sistemática más un α + β X0 término aleatorio. Mariana Marchionni El modelo lineal con dos variables 17 / 28 Grácamente (Y i , Xi ) se determina α + β Xi shock aleatorio (µi ) Cada uno de los N puntos por un valor sobre la recta más/menos un Mariana Marchionni El modelo lineal con dos variables 18 / 28 Ejemplo: consumo de las familias Datos de N familias. Xi es el ingreso de la familia i . Y i es el consumo de la familia i . µi son factores no observables que afectan al consumo de la familia i . β? Mariana Marchionni El modelo lineal con dos variables 19 / 28 El rol de µi Si µi = 0, la relación entre Y y X es perfectamente lineal (determinística). µi representa al conjunto de factores no observable que afectan a Y i . Heterogeneidad no observable . Si E (µi ) = 0, E (Y i ) = α + β Xi . La relación es lineal en promedio. Lo aleatorio como representación de lo no exacto. Mariana Marchionni El modelo lineal con dos variables 20 / 28 El rol de β β contiene información muy importante: E (Y i ) = α + β Xi Entonces, si es posible mover X marginalmente: dE (Y i ) dXi = β β para todo i contiene información cuantitativa y cualitativa acerca de cómo X afecta a Y. β mide en cuánto cambia Y ante cambios marginales en X, en promedio: efecto marginal Las unidades de medida son cruciales Vale la regla de tres : si X aumenta en m unidades, Y aumenta en m β veces las unidades en las que Y esta medido. Mariana Marchionni El modelo lineal con dos variables 21 / 28 Ejemplo: consumo de las familias (cont.) Supongamos otra vez nuestro modelo Y i = α + β Xi + µ i Supongamos que el consumo y el ingreso de las familias están medidos en pesos y que β = 0.8 Cuando el ingreso de una familia aumenta en una unidad (en este caso $1), el valor esperado de su consumo aumenta en $0.8 ¾Y si el consumo y el ingreso estuviesen medidos en miles de pesos? Errores de interpretación comunes (por omisión o trivialidad) Cuando Cuando X aumenta, Y aumenta (trivial). X aumenta, Y aumenta en 0.8 (¾en cuánto aumenta X?, ¾0.8 qué?) Mariana Marchionni El modelo lineal con dos variables 22 / 28 ¾Por qué un modelo lineal? Puede ser que los datos sugieran una relación no lineal entre las variables Mariana Marchionni El modelo lineal con dos variables 23 / 28 Candidato 2: modelo logarítmico (log-log) Yi donde A y β = AX βi exp (µi ) son parámetros desconocidos. Interpretación de β Aplicamos una transformación logarítmica: lnY i = lnA + β lnX i + µi Entonces, si µi se mantiene β= β constante cuando Xi cambia: dlnY i dlnX i ∼ = 4Yi/Yi 4Xi/Xi es una elasticidad: porcentaje en el que cambia Y ante un aumento de un 1% en X . Mariana Marchionni El modelo lineal con dos variables 24 / 28 Ejemplo: modelo de demanda logarítmica Qi = AP βi exp (µi ) con β = −0.5 Cuando el precio aumenta en 1%, la demanda cae en 0.5%. En este tipo de modelo las unidades de medida no importan, ya que los cambios son porcentuales. Cuidado con los errores de interpretación. Mariana Marchionni El modelo lineal con dos variables 25 / 28 Candidato 3: modelo semi-logarítmico (log-lin) Yi donde α y β = exp (α + β Xi + µi ) son parámetros desconocidos. Interpretación de β Aplicamos una transformación logarítmica: lnY i = α + β X i + µi Entonces, si µi se mantiene β= β constante cuando Xi cambia: dlnY i dX i es una semielasticidad: ∼ = 4Yi/Yi β ∗ 100 4Xi es el porcentaje en el que cambia Y cuando X aumenta en una unidad. Mariana Marchionni El modelo lineal con dos variables 26 / 28 Ejemplo: modelo semilogarítmico de salarios y educación Wi = exp (α + β edui + µi ) con β = 0.07 Supongamos que los salarios están medidos en pesos por mes, y la educación en años. Cuando la educación aumenta en un año, los ingresos aumentan en 7% (0.07x100%). En este tipo de modelo las unidades de medida de Y no importan, ya que los cambios son porcentuales, pero sí las de X. Cuidado con los errores de interpretación. Mariana Marchionni El modelo lineal con dos variables 27 / 28 Vamos cerrando... Existen varios modelos no lineales, los veremos a lo largo del curso. También discutiremos criterios acerca de cual utilizar. En la próxima clase nos vamos a concentrar en cómo estimar los parámetros desconocidos del modelo lineal con dos variables. Mariana Marchionni El modelo lineal con dos variables 28 / 28
© Copyright 2024