ANOVA MULTIGRUPO O DE MEDIDAS REPETIDAS Profesora: Carolina Mora Análisis de Varianza intragrupo o ANOVA para muestras relacionadas • En este modelo de análisis de varianza tenemos los mismos sujetos con observaciones o puntuaciones en la misma variable pero en condiciones distintas (por ejemplo: la efectividad de un procedimiento para mejorar la memoria en tras condiciones distintas: sin estrés, con bajo estrés y con alto estrés) • o los mismos sujetos en la misma condición pero en tiempos distintos. Por ejemplo, medir el nivel de aprendizaje, antes (preprueba), después de aplicar un tratamiento (postprueba) y a los 3 meses (seguimiento) Como se trata de los mismos sujetos tenemos muestras relacionadas o emparejadas • También puede tratarse de sujetos físicamente distintos pero igualados en variables relevantes (variables que controlamos con esta igualación. Ventajas del ANOVA para muestras relacionadas Una ventaja de utilizar a los mismos sujetos en tratamientos experimentales es que necesitaremos menos sujetos que si se trata de muestras independientes Planteamientos que se pueden analizar mediante el ANOVA INTRAGRUPOS 1º Cuando los mismos sujetos van a pasar por una serie de tratamientos experimentales. La variable dependiente, es siempre la misma (medidas repetidas), por ejemplo distintos métodos, ejercicios, etc.: el aprendizaje previo, el cansancio, etc., de una ocasión puede estar influyendo en los resultados de la ocasión siguiente?. Este problema (derivado del orden en el que los sujetos pasan por las distintas experiencias) puede resolverse de dos maneras: a. Mediante diseños equilibrados (counter balanced): los sujetos pasan por los distintos tratamientos en un orden distinto, para neutralizar o minimizar los efectos del aprendizaje previo, cansancio, etc. b. Utilizando sujetos distintos en cada condición, pero igualados en características importantes (como podrían ser sexo, edad, rendimiento previo, etc.). 2º Este modelo de análisis de varianza suele presentarse en el contexto de los diseños experimentales (los mismos sujetos pasan por diversas condiciones o experiencias), pero presentar este modelo de análisis de varianza en referencia únicamente a diseños experimentales, es de hecho muy restrictiva porque puede dejar fuera de nuestra atención otras posibilidades de interés y además muy sencillas y asequibles. Si los mismos sujetos valoran (por ejemplo un una escala escala de 1 a 5, la eficacia, gusto, importancia, utilidad, etc., de una serie de conceptos del mismo ámbito (actividades, motivaciones, etc.) tenemos muestras relacionadas: los sujetos dan su valoración mediante respuestas escritas (se limitan a responder a varias preguntas) según su experiencia, sin necesidad de hacer en ese momento ningún experimento; la vida ya ha hecho que pasen por las diferentes situaciones o condiciones. Es decir, no necesitamos necesariamente que los sujetos pasen por diversas experiencias o condiciones; basta que respondan a una serie de preguntas sobre una serie de conceptos o variables del mismo ámbito. 3º El ejemplo que nos va a servir para introducir el método también sugiere otras posibilidades: cuando varios profesores evalúan a los mismos alumnos ¿De dónde vienen las diferencias? ¿De que los alumnos son distintos y los profesores tienden a coincidir en sus juicios? (éste sería un resultado deseable) ¿O de que los profesores son distintos en su modo de evaluar? Prof. 1 Prof. 2 Prof. 3 Prof. 4 Alumno 1 10 6 8 7 Alumno 2 4 5 3 4 Alumno 3 8 4 7 4 Alumno 4 3 4 2 2 Alumno 5 6 8 6 7 Alumno 6 9 7 8 7 4º Este análisis de varianza se presta de manera especial a determinar la jerarquía de preferencias. Si un grupo valora una serie de conceptos (por ejemplo: libertad, igualdad, progreso económico, etc.) según su importancia (en una escala de nada a muy importante), podemos ver: a. En qué medida los sujetos son consistentes (están más o menos de acuerdo) ordenando estos conceptos según su importancia; podemos calcular unos coeficientes de fiabilidad que nos indicarán en qué grado los sujetos están de acuerdo diferenciando unos conceptos de otros. b. Qué valores difieren entre sí (en importancia) por encima de lo que se podría esperar por azar: podemos desembocar en un orden que en un cierto grado refleja la jerarquía de valores (o simplemente de preferencias) prevalente en el grupo. Supuestos del ANOVA de Medidas Repetidas Al igual que en los diseños anteriores, antes de aplicar el modelo de análisis de la varianza a los datos de un determinado estudio, es necesario evaluar los supuestos de aplicación. • Los supuestos de Normalidad y Homogeneidad de varianzas • (homocedasticidad) se tienen que evaluar, para este tipo de diseños, previamente a la ejecución del procedimiento que realiza el ANOVA. Nos pararemos en el supuesto de independencia de las observaciones, ya que es muy importante en los diseños de Medidas Repetidas. En el caso de los diseños con medidas repetidas, dado que son los mismos sujetos los que reciben cada una de las condiciones experimentales, es muy probable que aparezca correlación entre sus puntuaciones y, por tanto, que se incumpla este supuesto (independencia de las observaciones), que es el más importante del ANOVA. La condición de esfericidad Un supuesto implícito en este modelo (medidas repetidas), es que para que los valores de F con los grados de libertad especificados sean válidos (es decir, que correspondan a la probabilidad indicada en las tablas), debe cumplirse la condición denominada de esfericidad, que viene a decir que las covarianzas entre cada par de tratamientos son las mismas (de ocasión a ocasión el cambio es idéntico). Cuando se mide en varias veces sucesivas a los mismos sujetos (y siempre que tengamos muestras relacionadas) como es frecuente en muchos diseños experimentales (o en estudios exploratorios), estas medidas están correlacionadas; en este caso bajan los cuadrados medios del término del error (el denominador de la razón F) y se obtiene con mayor facilidad un valor de F significativo. Consecuencias del incumplimiento del Supuesto de esfericidad En consecuencia, el incumplimiento de este supuesto repercute gravemente en los resultados arrojados por la prueba F, ya que no es robusta ante observaciones correlacionadas. Concretamente, la correlación entre las puntuaciones provoca un sesgo positivo en la prueba F, aumentando la probabilidad de cometer errores tipo I. Es decir, aumenta la probabilidad de encontrar resultados estadísticamente significativos cuando, realmente, no lo son Por lo tanto, para analizar los datos procedentes de un diseño MR mediante el modelo univariado de Análisis de Varianza (ANOVA), será necesario comprobar si en dichos datos se cumple el supuesto de esfericidad, siempre que la(s) VI(s) implicada(s) tengan más de dos niveles la W de Mauchly Uno de los test más utilizados para evaluar el supuesto de esfericidad es la W de Mauchly (1940). Esta prueba la aporta por defecto la salida que el SPSS proporciona al analizar datos con medidas repetidas mediante el procedimiento: Analizar ---> Modelo Lineal General --->Medidas Repetidas. Interpretación del test de Mauchly: para que se pueda asumir el supuesto de esfericidad, se debe mantener la H0 (esfericidad) Se asume la esfericidad cuando Maunchly es mayor que .05 Cuando hay esfericidad entonces, los datos se pueden analizar mediante el modelo univariado de ANOVA sin correr el riesgo de obtener un valor sesgado de la prueba F. Sin embargo, si se rechaza la H0, el supuesto de esfericidad no se puede mantener y, por tanto, el modelo univariado de ANOVA no es apropiado para analizar los datos La W de Maunchly Es menor que .05 no se asume esfericidad Es mayor que .05 (se asume esfericidad) Propuestas Analizar los datos mediante el modelo univariado de ANOVA Se usa el indicador de esfericidad asumida Utilizar comparaciones específicas entre los niveles de la VI Pruebas de contrastes intra-sujetos. Mantener el modelo univariado de ANOVA con ajustes Utilizar una aproximación multivariada sobre las medidas repetidas (MANOVA), Cada una de estas correcciones se han desarrollado para alterar los grados de libertad y producir un cociente F donde se reduce la tasa de error de Tipo I. Greenhouse-Geisser (más conservador) Huynh y Feldt (más liberal 1. Utilizar comparaciones específicas entre los niveles de la(s) variables independientes en lugar de la prueba general del ANOVA; ya que estas comparaciones no requieren la esfericidad. Esta opción puede ser adecuada sólo cuando la VI sea cuantitativa, los niveles están igual de espaciados entre sí e interese conocer el patrón de la evolución de los valores de la VD. Se suele utilizar casi exclusivamente cuando la VI es el paso del tiempo. El programa SPSS las denomina Pruebas de contrastes intra-sujetos. 2. Mantener el modelo univariado de ANOVA con ajustes sobre los grados de libertad asociados al numerador (variabilidad debida al efecto del tratamiento) y al denominador (variabilidad debida al error) de la prueba F, compensando de esta manera el sesgo positivo de la prueba F bajo ausencia de esfericidad. Los ajustes se realizan mediante el parámetro épsilon. El programa SPSS proporciona tres valores para épsilon, que aparecen en la salida en la misma tabla que el test de Mauchly. También proporciona las tablas resumen de los ANOVAS ajustados junto con los resultados para cuando se asume la esfericidad, en la tabla denominada Pruebas de los efectos intra-sujetos. Se recomienda el de Greenhouse-Geisser, ya que habitualmente proporciona valores menos extremos. 3. Utilizar una aproximación multivariada sobre las medidas repetidas (MANOVA), que no requiere el cumplimiento del supuesto de esfericidad. Bajo este modelo, cada una de las medidas que se registran en cada sujeto de forma repetida, se consideran como una variable dependiente diferente. Esta opción aparece la primera en la salida, y se denomina Contrastes multivariados. De las tres opciones, las más utilizadas son la segunda y la tercera. Sin embargo, una aproximación no es mejor que otra como regla general. Cálculo del ANOVA INTRAGRUPO Prof. 1 Prof. 2 Prof. 3 Prof. 4 Alumno 1 10 6 8 7 Alumno 2 4 5 3 4 Alumno 3 8 4 7 4 Alumno 4 3 4 2 2 Alumno 5 6 8 6 7 Alumno 6 9 7 8 7 las filas son alumnos (f = 6) y las columnas son profesores (c = 4) que han evaluado en la misma característica a los seis alumnos. • Si la varianza de las filas (alumnos) es estadísticamente significativa (superior a lo aleatorio) se deben sobre todo a que los alumnos son distintos • Si la varianza de las columnas es estadísticamente significativa se debe a que los profesores son distintos en su estilo de evaluar (pueden ser, por ejemplo, por ejemplo más o menos benévolos) • Pero también podríamos encontrar el efecto de la interacción profesor-alumno (algunos profesores pueden sentirse inclinados a valorar mejor o peor a determinados alumnos). La SS intergrupal NO se calcula para el ANOVA de medidas repetidas porque no tenemos varios grupos a comparar, ya que se trata de un solo grupo medido en distintas ocasiones SS profesores SS inter grupal SST SSM efecto del experimento SS Alumnos SSR Error SS interacción profesores/alumnos SS Intra sujeto Cálculo de la SSM intrasujetos SS profesores: Cálculo de la Varianza Producida porque los profesores evaluan de manera distinta, algunos son más benevolentes que otros SS profesores: 115,96 – 108,83 = 7.18 SS alumnos: Cálculo de la Varianza Producida porque los alumnos son distintos SS alumnos: 115,96 – 31.75 = 84.19 SS interacción profesores/alumnos Calculo de la varianza producida por la interacción profesor/alumno SS interacción = SSM – SS profesores – SS alumnos SS interacción = 115.96 – 7.18 – 31.75 SS interacción = 24.58 Grados de libertad Los grados de libertad son De las filas F-1 6- 1 5 De las columnas C-1 4-1 3 De la interacción (f-1) (c-1) 5x3 15 N-1 24 - 1 23 Del total La varianza se debe a que los alumnos son distintos, no a que los profesores son distintos. Resultados El resultado de la prueba de Mauchly indica que no se incumple el supuesto de esfericidad, por tanto, es mejor (más potente) el ANOVA que el MANOVA El estadístico epsilon expresa en qué medida se apartan los datos del requisito de esfericidad A mayor valor de epsilon, los datos se apartan menos de la esfericidad El valor de epsion es siempre menor que 1. cuando epsilon es 1 = esfericidad perfecta A menor valor de epsilon los datos se apartan más de la esfericidad los resultados para las sumas de cuadrados, grados de libertad, etc. adecuados son los que corresponden a “Esfericidad asumida”. El resultado del ANOVA, por tanto, indica que existen diferencias estadísticamente significativas en los aciertos obtenidos entre los tres niveles de alcoholemia. La respuesta a la pregunta ¿entre qué niveles concretamente? nos la proporciona el análisis de factores principales que solicitamos en Opciones y que aparece en la tabla Comparaciones por pares. Como se puede ver en la tabla, las diferencias estadísticamente significativas en el número de aciertos se encuentran entre el primer nivel (0 gramos de alcohol) y el segundo (0,5 gramos de alcohol), así como entre el primero y el tercero (1 gramo de alcohol). Remitiéndonos a las puntuaciones medias de cada nivel, vemos que el mayor número de aciertos corresponde a 0 gramos de alcohol en sangre. Sin embargo, no se han encontrado diferencias estadísticamente significativas entre el nivel segundo y el tercer. Por tanto, no podemos afirmar, con estos datos, que la disminución de 0,5 gramos de alcohol en sangre, respecto de 1 gramo, produzca mejoras en el número de aciertos que obtienen los sujetos en la tarea de simulación de conducción de automóviles.
© Copyright 2024