anova intragrupo o de medidas repetidas

ANOVA MULTIGRUPO O DE
MEDIDAS REPETIDAS
Profesora: Carolina Mora
Análisis de Varianza intragrupo o
ANOVA para muestras relacionadas
•
En este modelo de análisis de varianza tenemos los mismos sujetos con
observaciones o puntuaciones en la misma variable pero en condiciones
distintas (por ejemplo: la efectividad de un procedimiento para mejorar la
memoria en tras condiciones distintas: sin estrés, con bajo estrés y con alto
estrés)
•
o los mismos sujetos en la misma condición pero en tiempos distintos. Por
ejemplo, medir el nivel de aprendizaje, antes (preprueba), después de aplicar
un tratamiento (postprueba) y a los 3 meses (seguimiento)
Como se trata de los mismos sujetos tenemos muestras relacionadas o
emparejadas
•
También puede tratarse de sujetos físicamente distintos pero igualados en
variables relevantes (variables que controlamos con esta igualación.
Ventajas del ANOVA para muestras
relacionadas
Una ventaja de utilizar a los
mismos sujetos en tratamientos
experimentales
es
que
necesitaremos menos sujetos que si
se trata de muestras independientes
Planteamientos que se pueden analizar
mediante el ANOVA INTRAGRUPOS
1º Cuando los mismos sujetos van a pasar por una serie de tratamientos experimentales.
La variable dependiente, es siempre la misma (medidas repetidas), por ejemplo distintos
métodos, ejercicios, etc.: el aprendizaje previo, el cansancio, etc., de una ocasión
puede estar influyendo en los resultados de la ocasión siguiente?.
Este problema (derivado del orden en el que los sujetos pasan por las distintas
experiencias) puede resolverse de dos maneras:
a. Mediante diseños equilibrados (counter balanced): los sujetos pasan por los
distintos tratamientos en un orden distinto, para neutralizar o minimizar los efectos
del aprendizaje previo, cansancio, etc.
b. Utilizando sujetos distintos en cada condición, pero igualados en características
importantes (como podrían ser sexo, edad, rendimiento previo, etc.).
2º Este modelo de análisis de varianza suele presentarse en el contexto de los diseños
experimentales (los mismos sujetos pasan por diversas condiciones o experiencias), pero
presentar este modelo de análisis de varianza en referencia únicamente a diseños
experimentales, es de hecho muy restrictiva porque puede dejar fuera de nuestra atención
otras posibilidades de interés y además muy sencillas y asequibles.
Si los mismos sujetos valoran (por ejemplo un una escala escala de 1 a 5, la eficacia, gusto,
importancia, utilidad, etc., de una serie de conceptos del mismo ámbito (actividades,
motivaciones, etc.) tenemos muestras relacionadas: los sujetos dan su valoración mediante
respuestas escritas (se limitan a responder a varias preguntas) según su experiencia, sin
necesidad de hacer en ese momento ningún experimento; la vida ya ha hecho que pasen por
las diferentes situaciones o condiciones. Es decir, no necesitamos necesariamente que los
sujetos pasen por diversas experiencias o condiciones; basta que respondan a una serie de
preguntas sobre una serie de conceptos o variables del mismo ámbito.
3º El ejemplo que nos va a servir para introducir el método también sugiere otras
posibilidades: cuando varios profesores evalúan a los mismos alumnos ¿De dónde
vienen las diferencias? ¿De que los alumnos son distintos y los profesores tienden a
coincidir en sus juicios? (éste sería un resultado deseable) ¿O de que los profesores son
distintos en su modo de evaluar?
Prof. 1
Prof. 2
Prof. 3
Prof. 4
Alumno 1
10
6
8
7
Alumno 2
4
5
3
4
Alumno 3
8
4
7
4
Alumno 4
3
4
2
2
Alumno 5
6
8
6
7
Alumno 6
9
7
8
7
4º Este análisis de varianza se presta de manera especial a determinar la jerarquía
de preferencias. Si un grupo valora una serie de conceptos (por ejemplo: libertad,
igualdad, progreso económico, etc.) según su importancia (en una escala de nada a
muy importante), podemos ver:
a. En qué medida los sujetos son consistentes (están más o menos de acuerdo)
ordenando estos conceptos según su importancia; podemos calcular unos
coeficientes de fiabilidad que nos indicarán en qué grado los sujetos están de
acuerdo diferenciando unos conceptos de otros.
b. Qué valores difieren entre sí (en importancia) por encima de lo que se podría
esperar por azar: podemos desembocar en un orden que en un cierto grado
refleja la jerarquía de valores (o simplemente de preferencias) prevalente en el
grupo.
Supuestos del ANOVA de Medidas Repetidas
Al igual que en los diseños anteriores, antes de aplicar el modelo de análisis de la
varianza a los datos de un determinado estudio, es necesario evaluar los supuestos de
aplicación.
• Los supuestos de Normalidad y Homogeneidad de varianzas
• (homocedasticidad) se tienen que evaluar, para este tipo de diseños, previamente a la
ejecución del procedimiento que realiza el ANOVA.
Nos pararemos en el supuesto de independencia de las observaciones, ya que es muy
importante en los diseños de Medidas Repetidas.
En el caso de los diseños con medidas repetidas, dado que son los mismos sujetos los que
reciben cada una de las condiciones experimentales, es muy probable que aparezca
correlación entre sus puntuaciones y, por tanto, que se incumpla este supuesto
(independencia de las observaciones), que es el más importante del ANOVA.
La condición de esfericidad
Un supuesto implícito en este modelo (medidas repetidas), es que para que los valores de F
con los grados de libertad especificados sean válidos (es decir, que correspondan a la
probabilidad indicada en las tablas), debe cumplirse la condición denominada de
esfericidad, que viene a decir que las covarianzas entre cada par de tratamientos son las
mismas (de ocasión a ocasión el cambio es idéntico).
Cuando se mide en varias veces sucesivas a los mismos sujetos (y siempre que tengamos
muestras relacionadas) como es frecuente en muchos diseños experimentales (o en estudios
exploratorios), estas medidas están correlacionadas; en este caso bajan los cuadrados
medios del término del error (el denominador de la razón F) y se obtiene con mayor
facilidad un valor de F significativo.
Consecuencias del incumplimiento del
Supuesto de esfericidad
En consecuencia, el incumplimiento de este supuesto repercute gravemente en los
resultados arrojados por la prueba F, ya que no es robusta ante observaciones
correlacionadas. Concretamente, la correlación entre las puntuaciones provoca un
sesgo positivo en la prueba F, aumentando la probabilidad de cometer errores tipo I.
Es decir, aumenta la probabilidad de encontrar resultados estadísticamente
significativos cuando, realmente, no lo son
Por lo tanto, para analizar los datos procedentes de un diseño MR mediante el modelo
univariado de Análisis de Varianza (ANOVA), será necesario comprobar si en dichos
datos se cumple el supuesto de esfericidad, siempre que la(s) VI(s) implicada(s) tengan
más de dos niveles
la W de Mauchly
Uno de los test más utilizados para evaluar el supuesto de esfericidad es la W
de Mauchly (1940). Esta prueba la aporta por defecto la salida que el SPSS
proporciona al analizar datos con medidas repetidas mediante el procedimiento:
Analizar ---> Modelo Lineal General --->Medidas Repetidas.
Interpretación del test de Mauchly: para que se pueda asumir el supuesto de
esfericidad, se debe mantener la H0 (esfericidad)
Se asume la esfericidad cuando Maunchly es mayor que .05
Cuando hay esfericidad entonces, los datos se pueden analizar mediante el
modelo univariado de ANOVA sin correr el riesgo de obtener un valor sesgado
de la prueba F.
Sin embargo, si se rechaza la H0, el supuesto de esfericidad no se puede
mantener y, por tanto, el modelo univariado de ANOVA no es apropiado para
analizar los datos
La W de Maunchly
Es menor que .05 no se
asume esfericidad
Es mayor que .05
(se asume esfericidad)
Propuestas
Analizar los datos mediante
el modelo univariado de
ANOVA
Se usa el indicador de
esfericidad asumida
Utilizar comparaciones
específicas entre los
niveles de la VI
Pruebas de contrastes
intra-sujetos.
Mantener el modelo
univariado de ANOVA con
ajustes
Utilizar una aproximación
multivariada sobre las
medidas repetidas
(MANOVA),
Cada una de estas correcciones
se han desarrollado para alterar
los grados de libertad y producir
un cociente F donde se reduce la
tasa de error de Tipo I.
Greenhouse-Geisser (más
conservador)
Huynh y Feldt (más liberal
1. Utilizar comparaciones específicas entre los niveles de la(s) variables
independientes en lugar de la prueba general del ANOVA; ya que estas
comparaciones no requieren la esfericidad. Esta opción puede ser adecuada
sólo cuando la VI sea cuantitativa, los niveles están igual de espaciados entre sí
e interese conocer el patrón de la evolución de los valores de la VD.
Se suele utilizar casi exclusivamente cuando la VI es el paso del tiempo.
El programa SPSS las denomina Pruebas de contrastes intra-sujetos.
2. Mantener el modelo univariado de ANOVA con ajustes sobre los grados de
libertad asociados al numerador (variabilidad debida al efecto del tratamiento) y al
denominador (variabilidad debida al error) de la prueba F, compensando de esta
manera el sesgo positivo de la prueba F bajo ausencia de esfericidad. Los
ajustes se realizan mediante el parámetro épsilon.
El programa SPSS proporciona tres valores para épsilon, que aparecen en la salida
en la misma tabla que el test de Mauchly. También proporciona las tablas resumen
de los ANOVAS ajustados junto con los resultados para cuando se asume la
esfericidad, en la tabla denominada Pruebas de los efectos intra-sujetos. Se
recomienda el de Greenhouse-Geisser, ya que habitualmente proporciona
valores menos extremos.
3. Utilizar una aproximación multivariada sobre las medidas repetidas
(MANOVA), que no requiere el cumplimiento del supuesto de esfericidad.
Bajo este modelo, cada una de las medidas que se registran en cada sujeto
de forma repetida, se consideran como una variable dependiente diferente.
Esta opción aparece la primera en la salida, y se denomina Contrastes
multivariados.
De las tres opciones, las más
utilizadas son la segunda y la
tercera.
Sin
embargo,
una
aproximación no es mejor que otra
como regla general.
Cálculo del ANOVA INTRAGRUPO
Prof. 1
Prof. 2
Prof. 3
Prof. 4
Alumno 1
10
6
8
7
Alumno 2
4
5
3
4
Alumno 3
8
4
7
4
Alumno 4
3
4
2
2
Alumno 5
6
8
6
7
Alumno 6
9
7
8
7
las filas son alumnos (f = 6) y las columnas son profesores (c = 4) que han evaluado en la misma
característica a los seis alumnos.
• Si la varianza de las filas (alumnos) es estadísticamente significativa (superior a lo aleatorio) se deben
sobre todo a que los alumnos son distintos
• Si la varianza de las columnas es estadísticamente significativa se debe a que los profesores son
distintos en su estilo de evaluar (pueden ser, por ejemplo, por ejemplo más o menos benévolos)
• Pero también podríamos encontrar el efecto de la interacción profesor-alumno (algunos profesores
pueden sentirse inclinados a valorar mejor o peor a determinados alumnos).
La SS intergrupal NO se calcula para
el ANOVA de medidas repetidas
porque no tenemos varios grupos a
comparar, ya que se trata de un solo
grupo medido en distintas ocasiones
SS profesores
SS inter grupal
SST
SSM efecto del
experimento
SS Alumnos
SSR
Error
SS interacción
profesores/alumnos
SS Intra sujeto
Cálculo de la SSM intrasujetos
SS profesores:
Cálculo de la Varianza Producida porque los profesores evaluan
de manera distinta, algunos son más benevolentes que otros
SS profesores: 115,96 – 108,83 = 7.18
SS alumnos:
Cálculo de la Varianza Producida porque los alumnos son
distintos
SS alumnos: 115,96 – 31.75 = 84.19
SS interacción profesores/alumnos
Calculo de la varianza producida por la interacción profesor/alumno
SS interacción = SSM – SS profesores – SS alumnos
SS interacción = 115.96 – 7.18 – 31.75
SS interacción = 24.58
Grados de libertad
Los grados de libertad son
De las filas
F-1
6- 1
5
De las columnas
C-1
4-1
3
De la interacción
(f-1) (c-1)
5x3
15
N-1
24 - 1
23
Del total
La varianza se debe a que los alumnos son distintos, no a que los profesores son
distintos.
Resultados
El resultado de la prueba de Mauchly indica que no se incumple
el supuesto de esfericidad, por tanto, es mejor (más potente) el
ANOVA que el MANOVA
El estadístico
epsilon expresa
en qué medida se
apartan los datos
del requisito de
esfericidad
A mayor valor de epsilon, los datos se apartan
menos de la esfericidad
El valor de epsion es siempre menor que 1.
cuando epsilon es 1 = esfericidad perfecta
A menor valor de
epsilon los datos
se apartan más de
la esfericidad
los resultados para las sumas de cuadrados, grados de libertad, etc. adecuados
son los que corresponden a “Esfericidad asumida”. El resultado del ANOVA,
por tanto, indica que existen diferencias estadísticamente significativas en los
aciertos obtenidos entre los tres niveles de alcoholemia.
La respuesta a la pregunta ¿entre qué niveles concretamente? nos la
proporciona el análisis de factores principales que solicitamos en Opciones y
que aparece en la tabla Comparaciones por pares.
Como se puede ver en la tabla, las diferencias estadísticamente significativas en el número de aciertos
se encuentran entre el primer nivel (0 gramos de alcohol) y el segundo (0,5 gramos de alcohol), así
como entre el primero y el tercero (1 gramo de alcohol). Remitiéndonos a las puntuaciones medias de
cada nivel, vemos que el mayor número de aciertos corresponde a 0 gramos de alcohol en sangre. Sin
embargo, no se han encontrado diferencias estadísticamente significativas entre el nivel segundo y el
tercer. Por tanto, no podemos afirmar, con estos datos, que la disminución de 0,5 gramos de alcohol en
sangre, respecto de 1 gramo, produzca mejoras en el número de aciertos que obtienen los sujetos en la
tarea de simulación de conducción de automóviles.