Estableciendo relaciones causales

Estableciendo
relaciones causales
Relaciones causales
Las relaciones causales se investigan a
través de experimentos controlados
Cuando sospechamos que un factor es la
causa de otro, debemos utilizar un
método para probar nuestra sospecha
Relaciones causales
El establecer una correlación entre dos
variables no significa que exista una
relación entre ambas
Se dice que están correlacionadas si
muestran simultaneamente una variación
regular y mensurable
Relaciones causales
La forma más sencilla de correlación
consiste en la comparación de dos
grupos, uno que tiene una característica
y otro que no la tiene
Relaciones causales
Por ej, cuando comparamos el ingreso anual
de dos grupos de sujetos de 30-49, uno con
estudios universitarios y otro sin ellos
Los egresados universitarios ganan un 20 %
más, es decir, se encuentra una correlación
entre el nivel académico y el ingreso anual
Hay que recordar sin embargo, que el
mostrar una correlación entre dos
características no es prueba de que
estas se encuentran causalmente
correlacionadas
Una correlación puede ser simplemente
una coincidencia
P. ej, en años recientes se ha observado
un incremento en la bolsa de valores y en
el número de minutos al día que los niños
ven la televisión !
A pesar de ello, la búsqueda de
correlaciones es un componente
importante de la investigación de
causalidad
Si dos variables están causalmente
relacionadas existirá una correlación
El demostrar una correlación puede ser
la razón que se sospeche inicialmente
que dos variables esten causalmente
relacionadas
Sin embargo recuerde: correlacion no
es prueba de asociación causal
Para considerar que existe una relación
causal entre dos variables, tenemos que
demostrar que una es responsable de la
aparición de la otra
La prueba ideal
Deseamos probar la eficacia del
medicamento A para curar el
padecimiento X
1. Establecemos una hipótesis: H1: el
medicamento A es mejor que el
estándar y Ho: el medicamento A no es
mejor o es peor que el estándar
La prueba ideal
2. Asignamos aleatoriamente sujetos a dos
grupos, uno con el tratamiento estándar
y otro con el tratamiento convencional
3. Los grupos deberán ser idénticos entre
si, excepto por el tratamiento
4. El grupo de tratamiento A se denomina
experimental; el otro será el grupo
control
Estableciendo relaciones causales
Hay 3 factores que dificultan
establecer la causalidad
1. El grado del efecto suele ser limitado;
no todos los sujetos de la población C
expuestos al factor A desarrollarán el
evento B
P. Ej. el fumar cigarrillos se asocia al
desarrollo de cáncer broncogénico; sin
embargo no todos los fumadores
desarrollan cáncer
Lo que los estudios han demostrado es
que los fumadores > cáncer que los no
fumadores, y a mayor tabaquismo, mayor
frecuencia de cáncer.
2. La mayoría de los efectos no se
relacionan con una sola causa; otros
factores, además de A pueden causar el
efecto B en la población C
3. El factor A puede causar otros efectos
además del efecto B en la población C
Hay que asegurarnos que nuestras
muestras sean representativas de la
población general, para poder extrapolar
los resultados observados
Aun así, nuestros resultados son solo
una estimación de los parámetros
poblacionales
Que tanta variabilidad existe en nuestra
estimación ?
Depende del tamaño de la muestra
Supongamos que tenemos una bolsa con
miles de pelotas de ping-pong de dos
colores, rojas y azules. Sabemos que
exactamente la mitad son rojas y la
mitad azules
Si tomamos una muestra aleatoria de
dos, que probabilidad existe que
obtengamos una de cada una ?
Color
Color
Relación
Roja
Roja
2:0
Roja
Azul
1:1
Azul
Roja
1:1
Azul
Azul
2:0
Probabilidad de 50 %
Y si nuestra muestra es de 4 ?
Solo 6/16 muestras tienen 2 de cada una
(37.5 % vs. 50 % con una muestra de 2)
Sin embargo ahora, 14/16 contienen al
menos una bola roja o azul
Solo 2 muestras (12.5 %) no tienen al
menos una bola roja o viceversa
En nuestra muestra de 2, la mitad solo
tenia bolas de un color
Si tomamos una muestra de 100 pelotas,
el 95 % de las muestras contendrán
entre 40 y 60 % de pelotas rojas
Si tomamos una muestra de 1000
pelotas, 95 % de nuestras muestras
tendran entre 470 y 530 bolas rojas
Límites de confianza
Conducimos un estudio con un grupo
experimental y un grupo control de 100
sujetos c/u
Al fin del estudio, 42 % del grupo
experimental y 30 % del grupo control
tienen el efecto esperado
Tenemos evidencia de una asociación
causal ?
El margen de error en una muestra de
100 es de aproximadamente 10 %
Esto significa 2 cosas:
95 % de las muestras probables caerán
dentro de este intervalo de 20 %
Podemos estar relativamente seguros
que la característica que buscamos
ocurre en este intervalo de 20 % en la
población a partir de la cual se tomaron
las muestras
En nuestro ejemplo
En el grupo experimental entre un 32 y
un 52 %
En el grupo control entre un 20 y un
40 %
Existe demasiada sobre posición entre
los dos intervalos
La probabilidad de que la diferencia
observada sea debida simplemente a
variabilidad aleatoria es muy alta
No significa que no exista una relación
causal; el efecto puede ser muy pequeño
y requerir una muestra mayor para
demostrarlo
Por el contrario, si podemos afirmar
que el experimento no fue capaz de
establecer una relación causal
Si la diferencia entre los grupos hubiera
sido >20 % podríamos afirmar que la
diferencia no es debida a variabilidad
aleatoria, y pudiera estar relacionada
con el factor en estudio
Ahora vamos a suponer que nuestra
muestra aleatoria es de 500 sujetos en
cada grupo
El margen de error en una muestra de
500 es de aproximadamente 4 %
95 % de las muestras probables caerán
dentro de un intervalo de 8 %
En el grupo experimental (V=30) entre
un 26 y un 34 %
En el grupo control (V=42) entre un 38 y
un 46 %
Al no existir sobre posición podemos
afirmar que la diferencia no es
atribuible a variabilidad aleatoria
(p<0.05) durante el muestreo
La incapacidad para rechazar la
posibilidad de que la diferencia
observada sea debido a variabilidad
aleatoria se conoce como incapacidad
para rechazar la hipótesis de nulidad
Cuando el experimento detecta una
diferencia suficientemente grande
entre el grupo experimental y el grupo
control, se dice que podemos rechazar
la hipótesis de nulidad
Probando hipótesis
Tenemos una descripción exacta del
fenómeno bajo estudio ?
 P.ej. el argumento de que el numero de
nacimientos se incrementa durante el
periodo de luna llena
Antes de embarcarnos en encontrar una
explicación, debemos confirmar que este
fenómeno es cierto
Por supuesto que no lo es
Porque las personas piensan que este
fenómeno es cierto, a pesar de la
evidencia en contra ?
Debido al sesgo de confirmación; es
decir solo se recuerdan los eventos que
confirman nuestra creencia
Existen ya explicaciones plausibles ?
Navaja de Ockham (“razurar” lo
indeseable)
William de Ockham: monge y filosofo
medieval (1285-1439)
“Lo que puede hacerse con menos, se
hace en vano con mas”
Navaja de Ockham
Cuando existen dos hipótesis para
explicar un mismo fenómeno, la más
sencilla de ellas debe ser la correcta
Si podemos resolver una interrogante
sin introducir otras interrogantes, no
tiene sentido elegir la hipótesis que si lo
hace
Tamaño de la muestra y significancia
estadística
La significancia estadística es
comúnmente evaluada en investigación
biomédica cuando el investigador
encuentra una diferencia entre dos
grupos de sujetos
Los procedimientos utilizados para
determinar la significancia numérica de
una diferencia observada dependerá del
tipo de variable en cuestión
Para variables continuas los resultados
se expresan en medias, y habitualmente
se utiliza la prueba de t
Para variables nominales los resultados
se expresan en proporciones y la prueba
mas frecuentemente utilizada es la de
2
Aunque la prueba estadística se elige de
acuerdo al tipo de datos de interés la
estrategia es siempre la misma
Estrategia para evaluar significancia
estadística
1.
Vamos asumir que una hipótesis es cierta
2. Determinaremos las consecuencias de esta
hipótesis
3. Si las consecuencias de esta hipótesis
resultan en una imposibilidad concluimos que
la hipótesis es falsa y la rechazamos
4. Este valor es el valor de p y se obtiene de
una prueba estadística
Prueba de hipótesis
1. Observamos una diferencia (delta, )
entre dos grupos (A y B)
2. Probaremos la hipótesis de que A y B
no son diferentes (hipótesis de
nulidad)
3. Determinamos la probabilidad de
observar una diferencia > 
simplemente por casualidad
Valor de p
Puede llegar a ser muy pequeño (p. ej.
<0.00001), pero nunca será de cero
Existe siempre la posibilidad, aun
infinitesimal de que la diferencia
observada sea debida simplemente a la
casualidad, secundaria a variabilidad
aleatoria
Valor de p
Por ello adoptamos lo que se conoce
como nivel de significancia (o ) que nos
demarca la zona de rechazo
Si el valor de p obtenido en la prueba
estadística es igual o menor que 
rechazaremos la hipótesis de nulidad
Valor de p
Alpha demarca nuestro margen de error;
es un riesgo que se toma por poder
contar con un mecanismo estadístico que
nos permita obtener conclusiones
Valor de p
Porque 0.05 ?
Este valor no se eligió por designio
divino, o como resultado de un consenso
internacional
Proviene de un hábito de RA Fisher
quien arbitrariamente eligió este valor
Relaciones causales
La determinación de la causa de una
enfermedad mediante un experimento
suele ser sencilla
El problema estriba en demostrar esta
relación en un estudio observacional
Sin embargo es muy importante hacerlo:
 puede indicar un punto clave en la cadena de
la enfermedad donde pudiera interrumpirse
 en caso de considerar causal una relacion
que no lo es pudiera llevar a esfuerzos
inútiles de control
¿Como podemos decidir si un
factor esta causalmente
relacionado a una enfermedad?
Vamos a suponer que todos los años un
segmento de la población desarrolla la
enfermedad X
El primer paso consiste en determinar si
existen diferencias estadísticamente
significativas en la incidencia de la
enfermedad entre los grupos
poblacionales
¿El grupo con la incidencia alta (o baja)
tiene alguna característica (factor) que
pudiera influir sobre esta tasa de
enfermedad?
Suponiendo que existe una asociación
estadísticamente significativa entre un
factor y una enfermedad esta puede ser
 un artefacto (espuria)
 indirecta
 causal
Asociación espuria
Consiste en una asociación falsa o
ficticia que ocurre por casualidad o por
sesgo en la metodología de investigación
Asociación espuria
Sabemos que los resultados de una
pequeña proporción de estudios se
declararan estadísticamente
significativos aun cuando los resultados
se deban a fluctuaciones aleatorias
(error de tipo 1=)
Asociación espuria
Es por ello que los resultados deben de
ser confirmados mediante replicación
Uno debe sospechar que la asociación es
espuria si no es posible replicarlos
Asociación espuria
El sesgo en la metodología también
puede llevar a asociaciones espurias, ya
sea en la forma en que se seleccionó la
muestra o en los métodos de recolección
de la información
Estos sesgos pueden ser difíciles de
detectar por lo que se debe tener gran
cuidado en el diseño del estudio
Asociación espuria
Vamos a suponer que se diseña un
estudio para determinar si la
enfermedad X se asocia al consumo
excesivo de alcohol
Asociación espuria
Si el investigador sabe que la persona
que se entrevista tiene la enfermedad X
y el cree que la hipótesis es cierta,
pudiera insistir mas en la historia de
alcoholismo en comparación con la
entrevista de un control
Solución: el que entreviste no tenga
interés en el estudio
Asociación espuria
Otra fuente de sesgo se origina en la
selección del grupo control
Frecuentemente se seleccionan del
mismo hospital donde están los casos
Seguramente no son representativos de
la población general
Asociación no causal (indirecta)
Un factor y una enfermedad están
asociados solo porque ambos están a su
vez asociados a una condición
subyacente común
Una modificación en el factor
indirectamente asociado no modificara
la frecuencia de enfermedad a menos de
que provoque un cambio en la condición
subyacente común
Cólera y altura
Al estudiar las estadísticas de cólera en
el siglo XIX en Inglaterra, se encontró
que existía una relación inversamente
proporcional entre la altura sobre el
nivel del mar y la incidencia de cólera
Cólera y altura
Este hallazgo vino a apoyar la teoría de
los miasmas, entonces en boga, como
causa de la enfermedad
De acuerdo a esta teoría, uno esperaría
tasas elevadas de cólera en regiones de
baja altitud ya que ahí el aire sería más
peligroso (y viceversa, donde el aire es
más puro)
Cólera y altura
De hecho la mortalidad observada es
extraordinariamente similar a la que se
predijo en base a la teoría de los
miasmas
Cólera y altura
Ahora sabemos que las tasas de
mortalidad por cólera eran mayores en
las regiones de baja altitud porque las
fuentes de agua en dichas regiones
estaban mas contaminadas
Era el agua contaminada y no el aire
fétido lo que se asociaba al cólera
Sin las condiciones estrictas y
artificiales de un experimento
controlado, es difícil determinar si
existe una relación causal entre un
factor y una enfermedad
Por esta razón se han desarrollado una
serie de criterios para determinar
causalidad
Podemos decir que A causa B si:
 A precede a B
 un cambio en A se correlaciona con un
cambio en B
 esta correlación no es en si misma la
consecuencia de que tanto A como B estén
correlacionadas con una previa C
Criterios para establecer
causalidad
Intensidad de la asociación
 a mayor RR para aquellos con el factor
mayor será la probabilidad de una
asociación causal
Relación dosis-respuesta
 la probabilidad de una asociación causal
será mayor si existe una mayor incidencia al
aumentar el nivel del factor (o viceversa)
Criterios para establecer
causalidad
Consistencia de la asociación
 una asociación descrita en un estudio debe
persistir cuando se examina con otra
población y con diferente metodología
Asociación temporalmente correcta
 la exposición al factor debe preceder a la
enfermedad incluyendo un periodo de
inducción y latencia; en condiciones agudas
esto es fácil (intoxicación por alimentos)
Criterios para establecer
causalidad
Especificidad de la asociación
 que tanto podemos predecir un evento ante
la presencia de un factor
 idealmente se trata de una relación de 1 a 1
en donde el factor es tanto necesario como
suficiente
 por ejemplo: exposición a vinyl
cloruroangiosarcoma del higado;
dietiletilbestroladenocarcinoma vaginal
Criterios para establecer
causalidad
Este criterio es menos satisfactorio que
los previos por dos razones
 un factor puede causar mas de una
enfermedad
 las enfermedades suelen ser
multifactoriales
La presencia de especificidad es
evidencia fuerte de causalidad, su
ausencia es menos significativa
Criterios para establecer
causalidad
Coherencia con conocimiento actual
(plausibilidad biológica)
 la interpretación causal es plausible en
términos del conocimiento existente
 esto por supuesto depende del nivel del
conocimiento existente
Aplicación a un problema específico:
Cáncer broncógeno y tabaquismo
Intensidad de la asociación
 en todos los estudios mayores la mortalidad
por cáncer broncogénico fue mayor en los
fumadores que en los no fumadores
Relación dosis-respuesta
 se demostró una franca relación entre la
dosis y la respuesta; la mortalidad se
incrementa con cada incremento del
tabaquismo
Aplicación a un problema específico:
Cáncer broncógeno y tabaquismo
Consistencia de la asociación
 se ha demostrado en varios países en
diferentes tipos de población, con estudios
de diferente diseño
 todos demostraron no solo una intensa
asociación, sino también una relación dosis
respuesta
Aplicación a un problema específico:
Cáncer broncógeno y tabaquismo
Asociación temporal correcta
 el cáncer broncógeno suele desarrollarse
muchos después de haber iniciado el habito
de fumar. Esto es consistente con el largo
periodo de latencia característico de la
carcinogenesis
Aplicación a un problema específico:
Cáncer broncógeno y tabaquismo
Otra evidencia temporalmente correcta
es que tanto para fumadores de menos y
de una cajetilla o mas la mortalidad por
cáncer disminuye cuando se abandona el
habito de fumar en comparación con los
que siguen fumando; a mayor tiempo sin
fumar menor la tasa de mortalidad
Aplicación a un problema específico:
Cáncer broncógeno y tabaquismo
Especificidad de la asociación
 Este criterio ha sido imposible de
satisfacer
 El tabaco se asocia a múltiples patologías
Aplicación a un problema específico:
Cáncer broncógeno y tabaquismo
Esto no debe resultar sorprendente
El humo del tabaco es un compuesto
extremadamente complejo que contiene
>4,000 substancias, 50 de ellas
mutágenas
Además el RR para el cáncer de pulmón
es mucho mas alto
Aplicación a un problema específico:
Cáncer broncógeno y tabaquismo
No todas las personas que fuman
desarrollan cáncer del pulmón
 es un padecimiento multifactorial
No todos los pacientes con cáncer
pulmonar son fumadores
 existen otros factores de riesgo para
cáncer broncogénico
Aplicación a un problema específico:
Cáncer broncógeno y tabaquismo
Este criterio se satisface ampliamente
con los conocimientos actuales
 el tabaco contiene numerosos mútagenos
 las tasas están correlacionadas con las
tasas de tabaquismo en la población
 existe coherencia con los cambios
anatómicos e histológicos
Aplicación a un problema específico:
Cáncer broncógeno y tabaquismo
ABOGADO DEL DIABLO: ¿existe una
hipótesis alternativa?
 no puede ser una asociación espuria:
consistencia de la asociación en numerosos
estudios
¿Pudiera ser una asociación indirecta?
Aplicación a un problema específico:
Cáncer broncógeno y tabaquismo
¿Existe un factor subyacente asociado
tanto al tabaquismo como al cáncer?
 ¿diferencias constitucionales?
 poco probable en base a toda la evidencia
disponible
Aplicación a un problema específico:
Cáncer broncógeno y tabaquismo
La única forma de resolver esta
interrogante es mediante un estudio
experimental
ÉTICAMENTE ESTO ES IMPOSIBLE