Analisis de Componentes principales

Análisis multivariado
-Las técnicas multivariadas permiten establecer relaciones
de similitud global (o fenéticas) entre unidades de estudio,
sobre la base de la evidencia que brindan sus caracteres
-A partir de los resultados de estas técnicas (e.g. un
fenograma), el especialista podrá adoptar decisiones
taxonómicas con respecto a las especies y las variaciones
infraespecíficas.
Análisis multivariado
Técnicas de Agrupamientos
„ Método del ligamiento promedio no ponderado
(UPGMA: Unweighted pair group method)
Técnicas de ordenación
„ Análisis de Componentes principales
„ Análisis de Coordenadas principales
„ Análisis Factorial Múltiple
Arboles de distancia
„ Árboles de Neighbor-Joining
Pasos de Aplicación de Técnicas de Agrupamientos:
construcción de fenogramas
„
„
„
„
„
„
„
„
Elección de las OTU a estudiar
Selección y registro de caracteres
Construcción de una matriz de datos de OTU por caracteres.
Cálculo de un coeficiente de similitud (o disimilitud) entre cada
par posible de OTU
Construcción de una matriz de similitud (o disimilitud) entre
OTU
Obtención del fenograma entre OTU
Medida de la distorsión del fenograma
Descripción del fenograma e interpretación de resultados
-Elección de OTU (Operational Taxonomic Units)
-Selección y registro de caracteres
-Construcción de una matriz de datos
-Selección y registro de caracteres
-Construcción de una matriz de datos
-Cálculo de un coeficiente de similitud entre cada para posible
de OTU
Coeficientes de correlación
Coeficientes de distancia
Aplicación de un coeficiente de similitud
n
Manhattan Distance Σ [ Xij-Xik]
i=1
Jaccard __a___
a+b+c
Simple Matching a
+
d
a+b +c +d
Construcción de una matriz de similitud
Construcción de una matriz de similitud
Construcción de fenogramas
Construcción de fenogramas
Desventajas de las técnicas de agrupamientos
„
Siempre aparecen grupos delimitados, aun cuando éstos no se
ajusten a la estructura de los datos.
„
Mediante estas técnicas no se puede evaluar la similitud
homóloga.
„
Sin embargo, dado que los algoritmos propuestos por la
Cladística operan sobre datos discretos, las técnicas de
agrupamientos, al igual que los árboles basados en distancias,
constituyen herramientas útiles para el análisis de datos
continuos frecuentemente utilizados para el estudio de la
variación infraespecífica mediante marcadores moleculares.