Tarea 3 Escalamiento Multidimensional y Conglomerados Fecha de

Tarea 3
Escalamiento Multidimensional y Conglomerados
Fecha de entrega LUNES Noviembre 24
1. Con los datos de infertilidad.txt,
• calcular una matriz de disimilitudes usando el índice de Gower, comenta acerca de la
escala de las variables ¿cuántas distancias debe haber? Verifica que las distancias sean
mayores a cero, si hay alguna cero, sería como tener un dato duplicado, elimina uno de
ellos.
library(cluster)
library(MASS)
infertil.dist<-daisy(infertil,metric="gower", type = list(asymm = 5))
•
hacer un escalamiento métrico, ¿en qué dimensión conviene tener las coordenadas?
infertil.mds<-cmdscale(infertil.dist,eig=TRUE)
•
presentar las medidas de bondad de ajuste de cada escalamiento, , ¿en qué dimensión
conviene dejar las coordenadas? comentar.
infertil.mds$GOF
infertil.mds$eig
•
hacer un escalamiento no-métrico
infertil.isomds<-isoMDS(infertil.dist,k=8)#se puede cambiar k, que es la dimensión de los datos
•
presentar las gráficas (recuerda comentarlas) de cada escalamiento
plot(cmdscale(infertil.dist))
text(cmdscale(infertil.dist),labels=1:40)
plot(infertil.isomds$points)
text(infertil.isomds$points,labels=1:40)
•
hacer la gráfica de escalones de distancias ajustadas versus disimilitudes Gower, para
poder elegir la dimensión de la representación no métrica, presenta el STRESS.
infertil.sh <- Shepard(infertil.dist, infertil.isomds$points)
plot(infertil.sh, pch = ".")
lines(infertil.sh$x, infertil.sh$yf, type = "S")
infertil.isomds$stress
2. Con los mismos datos de infertilidad.txt
•
Realiza una clasificación jerárquica
infertil.hc <- hclust(infertil.dist, method="complete") prueba otras ligas aparte de la
complete: "ward.D","ward.D2", "single", "complete", "average",
• Elige una liga o dos y cambia el número de grupos, calcula la amplitud para encontrar
el número de grupos k que te de una mejor agrupación.
##para calcular la amplitud total con 12 grupos
summary(silhouette(cutree(infertil.hc, k=12), infertil.dist))$avg.width
##para hacer grafica de amplitud por grupos ejemplo k=7
plot(silhouette(cutree(infertil.hc, k=7), infertil.dist),col=1:7)