Consensus of clusters
El consenso corresponde a la frecuencia o probabilidad con que los grupos se mantiene durante un proceso de boostrap. En un inicio se construye una clasificacion jerarquica, mediante el calculo de la distancia entre individuos y el metodo de agrupamiento. Para estos proceimiento iniciales, R dispone de dos procedimientos dist() y hclust(), el primero construye la matriz de distancia de disimilaridad y el segundo con esta matriz realiza segun el metodo en agrupamiento jerarquico, que se muestra por lo general en un dendrograma.
El proceso de boostrap se aplica a las variables y no a los individuos. Cada individuo dispone del mismo tipo y numero de variables que permitiran construir siempre un dendrograma cada vez, permitiendo la contabilidad de grupos previamente obtenidos en un principio.
La funcion consensus() puede
utilizar todos los metodos de distancia y agrupamiento que dispone R en sus
funciones dist() y hclust().
Permite el control de duplicados, reproducibilidad del dendrograma, realizar
cortes del dendrograma, modificar el estilo, forma y color del dendrograma
Ejemplos:
Consenso
por defecto: métodos aplicados distancia binaria y método completo para
el agrupamiento y 500 muestras boostrap
.
> library(agricolae)
> data(markers)
> output1<-consensus(markers)
Duplicates: 6
New data : 17 Records
Consensus hclust
Method distance: binary
Method cluster : complete
rows and cols : 17 27
n-boostrap : 500
Run time : 7.859 secs
> names(output1)
[1] "table.dend" "dendrogram" "duplicates"
> output$duplicates
duplicate unique
17 OTU10 OTU6
18 OTU12 OTU9
20 OTU17 OTU16
21 OTU18 OTU16
22 OTU19 OTU16
23 OTU21 OTU20

Consenso
variando los parametros:
> output2<-consensus(markers,nboot=1000,
duplicate=FALSE)
Consensus hclust
Method distance: binary
Method cluster : complete
rows and cols : 23 27
n-boostrap : 1000
Run time : 21.203 secs
> cons<-output2$table.dend
> dend<-as.dendrogram(output2$dendrogram)
> plot(dend)
> text(cons[,3],cons[,4],cons[,5],col="red")

> output3<-consensus(markers,nboot=1000,
duplicate=TRUE)
Duplicates: 6
New data : 17 Records
Consensus hclust
Method distance: binary
Method cluster : complete
rows and cols : 17 27
n-boostrap : 1000
Run time : 16.047 secs
> cons<-output3$table.dend
> dend<-as.dendrogram(output3$dendrogram)
> plot(dend, type="t")
> text(cons[,3],cons[,4],cons[,5],col="red",cex=1)

>
plot(dend,type="t",edgePar = list(lty=1:2,
col=2:1))
> text(cons[,3],cons[,4],cons[,5],col="blue",cex=1.5)

Cortes
a una altura: función hcut. Se puede utilizar cualquier output.
> par(mfrow=c(2,2),mar=c(3,2,3,2),cex=0.6)
> hcut(output3, h=0.4,group=1,cex.text=1.5,type="t",main="group
1")
numbers
1 3
2 8
3 1
4 5
> hcut(output3, h=0.4,group=2,cex.text=1.5,type="t",main="group
2")
> hcut(output3, h=0.4,group=3,cex.text=1.5,type="t",main="group 3")
> hcut(output3, h=0.4,group=4,cex.text=1.5,type="t",main="group 4")
