

































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: analisis, Profesor: Desconocido Desconocido, Carrera: Biología, Universidad: UAH
Tipo: Diapositivas
Subido el 23/06/2015
1 / 73
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!


































































Motivación Métodos para construir clustersMétodos para construir clusters Clasificación con el algoritmo de k-medias Clasificación con métodos jerárquicos
Dendrograma Distancias/disimilitud entre individuos
Criterios de proximidad entre grupos Determinación del número de grupos
Ejemplo:Ejemplo: Sostenibilidad municipal^ Disponemos de datos deconsumo per cápita en103 municipios de la
p
Comunidad de Madriddurante 20 años Nos interesa identificar si hay grupos de municipios con una tendenciasimilar en el consumo de agua para identificar buenas prácticas para
la sostenibilidad y zonas problemáticas por alto consumo
y^
p^
p
EjemploEjemplo:
: Mamíferos
Queremos agrupar 25 especies de mamíferos en clusters, en losque las especies tengan en común una cierta homogeneidad en las
í
características de su leche
Un
es
un
grupo
de
individuos
que
cuando
la
dimensión
¿QUÉ es un CLUSTER?¿QUÉ es un CLUSTER?
Un
es
un
grupo
de
individuos
que
, cuando la dimensión
lo permite, el ojo humano identifica como homogéneos entre sí yseparados de los individuos de los otros clusters.
p
l^
d^
di
i^
i^
tá
l^
á^
t
¿QUÉ es un CLUSTER?¿QUÉ es un CLUSTER?
Incluso
en
dos
dimensiones
no
siempre
está
claro
cuántos
cluster hay y cómo se agrupan los individuos.
Motivación Métodos para construir clustersMétodos para construir clusters
Técnicas para encontrar clustersCuando conocemos cuántos grupos hay:Cuando conocemos cuántos grupos hay:
Producen una partición de
los objetos en un número especificado de grupos siguiendolos objetos en un número especificado de grupos siguiendoun criterio de optimización CLUSTERCLUSTER
Producen
una
secuencia
de
Cuando no conocemos cuántos grupos hay:
particiones, juntando o separando clusters. En cada paso sejuntan
o^
separan
dos
clusters
siguiendo
algún
criterio
especificado especificado
Técnicas para encontrar
clusters
En general, se busca
dentro de los grupos y
entre grupos
Técnicas para encontrar
clusters
Los
criterios
para
identificar
los
clusters
se
basan
siempre
en
entre grupos
MEDIDAS de SIMILITUD
o de
entre todos los
pares
de
datos.
Algunos
procedimientos
cluster
se
pueden
ejecutar conociendo sólo la
de
ejecutar conociendo sólo la
de
estandarizados
dependiendo de si los datos son cuantitativos o cualitativos 4
Clusters por particiones: Elegir un criterio de
Clusters jerárquicos: Elegir un criterio para unir grupos,^ DISTANCIA ENTRE GRUPOS
univariantes
j
ij
ij^
s
x
x
z^
La transformación se aplica a cadaelemento de la matriz de datos,restando la media y dividiendo por la
s^ j
restando la media y dividiendo por la desviación típica, por variables(columnas)
Propiedades:
t i
d^
i^
d^
l^
d t
t^
d^
i^
d^
l^
t i
d
Datos:Datos:
xx
t^
i^
t^
i^
Ejemplo de puntuacionEjemplo de puntuaciones
es Z:
Datos:Datos:
xx
Puntuaciones Z:Puntuaciones Z:
yy
ClustersClusters por particiones
por particiones
Existen distintos métodos que difieren en alguna característica K
Es
el
que
se
usa
más
habitualmente
Fácil
de
Es
el
que
se
usa
más
habitualmente
Fácil
de
estandarizadosestandarizados
dependiendo de si los datos son cuantitativos o cualitativos
idi
l^
ú^
d^
l^
t
tiene
por
objetivo
separar
las
observaciones
en
k
tiene
por
objetivo
separar
las
observaciones
en
k
clusters, de manera que cada dato pertenezca
a un grupo y
sólo a uno El algoritmo de
busca con un
método iterativo:
k
clusters.
C
C
El objetivo de
C
C
que se persigue es “maximizarla homogeneidad dentro de losgrupos”grupos