Prepara tus exámenes
Consigue puntos
Orientación Universidad
Vende en Docsity
Docsity AI

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Orientación Universidad

Vende en Docsity

Docsity AI

Inicia sesión Regístrate

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Busca documentos

Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity

Busca tu universidad

Encuentra los documentos específicos para los exámenes de tu universidad

Video Cursos

Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades

Quiz

Responde a preguntas de exámenes reales y pon a prueba tu preparación

Docsity AINEW

Resume tus documentos, hazles preguntas, conviértelos en quiz y mapas conceptuales

Ver preguntas

Despeja tus dudas leyendo las respuestas a las preguntas que realizaron otros estudiantes como tú

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Compartir documentos

20 Puntos

Por cada documento subido

Responde a las preguntas

5 Puntos

por cada respuesta dada (máx. 1 al día)

Todos los modos para conseguir puntos gratis

Consigue puntos de inmediato

Elige un plan Premium con todos los puntos que necesitas.

Oportunidades de estudio

Elige tu próximo programa de estudio

Ponte en contacto inmediatamente con las mejores universidades del mundo. Busca entre miles de universidades en todo el mundo. Busca entre miles de universidades partner oficiales

Comunidad

Pregúntale a la comunidad

Pide ayuda a la comunidad y resuelve tus dudas de estudio

Ebooks gratuitos

¡Nuestros e-books salva-estudiantes!

Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity

cluster, Apuntes de Psicología

Universidad del País Vasco / Euskal Herriko Unibertsitatea Psicología

Prof. Jone Datos

Asignatura: analisis de datos, Profesor: jone datos, Carrera: Psicología, Universidad: UPV-EHU

Tipo: Apuntes

2014/2015

Subido el 19/10/2015

trinidad.gigena 🇪🇸

3.7

(111)

62 documentos

1 / 9

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

Análisis de conglomerados

Proyecto e-Math 1

Financiado por la Secretaría de Estado de Educación y Universidades (MECD)

ANÁLISIS DE CONGLOMERADOS

Autor: Manuel Terrádez Gurrea (m[email protected]).

ESQUEMA DE CONTENIDOS_______ ________________________

INTRODUCCIÓN ___________________

El análisis de conglomerados (cluster) es una técnica multivariante que busca agrupar

elementos (o variables) tratando de lograr la máxima homogeneidad en cada grupo y la mayor

diferencias entre los grupos.

Nos basaremos en los algoritmos jerárquicos acumulativos (forman grupos haciendo

conglomerados cada vez más grandes), aunque no son los únicos posibles.

El dendograma es la representación gráfica que mejor ayuda a interpretar el resultado de un

análisis cluster.

El análisis de conglomerados se puede combinar con el Análisis de Componentes Principales, ya

que mediante ACP se puede homogeneizar los datos, lo cual permite realizar posteriormente un

análisis cluster sobre los componentes obtenidos.

OBJETIVOS ________________________

• Entender por qué es importante agrupar elementos parecidos en bloques diferentes.

• Saber aplicar el análisis de conglomerados, con ayuda de Minitab.

• Interpretar el dendograma resultante del análisis.

Análisis de

conglomerados

(cluster)

Interpretación de

dendo

g

ramas

Descubre Apuntes de Psicología Universidad del País Vasco / Euskal Herriko Unibertsitatea

Documentos relacionados

pruebas de significaion

(3)

4.4 Parte básica 4.4.1 Introducción a los contrastes de hipótesis 4.4.2 Conceptos básicos

introduccion al spss

distribucion normal

(1)

Varianza, media y otros parámetros estadísticos

(3)

datos

(8)

analisis no parametricos

(1)

Somestesia

(1)

Análisis de datos para diseños de dos grupos

(9)

Validez de la investigacion. Conclucion estadistica, interna, constructo y externa

(2)

Análisis de regresión lineal: conceptos y procedimiento - Prof. Datos

(2)

Diseños de investigación y análisis de datos

(4)

Vista previa parcial del texto

¡Descarga cluster y más Apuntes en PDF de Psicología solo en Docsity!

Proyecto e-Math 1

ANÁLISIS DE CONGLOMERADOS

Autor: Manuel Terrádez Gurrea ([email protected]).

ESQUEMA DE CONTENIDOS_ __________________

INTRODUCCIÓN ___________________

El análisis de conglomerados ( cluster ) es una técnica multivariante que busca agrupar elementos (o variables) tratando de lograr la máxima homogeneidad en cada grupo y la mayor diferencias entre los grupos.

Nos basaremos en los algoritmos jerárquicos acumulativos (forman grupos haciendo conglomerados cada vez más grandes), aunque no son los únicos posibles.

El dendograma es la representación gráfica que mejor ayuda a interpretar el resultado de un análisis cluster.

El análisis de conglomerados se puede combinar con el Análisis de Componentes Principales, ya que mediante ACP se puede homogeneizar los datos, lo cual permite realizar posteriormente un análisis cluster sobre los componentes obtenidos.

OBJETIVOS ________________________

Entender por qué es importante agrupar elementos parecidos en bloques diferentes.
Saber aplicar el análisis de conglomerados, con ayuda de Minitab.
Interpretar el dendograma resultante del análisis.

Análisis de

conglomerados

( cluster )

Interpretación de dendogramas

Proyecto e-Math 2

CONOCIMIENTOS PREVIOS ___________________________________

Aparte de estar iniciado en el uso del paquete estadístico Minitab, resulta muy conveniente haber leído con profundidad los siguientes math-blocks :

Estadística descriptiva.
Correlación y regresión lineal múltiple.

CONCEPTOS FUNDAMENTALES ______________________________

Medidas de disimilitud

Partimos de una matriz de información que contiene las observaciones de todas las variables sobre los diferentes elementos considerados (ver Tabla 1), y calculamos las diferencias entre dichos elementos mediante alguna de las medidas de disimilitud habituales: la distancia

euclidiana ( ∑

=

J

j

Xrj Xsj

1

( )^2 ), su cuadrado, la distancia de City-Block (

=

J

j

Xrj Xsj

1

la de Mahalanobis, la de Minkowski, la de Tchebychef, etc. Todas ellas proporcionan ordenaciones muy similares de las distancias en casi todos los casos.

Tabla 1 Elementos X 1 X 2 ... XJ 1 X 11 X 12 ... X1J 2 X 21 X 22 ... X2J ... ... ... ... ... K XK1 XK2 ... XKJ

Algoritmos de clasificación

Para clasificar los elementos en clusters utilizaremos algoritmos jerárquicos , que pueden ser acumulativos (se forman grupos haciendo clusters cada vez más grandes) o disminutivos (partiendo de un solo grupo se separan los elementos en clusters cada vez más pequeños).

Entre los algoritmos jerárquicos acumulativos destacan los siguientes métodos:

Método de las distancias mínimas: se busca la mayor semejanza entre los elementos o grupos más cercanos.
Método de las distancias máximas: se calcula la mínima distancia entre los elementos más alejados.
Método de las distancias medias: se calcula la media de las distancias entre elementos.

Proyecto e-Math 4

CASOS PRÁCTICOS CON SOFTWARE___________________________________

Calificaciones escolares

Vamos a utilizar los datos del archivo asignaturas.mtw , que recogen las calificaciones de los 15 alumnos de una clase en diversas asignaturas

Stat Æ Multivariate Æ Cluster Observations...

Tal y como podemos apreciar en los gráficos siguientes, solicitaremos el análisis con las variables estandarizadas, así como el dendograma (representado en función de las distancias).

Proyecto e-Math

Proyecto e-Math 7

El dendograma también nos sirve para saber la composición de cada cluster en cada paso: por ejemplo, si quisiéramos hacer una división en 5 conglomerados bastaría con trazar la línea azul y comprobaríamos que las observaciones 5, 11, 12 y 14 quedarían aisladas (formando cada una de ellas un cluster de tamaño 1), y el resto de observaciones formarían otro grupo.

Sin embargo, si deseáramos conocer la división en 8 conglomerados trazaríamos la línea roja, y obtendríamos la siguiente distribución:

CLUSTER OBSERVACIONES

Proyecto e-Math 8

División en distritos de una ciudad

Procedemos análogamente con el archivo entidades.mtw , que recoge datos relativos a los distritos de la ciudad de Valencia (Fuente: Anuario Estadístico de Valencia 1999).

Las variables son las siguientes: NOMBRE (Nombre abreviado del distrito), SUPERFICIE (Superficie del distrito en m 2 ), HABITANTES (Número de habitantes), TURISMOS (Número de turismos), VIVIENDAS (Número de viviendas), A E Industriales (Número de actividades económicas industriales), ENTIDADES BANCARIAS y TIPO (1: Centro, 2: Pericentro, 3: Periferia).

Obtenemos el dendograma que aparece más abajo, y nos interesa responder a las siguientes preguntas:

a) ¿Cuáles son las dos observaciones más similares entre sí?

b) ¿Cuáles son las dos observaciones más distintas al resto?

c) Si realizamos una división en 4 grupos, ¿qué observaciones contendría cada grupo? ¿Y si la división fuera en 7 grupos?

d) ¿Qué se podría decir sobre la homogeneidad de los datos?

a) Las observaciones más similares entre sí son las que menor distancia presentan: en este caso, la 5 y la 12.

b) La observación más distinta al resto es claramente la 19, ya que es la última que se incorpora al grupo, siendo su distancia a él la mayor; la siguiente es la 1.

c) Realizando 4 conglomerados (línea azul), uno de ellos contendría a la observación 19, otro a la 1, otro a la 17 y la 18, y el resto de observaciones (2-16) formarían un grupo. Con 7 grupos (línea roja), seis de ellos serían individuales (observaciones 1, 6, 10, 17, 18, 19) y todas las demás observaciones formarían el grupo restante.

d) Podemos considerar que en general los datos son bastante homogéneos, ya que la mayoría de

observaciones quedan a una distancia inferior a 2 del resto; sin embargo, hay algunas que se alejan mucho de las demás, como es el caso de la 1 y la 19.

1 4 14 2 3 11 5 12 7 8 9 15 13 16 10 6 17 18 19

0,

1,

2,

3,

cluster, Apuntes de Psicología

Documentos relacionados

Vista previa parcial del texto

¡Descarga cluster y más Apuntes en PDF de Psicología solo en Docsity!

ANÁLISIS DE CONGLOMERADOS

ESQUEMA DE CONTENIDOS_______ ________________________

INTRODUCCIÓN ___________________

OBJETIVOS ________________________

Análisis de

conglomerados

( cluster )

CONOCIMIENTOS PREVIOS ___________________________________

CONCEPTOS FUNDAMENTALES ______________________________

 Medidas de disimilitud

euclidiana ( ∑

Xrj Xsj

( )^2 ), su cuadrado, la distancia de City-Block (

Xrj Xsj

 Algoritmos de clasificación

CASOS PRÁCTICOS CON SOFTWARE___________________________________

 Calificaciones escolares

Stat Æ Multivariate Æ Cluster Observations...

CLUSTER OBSERVACIONES

 División en distritos de una ciudad

d) Podemos considerar que en general los datos son bastante homogéneos, ya que la mayoría de

Observations

Distance

ESQUEMA DE CONTENIDOS_ __________________

Medidas de disimilitud

Algoritmos de clasificación

Calificaciones escolares

División en distritos de una ciudad