Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Ejercicios Tema 5 Análisis Multivariante, Ejercicios de Análisis Matemático

Ejercicios Tema 5 Análisis Multivariante

Tipo: Ejercicios

2020/2021

A la venta desde 07/06/2022

alvaro-ruiz-26
alvaro-ruiz-26 🇪🇸

25 documentos

1 / 6

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Soluciones Ejercicios Análisis Multivariante
Aurea Grané Chávez
Grado en Estadística y Empresa
Tema 5: Distancias estadísticas
Solución: Para realizar este ejercicio usaremos el fichero de datos paises.txt. En Matlab
escribimos:
data=load('paises.txt');
X=data(1:20,:)
plotmatrix(X)
corr(X)
Tanto en el gráfico de dispersión matricial como en la matriz de correlaciones se observan
correlaciones elevadas entre pares de variables, por lo que la distancia de Mahalanobis parece
la más adecuada para determinar las proximidades entre estos países.
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Ejercicios Tema 5 Análisis Multivariante y más Ejercicios en PDF de Análisis Matemático solo en Docsity!

Soluciones Ejercicios Análisis Multivariante Aurea Grané Chávez

Tema 5: Distancias estadísticas

Solución: Para realizar este ejercicio usaremos el fichero de datos paises.txt. En Matlab

escribimos:

data=load('paises.txt');

X=data(1:20,:)

plotmatrix(X)

corr(X)

Tanto en el gráfico de dispersión matricial como en la matriz de correlaciones se observan

correlaciones elevadas entre pares de variables, por lo que la distancia de Mahalanobis parece

la más adecuada para determinar las proximidades entre estos países.

Soluciones Ejercicios Análisis Multivariante Aurea Grané Chávez

Para calcular la distancia de Mahalanobis podemos usar las funciones pdist, squareform:

Dmaha=squareform(pdist(X, 'mahal'))

Columns 1 through 12 0 4.9915 5.0095 3.9606 4.8455 5.4364 4.2432 5.1584 3.7495 3.7367 3.2445 3. 4.9915 0 5.3978 4.2849 5.2475 4.5868 4.7991 5.5674 4.8586 3.4846 4.7670 4. 5.0095 5.3978 0 3.6101 5.7598 4.9917 5.2006 5.7598 5.0581 5.0980 5.4449 4. 3.9606 4.2849 3.6101 0 4.4551 4.0664 3.8340 4.8434 4.8863 4.0446 4.2568 3. 4.8455 5.2475 5.7598 4.4551 0 4.9779 5.6676 5.9155 4.5010 4.6815 5.7383 4. 5.4364 4.5868 4.9917 4.0664 4.9779 0 3.8833 5.0221 4.8259 3.8757 4.1403 4. 4.2432 4.7991 5.2006 3.8340 5.6676 3.8833 0 5.5802 4.0308 4.2416 4.5775 3. 5.1584 5.5674 5.7598 4.8434 5.9155 5.0221 5.5802 0 5.1091 4.2292 5.4410 4. 3.7495 4.8586 5.0581 4.8863 4.5010 4.8259 4.0308 5.1091 0 4.6057 4.5377 3. 3.7367 3.4846 5.0980 4.0446 4.6815 3.8757 4.2416 4.2292 4.6057 0 4.3480 3. 3.2445 4.7670 5.4449 4.2568 5.7383 4.1403 4.5775 5.4410 4.5377 4.3480 0 5. 3.4453 4.0277 4.1400 3.8492 4.8976 4.9523 3.5221 4.1629 3.5854 3.3505 5.0246 0 4.6491 5.0930 5.6935 4.6409 5.5427 5.4766 5.2870 5.6457 5.8093 5.0803 5.1779 4. 5.0645 5.2746 6.0117 4.5076 5.6597 5.4545 5.0870 5.8075 5.6693 5.2179 5.4222 4. 3.4549 4.7120 4.8605 3.3304 4.3917 4.2508 4.2035 5.1153 5.1289 2.13 70 4.5252 3. 4.8896 5.5971 5.2062 5.5225 5.8201 4.8416 5.4409 5.8468 4.8648 4.2622 5.4375 4. 2.8351 5.1087 4.5619 3.0272 4.5993 4.1966 3.2479 4.4914 4.5868 2.8318 4.2473 3. 3.5494 3.0085 4.4104 4.0858 4.9730 4.5437 3.7089 5.2720 4.2406 2.3138 4.6204 2. 4.8453 5.6662 5.2277 5.5187 5.3932 4.7261 5.4626 5.7534 5.5231 4.5690 4.8537 4. 4.3622 4.9275 5.1402 4.1334 4.6138 3.6300 2.4609 4.9923 4.1874 3.8041 5.1226 3. Columns 13 through 20 4.6491 5.0645 3.4549 4.8896 2.8351 3.5494 4.8453 4. 5.0930 5.2746 4.7120 5.5971 5.1087 3.0085 5.6662 4. 5.6935 6.0117 4.8605 5.2062 4.5619 4.4104 5.2277 5. 4.6409 4.5076 3.3304 5.5225 3.0272 4.0858 5.5187 4. 5.5427 5.6597 4.3917 5.8201 4.5993 4.9730 5.3932 4. 5.4766 5.4545 4.2508 4.8416 4.1966 4.5437 4.7261 3. 5.2870 5.0870 4.2035 5.4409 3.2479 3.7089 5.4626 2. 5.6457 5.8075 5.1153 5.8468 4.4914 5.2720 5.7534 4. 5.8093 5.6693 5.1289 4.8648 4.5868 4.2406 5.5231 4. 5.0803 5.2179 2.1370 4.2622 2.8318 2.3138 4.5690 3. 5.1779 5.4222 4.5252 5.4375 4.2473 4.6204 4.8537 5. 4.7416 4.5038 3.9829 4.9818 3.1301 2.2563 4.2263 3. 0 6.0150 5.3003 5.3785 4.7128 4.7785 5.6419 4. 6.0150 0 5.2460 5.3498 4.6265 4.9640 5.5053 5. 5.3003 5.2460 0 4.5936 1.8317 3.2227 5.0252 3. 5.3785 5.3498 4.5936 0 4.5976 4.5706 5.9104 4. 4.7128 4.6265 1.8317 4.5976 0 3.2713 4.5069 2. 4.7785 4.9640 3.2227 4.5706 3.2713 0 4.0918 3. 5.6419 5.5053 5.0252 5.9104 4.5069 4.0918 0 4. 4.0911 5.0597 3.9494 4.7324 2.9512 3.4855 4.4521 0

Los países más parecidos (según las variables socio-económicas medidas) son 10 y 15 (Benin y

Camerún), mientras que los más distintos son 13 y 14 (Brasil y Bulgaria).

¿Serían igual de parecidos estos países si hubiéramos considerado la distancia euclídea? Para

poder comparar ambas distancias las estandarizamos según su valor máximo y ordenamos los

pares de valores en función de la distancia de Mahalanobis:

Deuclid=squareform(pdist(X))

m=max(max(Deulid));

mm=max(max(Dmaha));

[d,ind]=sort(squareform(Dmaha));

d2=squareform(Deuclid);

plot(d2(ind)/m,'bo')

hold on

plot(d/mm,'r^')

Como se puede observar en el gráfico, el par más cercano con la distancia de Mahalanobis no se

corresponde con el par más cercano según la euclídea; tampoco coinciden los pares más

alejados.

Soluciones Ejercicios Análisis Multivariante Aurea Grané Chávez

(b) Para calcular las matrices de similaridades utilizaremos las funciones sokal.m y jaccard.m

Soluciones Ejercicios Análisis Multivariante Aurea Grané Chávez