Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Analisis de correspondencia multiple, Ejercicios de Análisis de Datos y Métodos Estadísticos

analisis de correspondencia multiple ejemplos e interpretacion

Tipo: Ejercicios

2020/2021

Subido el 18/05/2022

elo8899
elo8899 🇵🇪

1 documento

1 / 9

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Practica Calificada N°2
PROBLEMA 1:
a) En primer lugar, hallamos la matriz Z con la base de datos.
MATRIZ Z:
Esta matriz es hallada codificando cada nivel de cada factor o variable en estudio, en este
caso existen tres variables: Género, Años e Ingreso. Se coloca el valor de 1 si la observación
pertenece al nivel de la variable respectiva, por ejemplo, la primera observación nos indica
un individuo 1, Mujer, 5 años y un ingreso Medio; por lo que nuestra primera fila de la matriz
Z tomará el valor de 1 en los niveles dichos anteriormente y el valor de 0 en los demás casos.
Finalmente, con la matriz Z, se halla la matriz de Burt (ZZ):
Donde cada bloque o submatriz representa una tabla de contingencia de las variables
tomadas de 2 en 2.
Mujer Hombre 1 2 3 4 5 Bajo Medio Alto
1 0 0 0 0 0 1 0 1 0
1 0 0 0 1 0 0 0 0 1
0 1 0 0 0 1 0 1 0 0
1 0 1 0 0 0 0 1 0 0
1 0 0 1 0 0 0 0 1 0
0 1 0 0 0 0 1 0 0 1
1 0 0 1 0 0 0 0 1 0
0 1 0 0 1 0 0 1 0 0
0 1 1 0 0 0 0 0 0 1
1 0 0 0 0 1 0 0 1 0
GENERO
AÑOS
INGRESO
Mujer Hombre 1 2 3 4 5 Bajo Medio Alto
Mujer 6 0 1 2 1 1 1 1 4 1
Hombre 0 4 1 0 1 1 1 2 0 2
1 1 1 2 0 0 0 0 1 0 1
2 2 0 0 2 0 0 0 0 2 0
3 1 1 0 0 2 0 0 1 0 1
4 1 1 0 0 0 2 0 1 1 0
5 1 1 0 0 0 0 2 0 1 1
Bajo 1 2 1 0 1 1 0 3 0 0
Medio 4 0 0 2 0 1 1 0 4 0
Alto 1 2 1 0 1 0 1 0 0 3
Años
Ingresos
Años
Ingresos
Género
pf3
pf4
pf5
pf8
pf9

Vista previa parcial del texto

¡Descarga Analisis de correspondencia multiple y más Ejercicios en PDF de Análisis de Datos y Métodos Estadísticos solo en Docsity!

Practica Calificada N°

PROBLEMA 1:

a) En primer lugar, hallamos la matriz Z con la base de datos.

MATRIZ Z:

Esta matriz es hallada codificando cada nivel de cada factor o variable en estudio, en este caso existen tres variables: Género, Años e Ingreso. Se coloca el valor de 1 si la observación pertenece al nivel de la variable respectiva, por ejemplo, la primera observación nos indica un individuo 1 , Mujer, 5 años y un ingreso Medio; por lo que nuestra primera fila de la matriz Z tomará el valor de 1 en los niveles dichos anteriormente y el valor de 0 en los demás casos.

Finalmente, con la matriz Z, se halla la matriz de Burt (Z’Z):

Donde cada bloque o submatriz representa una tabla de contingencia de las variables tomadas de 2 en 2.

Mujer Hombre 1 2 3 4 5 Bajo Medio Alto 1 0 0 0 0 0 1 0 1 0 1 0 0 0 1 0 0 0 0 1 0 1 0 0 0 1 0 1 0 0 1 0 1 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 1 0 0 1 1 0 0 1 0 0 0 0 1 0 0 1 0 0 1 0 0 1 0 0 0 1 1 0 0 0 0 0 0 1 1 0 0 0 0 1 0 0 1 0

GENERO AÑOS INGRESO

Mujer Hombre 1 2 3 4 5 Bajo Medio Alto Mujer 6 0 1 2 1 1 1 1 4 1 Hombre 0 4 1 0 1 1 1 2 0 2 1 1 1 2 0 0 0 0 1 0 1 2 2 0 0 2 0 0 0 0 2 0 3 1 1 0 0 2 0 0 1 0 1 4 1 1 0 0 0 2 0 1 1 0 5 1 1 0 0 0 0 2 0 1 1 Bajo 1 2 1 0 1 1 0 3 0 0 Medio 4 0 0 2 0 1 1 0 4 0 Alto 1 2 1 0 1 0 1 0 0 3

Años

Ingresos

Género Años Ingresos

Género

b) Mediante el software SPSS, ingresamos la base de datos y realizamos un analisis de correspondencias múltiples. El cual nos arroja la Masa e Inercia de los individuos u objetos de estudio.

  • La masa nos indica que cantidad de información

nos brinda cada individuo, en este caso como se

observa cada masa es de 0. 1 o 10 %.

Masa

  • La inercia significa la cantidad de variabilidad por

individuo, lo recomendable es que se encuentre

en el valor de: Total_Inercia / n.

Se observa que el valor ideal para la inercia es de

0.233, y la mayoria de las inercias en el problema

estan entre 0.2 y 0.26.

Inercia

Algunos niveles de la variable años solo actúan en la dimensión 1, como los años 1,3 y 2. Mientras que los años 4 y 5 al parecer solo trabajan en la segunda dimensión.

En la variable Ingreso solo el ingreso medio trabaja en una dimensión. Los demás actúan en las 2.

Finalmente podemos notar algunas relaciones existentes entre los atributos de las variables. Por ejemplo:

  • El ingreso medio con los años 4 y 5 no tienen relación alguna.
  • Las edades 1 y 3 tienen relación directa con el género Hombre.
  • El genero mujer guarda una relación con el ingreso Medio.

PROBLEMA 2 :

a) Para hallar el modelo, usamos el software R y la matriz de covarianzas estandarizadas que nos brinda el ejercicio.

De acuerdo con los autovalores y autovectores tendríamos tres posibles modelos para este problema.

𝑍 1 = − 0. 54402 𝐺𝑟𝑎𝑑𝑜 𝑑𝑒 𝐼𝑛𝑠𝑡𝑟𝑢𝑐𝑐𝑖ó𝑛 − 0. 62854 𝐸𝑑𝑎𝑑 − 0. 5558 𝑆𝑜𝑐𝑖𝑜𝐸𝑐𝑜𝑛𝑜𝑚𝑖𝑐𝑜

𝑍 2 = 0. 7312 𝐺𝑟𝑎𝑑𝑜 𝑑𝑒 𝐼𝑛𝑠𝑡𝑟𝑢𝑐𝑐𝑖ó𝑛 − 0. 03015 𝐸𝑑𝑎𝑑 − 0. 68151 𝑆𝑜𝑐𝑖𝑜𝐸𝑐𝑜𝑛𝑜𝑚𝑖𝑐𝑜

𝑍 1 = 0. 4116 𝐺𝑟𝑎𝑑𝑜 𝑑𝑒 𝐼𝑛𝑠𝑡𝑟𝑢𝑐𝑐𝑖ó𝑛 − 0. 77719 𝐸𝑑𝑎𝑑 + 0. 47598 𝑆𝑜𝑐𝑖𝑜𝐸𝑐𝑜𝑛𝑜𝑚𝑖𝑐𝑜

b) Para hallar la dimensión del modelo, procedemos a usar tres técnicas:

Técnica 1: De acuerdo con la gráfica solo tomamos el modelo Z 1

Técnica 2: Observando el % de Varianza Acumulado el cual debe estar entre 80% y 90% se tomará solo el primer valor, porque explica el 72.715% de varianza.

Autovalores

1 2 3

Autovalores

Pais Grado de Publicación N 2. IR 2. GR 1. P 1. Y 0. EE.UU -0. JP -0. UK -0. F -0. G -0. C -0. I -0. A -0. H -0. CH -0. S -0. B -0. E -0. D -0. FI -0. AU -0.

PROBLEMA 3 :

a) Para realizar el ejercicio en la base de datos retiraremos las dos primeras variables al no considerarlos importantes en el estudio:

Mediante el uso del programa SPSS realizaremos un análisis factorial para hallar el modelo del problema, además se usará la matriz de Covarianza en vez de la matriz de Covarianza Estandarizada para no perder mucha información de los datos:

De acuerdo con el factor que nos arroja el estudio, ordenamos los países y observamos quienes tienen más grado de publicación científica.

Pais Grado de Publicación N 2. IR 2. GR 1. P 1. Y 0. EE.UU -0. JP -0. UK -0. F -0. G -0. C -0. I -0. A -0. H -0. CH -0. S -0. B -0. E -0. D -0. FI -0. AU -0.

M
E
N
O
R
M A Y O R M E D I A N O

b) Se segmenta nuestro grupo de países de acuerdo con sus cuantiales, de modo que me queden tres grandes grupos.

El modelo usado para hallar la columna Grado de Publicación es el siguiente: