Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadistica multivariante, Apuntes de Estadística

grado de marketing e investigacion de mercado.Estadistica multivariante

Tipo: Apuntes

2017/2018

Subido el 03/11/2018

cristinaterroba
cristinaterroba 🇪🇸

11 documentos

1 / 7

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
EXAMEN RESUELTO EN CLASE
8 de febrero de 2013
Apellidos..........................................................Nombre…..............................DNI .........................
Se dispone de información económica de las 17 Comunidades Autónomas del Estado Español,
referidas al año 2000. Las variables recogidas en la base de datos son las siguientes:
Variable Descripción
pob Población
Pib.pc Producto interior bruto per capita
paro Tasa de paro según la EPA
tasnat Tasa de natalidad
o.agri Porcentaje de ocupación en agricultura, en
% sobre la población activa
o.ind Porcentaje de ocupación en industria, en %
sobre la población activa
o.ser Porcentaje de ocupación en servicios, en %
sobre la población activa
Responda de forma razonada a los siguientes apartados, especificando en todos los casos
oportunos las hipótesis nula y alternativa de los contrastes correspondientes.
1. Estudie la posible presencia de valores atípicos en la variable tasa de paro.
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Estadistica multivariante y más Apuntes en PDF de Estadística solo en Docsity!

EXAMEN RESUELTO EN CLASE

8 de febrero de 2013

Apellidos..........................................................Nombre…..............................DNI .........................

Se dispone de información económica de las 17 Comunidades Autónomas del Estado Español,

referidas al año 2000. Las variables recogidas en la base de datos son las siguientes:

Variable Descripción

pob Población

Pib.pc Producto interior bruto per capita

paro Tasa de paro según la EPA

tasnat Tasa de natalidad

o.agri Porcentaje de ocupación en agricultura, en

% sobre la población activa

o.ind Porcentaje de ocupación en industria, en %

sobre la población activa

o.ser Porcentaje de ocupación en servicios, en %

sobre la población activa

Responda de forma razonada a los siguientes apartados, especificando en todos los casos

oportunos las hipótesis nula y alternativa de los contrastes correspondientes.

1. Estudie la posible presencia de valores atípicos en la variable tasa de paro.

2. Se ha realizado un análisis de componentes principales.

a) Indique cuántas componentes principales se retienen y en base a qué criterio. ¿Qué

porcentaje de la varianza total explican cada una de ellas, y en su conjunto? Indique

algún otro criterio razonable de elección del número de componentes a retener.

b) Interprete las componentes retenidas.

3. Se ha realizado un análisis de conglomerados. Caracterice o etiquete los clusters.

4. Posteriormente se realiza un análisis discriminante para la validación de los clusters:

a) Evalúe la capacidad discriminante de las funciones definidas.

b) Analice la matriz de clasificación y comente la capacidad predictiva del modelo.

c) ¿Qué variable tiene mayor poder discriminante? ¿Por qué?

ANEXO DE TABLAS ESTADÍSTICAS

Paro

Datos/Variable: paro 17 valores con rango desde 5,65 a 23, Número de valores actualmente excluidos: 0

Media muestral 12, Mediana muestral 11, Media recortada 11, Media Winsorizada 11, Estimados de Localización Intervalos de confianza del 95,0% para la media

Límite Inferior Límite Superior

Estándar 9,9107 15, Winsorizada 9,16317 14, Recorte: 15,0%

Estimados de Escala Desviación estd. muestral 4, DAM/0.6745 3, Sbi 4, Sigma Winsorizada 4,

Análisis de Conglomerados

Número de casos completos: 17 Método de Conglomeración: Ward Métrica de Distancia: Euclideana Cuadrada Conglomeración: observaciones Estandarizar: sí

Resumen de Conglomeración Conglomerado Miembros Porcentaje 1 2 11, 2 3 17, 3 6 35, 4 2 11, 5 4 23,

Centroides Conglomerado o_agri o_ind o_ser paro pib_pc pob tasnat 1 12,705 11,525 75,77 23,115 10451,4 4,23867E6 10, 2 7,90333 29,2033 62,8933 6,74 17090,6 675472, 9, 3 10,6267 19,4583 69,915 13,8633 12913,7 1,62845E6 8, 4 4,39 8,66 86,95 9,575 14996,3 1,33E6 11, 5 2,16 24,64 73,2 10,7875 17497,2 4,50947E6 9,

Tabla de Miembros Método de Conglomeración: Ward Métrica de Distancia: Euclidea Cuadrada

Fila Etiqueta Conglomerado Fila Etiqueta Conglomerado 1 Andalucía 1 11 Galicia 3 2 Aragón 2 12 Madrid 5 3 Asturias 3 13 Murcia 3 4 Baleares 4 14 Navarra 2 5 C.León 3 15 P.Vasco 5 6 C.Mancha 3 16 Rioja 2 7 Canarias 4 17 C. Valenciana 5 8 Cantabria 3 9 Catalunya 5 10 Extremadura 1

Análisis Discriminante

Variable de clasificación: CLUSTNUMS (Números de Conglomerado) Variables independientes: o_agri pib_pc pob tasnat o_ser paro

Número de casos completos: 17 Número de grupos: 5

Función Eigenvalor Porcentaje Correlación Discriminante Relativo Canónica

Funciones Lambda Derivadas de Wilks Chi-Cuadrada GL Valor-P 1 0,00124761 70,2085 24 0, 2 0,0257536 38,4214 15 0, 3 0,176021 18,2401 8 0, 4 0,763389 2,8349 3 0,

Tabla de Clasificación Actual Tamaño Predicho CLUSTNUMS CLUSTNUMS de Grupo 1 2 3 4 5 1 2 2 0 0 0 0 (100,00%) ( 0,00%) ( 0,00%) ( 0,00%) ( 0,00%) 2 3 0 3 0 0 0 ( 0,00%) (100,00%) ( 0,00%) ( 0,00%) ( 0,00%) 3 6 0 0 6 0 0 ( 0,00%) ( 0,00%) (100,00%) ( 0,00%) ( 0,00%) 4 2 0 0 0 2 0 ( 0,00%) ( 0,00%) ( 0,00%) (100,00%) ( 0,00%) 5 4 0 0 0 0 4 ( 0,00%) ( 0,00%) ( 0,00%) ( 0,00%) (100,00%)

Porcentaje de casos correctamente clasificados: 100,00%

Coeficientes de la Función Discriminante para CLUSTNUMS

A 1 2 3 4

o_agri -0,0343095 0,556564 -0,967735 -0, o_ser -0,214552 1,38357 0,0847346 0, paro 1,32485 -0,556949 0,0745487 -0, pib_pc 0,123238 -0,582873 -0,192283 -0, pob 0,26476 -0,234547 0,543762 0, tasnat 0,779392 -0,481101 0,0584431 -1,

Coeficientes Sin Estandarizar 1 2 3 4 o_agri -0,0134734 0,218564 -0,380032 -0, o_ser -0,0550103 0,354741 0,0217256 0, paro 0,831241 -0,349442 0,0467735 -0, pib_pc 0,0000745164 -0,000352437 -0,000116265 -0, pob 1,55891E-7 -1,38101E-7 3,20167E-7 2,11404E- tasnat 0,471584 -0,291098 0,035362 -0, CONSTANTE -12,26 -14,6251 1,3607 18,

Pregunta 1 – Estudie la posible presencia de valores atípicos en la variable tasa de paro

TABLA DE CLASIFICACION - Vemos que el 100% de los clubster están bien clasificados.

COEFICIENTES DE LA FUNCION DISCRIMINANTE PARA CLUSTNUMS - La variable con

mayor poder discriminante es en el componente 1 ( paro), en componente 2 (servicios), en

componente 3 (agricultura), y componente 4 (pib).