Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Tema 1, Apuntes de Estadística

Asignatura: Estadística multivariante, Profesor: Marisa Aguilar, Carrera: Marketing e Investigación de Mercados, Universidad: UMA

Tipo: Apuntes

2016/2017

Subido el 01/12/2017

marketiniana24
marketiniana24 🇪🇸

3.2

(12)

11 documentos

1 / 173

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Estadística Multivariante
Aguilar, M.; Castro, M.; Cruces, E. y Díaz, B.
Curso 2017-2018
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Vista previa parcial del texto

¡Descarga Tema 1 y más Apuntes en PDF de Estadística solo en Docsity!

Estadística Multivariante

Aguilar, M.; Castro, M.; Cruces, E. y Díaz, B.

Curso 2017-

Tema 1: Introducción al Análisis Multivariante

1.1.- Técnicas del Análisis Multivariante.

1.2.- Fases del Análisis Multivariante.

1.3.- Hipótesis del Análisis Multivariante.

1.4.- Análisis de casos perdidos.

1.5.- Análisis de casos atípicos.

1.6.- Resolución de casos prácticos con ordenador.

Análisis Multivariante :

 Concepto : Métodos estadísticos para el tratamiento conjunto

de diversas variables, más allá del análisis unidimensional y

bidimensional (Uriel).

 Algunos métodos realizan un tratamiento descriptivo , otros

además hacen inferencia sobre los parámetros poblacionales.

 Para la inferencia será necesario realizar hipótesis

estadísticas. La distribución normal multivariante juega un

importante papel en este apartado.

Técnicas del análisis multivariante

Clasificación de las principales técnicas según su enfoque:

 Reducir, evitar redundancias (variables):

o Análisis de componentes principales o Análisis de correspondencias

 Relacionar, explicar (variables):

o ANOVA o Test de Kruskal-Wallis o Análisis discriminante o Modelos de regresión lineal y de elección discreta (probit, logit)

 Agrupar, clasificar (casos u observaciones):

o Análisis cluster o de conglomerados

Técnicas del análisis multivariante

Técnicas del análisis multivariante Principales técnicas de dependencia

ANOVA (Análisis de la Varianza) : Determinar en qué medida una variable dependiente cuantitativa está condicionada por una o más variables independientes categóricas que se denominan factores. Generalización del test de diferencia de medias en poblaciones normales.

Kruskal-Wallis : Es el equivalente no paramétrico del ANOVA (comparación de medianas de k grupos; generalización del test no paramétrico de localización de suma de rangos de Wilcoxon).

Análisis discriminante : Caracterizar mediante un conjunto de variables independientes cuantitativas las diferencias entre distintos grupos y clasificar observaciones cuando se desconoce el grupo al que pertenecen.

Técnicas del análisis multivariante

Modelo de regresión lineal : Cuantificar la relación existente entre una variable dependiente cuantitativa y una o varias variables independientes (Modelo de regresión lineal simple / Modelo de regresión lineal múltiple).

Modelos probit y logit: Cuantificar la relación existente entre una variable dependiente cualitativa binaria (valores 0 y 1) y un conjunto de variables independientes.

Técnicas del análisis multivariante

Componentes principales : Técnica de reducción de la dimensión, que intenta transformar un conjunto de variables en otro de menor número que estén incorrelacionadas entre si.

Análisis de correspondencias : Se aplica al análisis de tablas de contingencia. Se construye un diagrama cartesiano en el que se representan conjuntamente las distintas modalidades de la tabla, de forma que la proximidad entre los puntos representados está relacionada con el nivel de asociación entre dichas modalidades.

Análisis de conglomerados ( cluster ) : Partición de un conjunto de observaciones en grupos tales que las observaciones pertenecientes a un mismo grupo son muy similares entre sí pero muy diferentes a las pertenecientes a otros grupos.

Principales técnicas de interdependencia

Técnicas del análisis multivariante

Técnica Tipo de variables Objetivo

Componentes

principales

Cuantitativas

Reducir

variables

Análisis de

correspondencias

Cualitativas

Reducir

variables

Análisis de

conglomerados o cluster

Cuantitativas y

cualitativas

Agrupar

casos

Principales técnicas de interdependencia

Fases del análisis multivariante

1) Objetivos del análisis. Se define el problema, especificando los objetivos, las variables y las técnicas multivariantes que se van a aplicar. Es importante que al concretar las variables a observar, se establezca su escala de medida, teniendo en cuenta el tipo de análisis que se quiere realizar. 2) Diseño y análisis exploratorio de la base de datos.  Ver si existen fuentes primarias de datos disponibles que se ajusten a nuestro propósito o, en caso contrario, diseñar el estudio de muestreo (determinar el tamaño muestral, realizar encuestas, introducir los datos, etc.).  Analizar los datos perdidos (missing) y las observaciones atípicas ( outliers ), para tener en cuenta su influencia sobre las estimaciones y la bondad de ajuste.

Fases del análisis multivariante

3) Evaluación de las hipótesis subyacentes en la técnica multivariante que va a llevarse a cabo (normalidad, linealidad, independencia, homocedasticidad, etc.).

4) Realización del análisis estadístico e interpretación de resultados. A veces los resultados obtenidos pueden sugerir la necesidad de re-especificar el modelo o alguna de las variables.

5) Validación del análisis. Consiste en establecer la validez de los resultados obtenidos en la muestra, analizando si se pueden generalizar a la población de la que procede. Se hace con diferentes métodos, que incluyen: (1) división de la muestra de tal forma que se use una sub-muestra para estimar el modelo y una segunda para analizar la capacidad predictiva (2) empleo de técnicas de re-muestreo y, a veces, (3) obtención de una muestra distinta que permita asegurar que los resultados no son particulares de la muestra elegida.

Hipótesis del análisis multivariante

 Como veremos en los próximos temas, los principales

supuestos de partida que deben cumplirse para poder

aplicar la mayoría de las técnicas estadísticas son los de

normalidad, linealidad y homocedasticidad (igualdad de

varianzas).

Hipótesis del análisis multivariante

1) Supuesto de normalidad.

 La normalidad multivariante implica normalidad univariante.  Se aconseja iniciar el análisis contrastando la normalidad univariante (si bien esto no siempre garantiza que las variables sean normales conjuntamente):  Si alguna variable no es normal podemos concluir que no se cumplirá la normalidad multivariante.  Los contrastes multivariantes son más complejos, pedagógicamente se entienden mejor viendo primero los univariantes, y además, no siempre vienen incluidos en los programas estadísticos (por ejemplo, no están disponibles en Statgraphics ni en SPSS).

Hipótesis del análisis multivariante

Hipótesis a verificar : H 0 : X (^) j es normal H 1 : H 0 no es cierta

 Estadístico de prueba :

siendo D 1 = |Fn(xi-1 )- F 0 (xi )| D 2 =| Fn(xi )- F 0 (xi )|

Test de normalidad de Kolmogorov-Smirnov-Lilliefors

Para cada x (^) i se calcula la distancia entre la función de distribución empírica y la teórica. Como la función empírica es un diagrama escalonado, su distancia a la distribución teórica puede medirse a partir de la ordenada Fn(xi-1) o de la F (^) n(xi-1)

Dn=max D 1 (xi ), D 2 (xi ) i=1,2,...,n

Hipótesis del análisis multivariante

Fn(xn)=

x 1 x 2 .........^ xi- 1 xi ................ xn

Fn(xi)

Fn(xi- 1 )

Fn(x 2 ) Fn(x 1 )

F 0 (x)

F 0 (xi) D 1 (xi)

D 2 (xi)

Segmento rojo: D 1 (xi) =|Fn(xi- 1 ) - F 0 (xi)| Segmento azul: D 2 (xi) =|Fn(xi) - F 0 (xi)|