




























































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Estadística multivariante, Profesor: Marisa Aguilar, Carrera: Marketing e Investigación de Mercados, Universidad: UMA
Tipo: Apuntes
1 / 173
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





























































































Técnicas del análisis multivariante
Reducir, evitar redundancias (variables):
o Análisis de componentes principales o Análisis de correspondencias
Relacionar, explicar (variables):
o ANOVA o Test de Kruskal-Wallis o Análisis discriminante o Modelos de regresión lineal y de elección discreta (probit, logit)
Agrupar, clasificar (casos u observaciones):
o Análisis cluster o de conglomerados
Técnicas del análisis multivariante
Técnicas del análisis multivariante Principales técnicas de dependencia
ANOVA (Análisis de la Varianza) : Determinar en qué medida una variable dependiente cuantitativa está condicionada por una o más variables independientes categóricas que se denominan factores. Generalización del test de diferencia de medias en poblaciones normales.
Kruskal-Wallis : Es el equivalente no paramétrico del ANOVA (comparación de medianas de k grupos; generalización del test no paramétrico de localización de suma de rangos de Wilcoxon).
Análisis discriminante : Caracterizar mediante un conjunto de variables independientes cuantitativas las diferencias entre distintos grupos y clasificar observaciones cuando se desconoce el grupo al que pertenecen.
Técnicas del análisis multivariante
Modelo de regresión lineal : Cuantificar la relación existente entre una variable dependiente cuantitativa y una o varias variables independientes (Modelo de regresión lineal simple / Modelo de regresión lineal múltiple).
Modelos probit y logit: Cuantificar la relación existente entre una variable dependiente cualitativa binaria (valores 0 y 1) y un conjunto de variables independientes.
Técnicas del análisis multivariante
Componentes principales : Técnica de reducción de la dimensión, que intenta transformar un conjunto de variables en otro de menor número que estén incorrelacionadas entre si.
Análisis de correspondencias : Se aplica al análisis de tablas de contingencia. Se construye un diagrama cartesiano en el que se representan conjuntamente las distintas modalidades de la tabla, de forma que la proximidad entre los puntos representados está relacionada con el nivel de asociación entre dichas modalidades.
Análisis de conglomerados ( cluster ) : Partición de un conjunto de observaciones en grupos tales que las observaciones pertenecientes a un mismo grupo son muy similares entre sí pero muy diferentes a las pertenecientes a otros grupos.
Técnicas del análisis multivariante
Fases del análisis multivariante
1) Objetivos del análisis. Se define el problema, especificando los objetivos, las variables y las técnicas multivariantes que se van a aplicar. Es importante que al concretar las variables a observar, se establezca su escala de medida, teniendo en cuenta el tipo de análisis que se quiere realizar. 2) Diseño y análisis exploratorio de la base de datos. Ver si existen fuentes primarias de datos disponibles que se ajusten a nuestro propósito o, en caso contrario, diseñar el estudio de muestreo (determinar el tamaño muestral, realizar encuestas, introducir los datos, etc.). Analizar los datos perdidos (missing) y las observaciones atípicas ( outliers ), para tener en cuenta su influencia sobre las estimaciones y la bondad de ajuste.
Fases del análisis multivariante
3) Evaluación de las hipótesis subyacentes en la técnica multivariante que va a llevarse a cabo (normalidad, linealidad, independencia, homocedasticidad, etc.).
4) Realización del análisis estadístico e interpretación de resultados. A veces los resultados obtenidos pueden sugerir la necesidad de re-especificar el modelo o alguna de las variables.
5) Validación del análisis. Consiste en establecer la validez de los resultados obtenidos en la muestra, analizando si se pueden generalizar a la población de la que procede. Se hace con diferentes métodos, que incluyen: (1) división de la muestra de tal forma que se use una sub-muestra para estimar el modelo y una segunda para analizar la capacidad predictiva (2) empleo de técnicas de re-muestreo y, a veces, (3) obtención de una muestra distinta que permita asegurar que los resultados no son particulares de la muestra elegida.
Hipótesis del análisis multivariante
Hipótesis del análisis multivariante
La normalidad multivariante implica normalidad univariante. Se aconseja iniciar el análisis contrastando la normalidad univariante (si bien esto no siempre garantiza que las variables sean normales conjuntamente): Si alguna variable no es normal podemos concluir que no se cumplirá la normalidad multivariante. Los contrastes multivariantes son más complejos, pedagógicamente se entienden mejor viendo primero los univariantes, y además, no siempre vienen incluidos en los programas estadísticos (por ejemplo, no están disponibles en Statgraphics ni en SPSS).
Hipótesis del análisis multivariante
Hipótesis a verificar : H 0 : X (^) j es normal H 1 : H 0 no es cierta
siendo D 1 = |Fn(xi-1 )- F 0 (xi )| D 2 =| Fn(xi )- F 0 (xi )|
Para cada x (^) i se calcula la distancia entre la función de distribución empírica y la teórica. Como la función empírica es un diagrama escalonado, su distancia a la distribución teórica puede medirse a partir de la ordenada Fn(xi-1) o de la F (^) n(xi-1)
Dn=max D 1 (xi ), D 2 (xi ) i=1,2,...,n
Hipótesis del análisis multivariante
Fn(xn)=
x 1 x 2 .........^ xi- 1 xi ................ xn
Fn(xi)
Fn(xi- 1 )
Fn(x 2 ) Fn(x 1 )
F 0 (x)
F 0 (xi) D 1 (xi)
D 2 (xi)
Segmento rojo: D 1 (xi) =|Fn(xi- 1 ) - F 0 (xi)| Segmento azul: D 2 (xi) =|Fn(xi) - F 0 (xi)|