Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


TEMA 6, Apuntes de Industria y Comercio

Asignatura: Técnicas Estadísticas Multivariables, Profesor: Lourdes Salinero, Carrera: Comercio, Universidad: UCM

Tipo: Apuntes

2013/2014

Subido el 07/09/2014

manudolferas
manudolferas 🇪🇸

3.9

(29)

11 documentos

1 / 20

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
21/04/2012
1
Sección Departamental de Estadística e I.O. II. EUEE
PARTE III. MÉTODOS DE REDUCCIÓN DE LA
DIMENSIÓN
TEMA 6. Análisis Factorial
1. Objetivos del Análisis Factorial. Aplicaciones
2. El modelo factorial lineal
3. Fases del Análisis Factorial
3.1 Preparación
3.2 Factorización
3.3 Rotación
3.4 Interpretación
4. Puntuaciones factoriales
Sección Departamental de Estadística e I.O. II. EUEE
1. OBJETIVOS DEL AF. APLICACIONES
Idea inspiradora del método
En la vida real nos enfrentamos con frecuencia a fenómenos en los que
intervienen conceptos que no son directamente observables pero de cuya
existencia nadie duda:
Imagen de marca
Imagen de un político
Imagen de un país
Estilo de vida
Coeficiente de inteligencia
Estos conceptos se manifiestan en variables observables que son las que
medimos para obtener información acerca del concepto que llamaremos variable
latente, no observable o factor
Análisis Factorial es la técnica que nos va a permitir descubrir los factores que
están generando las observaciones.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14

Vista previa parcial del texto

¡Descarga TEMA 6 y más Apuntes en PDF de Industria y Comercio solo en Docsity!

Sección Departamental de Estadística e I.O. II. EUEE

PARTE III. MÉTODOS DE REDUCCIÓN DE LA

DIMENSIÓN

TEMA 6. Análisis Factorial

  1. Objetivos del Análisis Factorial. Aplicaciones
  2. El modelo factorial lineal
  3. Fases del Análisis Factorial 3.1 Preparación 3.2 Factorización 3.3 Rotación 3.4 Interpretación
  4. Puntuaciones factoriales

Sección Departamental de Estadística e I.O. II. EUEE

1. OBJETIVOS DEL AF. APLICACIONES

Idea inspiradora del método

En la vida real nos enfrentamos con frecuencia a fenómenos en los que intervienen conceptos que no son directamente observables pero de cuya existencia nadie duda:

  • Imagen de marca
  • Imagen de un político
  • Imagen de un país
  • Estilo de vida
  • Coeficiente de inteligencia

Estos conceptos se manifiestan en variables observables que son las que medimos para obtener información acerca del concepto que llamaremos variable latente, no observable o factor

Análisis Factorial es la técnica que nos va a permitir descubrir los factores que están generando las observaciones.

El AF forma parte del conjunto de métodos de AM que, a partir del análisis de las correlaciones entre un conjunto de variables, permite:

  • Identificar, partiendo de las variables originales, nuevas variables o dimensiones latentes no directamente observables (constructos)
  • Entran en juego: Variables observadas (de las que partimos) y variables latentes, factores o dimensiones (las que obtenemos)
  • Se intenta reproducir, con un reducido número de factores, la estructura de correlaciones de las variables originales observadas.

Sección Departamental de Estadística e I.O. II. EUEE

Sección Departamental de Estadística e I.O. II. EUEE

Objetivos

  • Identificar, partiendo de las p variables originales, m<p nuevas variables o dimensiones latentes no directamente observables. Estas variables latentes o factores son mas generales y se definirán a partir de las propiedades comunes de las variables observables.
  • Los factores se caracterizaran por aglutinar variables observadas que estén altamente correlacionadas entre sí y escasamente correlacionadas con aquéllas variables que conforman otra estructura latente o factor.
  • Cuantificar la importancia de cada una de las variables en la definición del factor ( carga o saturación ).
  • Proporcionar valores cuantitativos de cada individuo (sujeto de la muestra donde se miden las variables empíricas) en los factores obtenidos ( puntuaciones factoriales ).
  • Interpretar los factores obtenidos

Sección Departamental de Estadística e I.O. II. EUEE

F ' s Factores comunes

e s ' Factores únicos

X s ' Variables originales

1 11 1 12 2 1 1 1 2 21 1 22 2 2 2 2

1 1 2 2

h h m m h h m m

p p p ph h pm m p

X l F l F l F l F e

X l F l F l F l F e

X l F l F l F l F e

Analíticamente:

Sección Departamental de Estadística e I.O. II. EUEE

Matricialmente:

1 11 12 1 1 1 1

2 21 22 2 2 2 2

1 2

h m

h m

p p p ph pm (^) m p

x Lf e

X l l l l F e

X l l l l F e

X l l l l F e

⎝ ⎠ ⎝ ⎠ ⎝^ ⎠ ⎝ ⎠

Objetivo: estimación de los coeficientes l jh de esta matriz (Matriz factorial)

l jh: cargas factoriales pesos o saturaciones (correlación entre la variable j y el

factor h). Elevado al cuadrado recoge la parte de la varianza de la variable j explicada por el factor h

Sección Departamental de Estadística e I.O. II. EUEE

HIPOTESIS DEL MODELO

I. Respecto a los factores comunes

a. Los factores comunes son variables de media cero y

varianza uno:

b. Los factores comunes están incorrelacionados:

cov ( Fi Fj ) = 0 ∀ i ≠ j

E ( Fi ) = 0 V ( Fi ) = 1 ∀i=1,2....m

La matriz de covarianzas de los factores comunes es la matriz identidad

Sección Departamental de Estadística e I.O. II. EUEE

II. Respecto a los factores específicos o únicos

a. Variables de media cero:

b. Las varianzas de los factores específicos pueden ser

distintas:

c. Los factores específicos están incorrelacionados (de

lo contrario la información contenida en ellos estaría

en los factores comunes):

E ( ei ) = 0 ∀i=1,2....m

V e ( i ) = Ω i ∀ = i 1, 2.... p

cov( e ei j ) = 0 ∀ ≠ i j

III. Los factores comunes y los específicos están

incorrelacionados:

cov ( Fi e j ) = 0 ∀ i , j

La matriz de covarianzas de los factores específicos es diagonal

Sección Departamental de Estadística e I.O. II. EUEE

Es la cantidad de varianza total de las variables explicada por un factor. (capacidad del factor para explicar la varianza total). Si las variables originales están tipificadas la varianza total será igual a p y

λ h = l 1 (^) h + lh +... + lph Eigenvalue:Autovalor

Representará el porcentaje de varianza total atribuible al factor h h

p

λ

Sección Departamental de Estadística e I.O. II. EUEE

  • Como el AF opera a partir de la matriz de correlaciones, las variables tienen que ser de escala.
  • Tipificadas (media 0 y varianza 1)
  • La selección de las variables que intervendrán en el análisis ha de estar justificada con arreglo a anteriores investigaciones o a razonamientos teóricos. **3. FASES DEL ANÁLISIS FACTORIAL
  1. 1 Preparación**

Sección Departamental de Estadística e I.O. II. EUEE

El AF resultará adecuado cuando existan altas correlaciones entre las variables, mayores de 0.5. (Algunos autores consideran suficiente mayores de 0.3). A medida que aumenta la correlación entre variables se incrementa la probabilidad de que las variables compartan suficiente varianza común para constituir un factor.

Debemos probar si la matriz de correlaciones R es significativa. Para ello realizamos el test de Esfericidad de Bartlett

Test de esfericidad de Bartlett. Es necesario suponer normalidad

de las variables. Contrasta la hipótesis nula de la existencia de

incorrelación lineal entre las variables (poblacionales) lo que se

traduce en que la matriz de correlaciones ® es una matriz identidad

(1’s en la diagonal principal y 0’s en el resto). Si como consecuencia

del contraste no podemos rechazar la hipótesis nula, no hay

estructura de correlación, y no tendría sentido realizar un AF.

( )

2 2

1

bajolahipótesisnula

6 2 5 ln *^2

p p

B n p R

⎥ ⎯⎯^ ⎯⎯⎯⎯→

R * Determinante de la matriz de correlaciones muestrales

Sección Departamental de Estadística e I.O. II. EUEE

Sección Departamental de Estadística e I.O. II. EUEE

Existen muchos métodos de extracción de factores:

  • Método de Componentes Principales: supone que toda la varianza de las variables observadas está explicada por los factores, es decir, no hay especificidad

El resto de métodos hacen una estimación inicial de las comunalidades por diferentes métodos

  • Método de Ejes Principales
  • Método de Máxima Verosimilitud
  • Etc..

Por su simplicidad el método basado en componentes principales es el método más usado y el que está implementado en todos los programas de ordenador

Sección Departamental de Estadística e I.O. II. EUEE

Para determinar el número de factores a considerar conservamos los tres criterios establecidos para el método de componentes principales pero ahora cualquier criterio debe estar presidido por dos principios fundamentales:

  • PARSIMONIA la solución ha de ser sencilla y compuesta por el menor número posible de factores REDUCIR
  • INTERPRETABILIDAD los factores extraídos han de ser susceptibles de interpretación sustantiva. La mejor solución factorial es la que se interpreta mejor INTERPRETAR

3. 3 Rotación

Para que una solución factorial resulte interpretable debe ocurrir que:

  • Las cargas factoriales deben estar cerca de 0 ó 1
  • Una variable debe tener cargas factoriales elevadas sólo con un factor
  • No debe haber factores con similares cargas factoriales

Estas condiciones no suelen darse. Por ello transformamos la matriz obtenida, solicitando una rotación

Sección Departamental de Estadística e I.O. II. EUEE

Sección Departamental de Estadística e I.O. II. EUEE

Rotación Ortogonal

Los factores son

independientes entre sí

Da lugar a una única matriz

rotada

Las cargas son correlaciones

ROTACIÓN : Procedimiento que, sin alterar la comunalidad de

cada variable, cambia el porcentaje de varianza atribuible a

cada factor, de manera que consigamos que cada variable

sature sólo en un factor.

Sección Departamental de Estadística e I.O. II. EUEE

Puntuaciones de cada individuo de la muestra en cada factor. Esto nos permite colocar a cada sujeto en una determinada posición en el espacio factorial, y así conocer qué sujetos son los más raros o extremos, dónde se ubican ciertos grupos de la muestra: jóvenes frente a mayores, individuos de clase alta frente a clase baja, creyentes frente a no creyentes, obteniendo en qué factores sobre salen unos de otros.

Las puntuaciones se utilizan como inputs para siguientes análisis. En la medida en que el número de factores es menor que el número de variables originales, si el porcentaje de explicación de varianza total conseguido es elevado, dichas puntuaciones factoriales pueden sustituir a las variables originales en muchos problemas de análisis o predicción económica. (problemas de multicolinealidad de las variables originales en muchas técnicas de análisis)

4. PUNTUACIONES FACTORIALES

Sección Departamental de Estadística e I.O. II. EUEE

CARACTERÍSTICAS ECONÓMICAS DE LAS

COMUNIDADES AUTÓNOMAS

Sección Departamental de Estadística e I.O. II. EUEE

Se dispone de información para las 17 Comunidades Autónomas españolas sobre un conjunto de variables económicas referidas al año 1.993. En concreto, para región se conocen los datos relativos a las siguientes magnitudes:

  • agric- empleo en la agricultura
  • industri – empleo en la industria
  • servicio – empleo en el sector servicios
  • público – empleo en el sector público
  • paro – tasa de paro
  • activid – tasa de actividad
  • renpc – renta familiar per-cápita en pesetas
  • producti – productividad del trabajo en pesetas

Las variables de empleo están expresadas como proporción del empleo total de la comunidad.

EJEMPLO

Sección Departamental de Estadística e I.O. II. EUEE

  • Grado de correlación medio
  • Rechazamos la hipótesis de que la

matriz de correlaciones poblacional

sea la matriz identidad y

procedemos al análisis

Sección Departamental de Estadística e I.O. II. EUEE

−0.660 2 + 0.641 2 + 0.337 2 =0.

( −0.660^ ) 2 +^ ( 0.752^ ) 2 +^ ....^ +^ ( 0.783)^2 =3.

Matriz de com pone nte sa

-,660 -,641 , ,752 -,421 -, -,096 ,953 , -,630 ,609 -, -,714 ,422 -, ,429 ,345 , ,857 ,238 , ,783 ,405 -,

empleo agricultura empleo indus tria empleo serv ic ios empleo sec tor público tasa de paro tasa de ac tividad renta familiar per c ápita produc tividad del trabajo

1 2 3

Componente

Método de extracc ión: Análisis de c omponentes princ ipales. a.3 componentes ex traídos

Com unalidades

1,000 , 1,000 , 1,000 , 1,000 , 1,000 , 1,000 , 1,000 , 1,000 ,

empleo agricultura empleo indus tria empleo serv icios empleo sec tor públic o tasa de paro tasa de ac tividad renta f amiliar per c ápita produc tividad del trabajo

Inic ial Ex tracc ión

Método de extracc ión: A nálisis de Componentes princ ipales.

Si extraemos 3 factores

Comunalidad para empleo en la agricultura:

1º autovalor:

Sección Departamental de Estadística e I.O. II. EUEE

PESO

(peso del factor 1 en la variable empleo industria: 0.752)

FACTOR

VARIABLE

SATURACIÓN

(saturación de la variable empleo en la industria en el factor 1: 0.752)

Sección Departamental de Estadística e I.O. II. EUEE

Matriz de com pone nte s rotadosa

-,110 -,955 -, -,777 ,513 -, ,800 ,337 , ,881 ,059 -, ,778 -,206 -, -,022 ,122 , -,354 ,573 , -,152 ,924 ,

empleo agricultura empleo indus tria empleo serv ic ios empleo sec tor público tasa de paro tasa de ac tividad renta f amiliar per c ápita produc tividad del trabajo

1 2 3

Componente

Método de extracc ión: A nálisis de c omponentes princ ipales. Método de rotación: Normalización V arimax con Kais er. a.La rotación ha convergido en 4 iterac iones.

Sección Departamental de Estadística e I.O. II. EUEE

  • El primer factor está correlacionado positivamente con el empleo en el sector público (0.881), el empleo en servicios (0.800), y la tasa de paro (0.778); y negativamente con el empleo en industria (–0.777). Podría interpretarse como un eje o factor de empleo alto en servicios y bajo en industria (sector secundario), ligado al proceso de tercialización de la economía.
  • El segundo factor está fuertemente relacionado con la productividad del trabajo (0.924) y con el empleo en la agricultura (-0.955). Se puede interpretar como un eje de productividad, que pone de manifiesto la escasa aportación de la agricultura al valor añadido de una economía en relación a su empleo.
  • El tercer factor está correlacionado con la tasa de actividad (0.859) de cada región y con la renta per-cápita (0.637). Se puede interpretar como un factor de actividad laboral, aunque también podría interpretarse como un factor del grado de desarrollo o incluso bienestar.

Muestra: 237 personas

Variables:

V 1 – es importante comprar una pasta que prevenga la caries V 2 – me agrada que deje los dientes brillantes V 3 – debe fortalecer las encías V 4 – prefiero una pasta dental que refresque el aliento V 5 – es importante que prevenga el deterioro dental V 6 – lo más importante es tener unos dientes atractivos V 7 – debe fortalecer los dientes

Sección Departamental de Estadística e I.O. II. EUEE

Sección Departamental de Estadística e I.O. II. EUEE

FACTOR 1. FACTOR DE BENEFICIO PARA LA SALUD

•PREVENCION DE LA CARIES •ENCIAS FUERTES •PREVENCION DEL DETERIORO DE LOS DIENTES •DIENTES FUERTES

FACTOR 2. FACTOR ESTETICO. BENEFICIO SOCIAL

•DIENTES BRILLANTES •ALIENTO FRESCO •DIENTES ATRACTIVOS

,859 , ,092 , ,833 , ,109 , ,848 , ,128 , ,858 ,

prevenga la caries dientes brillantes fortalece encías refresque el aliento prevenga deterioro dientes dientes atractivos fortalecer dientes

1 2

Componente

Método de extracción: Análisis de componentes principales. a.2 componentes extraídos

Matriz de componentes rotados

2 2 2 2

comunalidad (prevenga caries)= 0,859 0, " dientes brillantes 0,

0, 0, 890 0,

  • = = + =

Sección Departamental de Estadística e I.O. II. EUEE

p

,859 , ,092 , ,833 , ,109 , ,848 , ,128 , ,858 ,

prevenga la caries dientes brillantes fortalece encías refresque el aliento prevenga deterioro dientes dientes atractivos fortalecer dientes

1 2

Componente

Método de extracción: Análisis de componentes principales. a.2 componentes extraídos

Matriz de componentes rotados

Sección Departamental de Estadística e I.O. II. EUEE

Varianza total explicada

2,923 41,750 41, 2,410 34,420 76, ,529 7,600 83, ,449 6,400 90, ,301 4,300 94, ,280 4,000 98, ,099 1,400 100,

Componente 1 2 3 4 5 6 7

Total

% de la varianza % acumulado

Autovalores iniciales

Método de extracción: Análisis de Componentes principales.

,859 , ,092 , ,833 , ,109 , ,848 , ,128 , ,858 ,

prevenga la caries dientes brillantes fortalece encías refresque el aliento prevenga deterioro dientes dientes atractivos fortalecer dientes

1 2

Componente

Método de extracción: Análisis de componentes principales. a.2 componentes extraídos

2 2 2 2 2 2 2

1º autovalor

2 2 2 2 2 2 2

2º autovalor

Matriz de componentes rotados