



























Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
El proceso de selección de componentes principales y su representación gráfica a través de la análisis canónico. El texto aborda el objetivo de la análisis, cómo obtener y interpretar los componentes principales, el uso de matriz de correlaciones y la importancia de los valores propios. Además, se discuten métodos para decidir cuántos componentes principales conservar y la representación de objetos en un diagrama de puntos.
Tipo: Apuntes
1 / 35
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




























Hi ha Variables Dependents (VD) i Variables Independents (VI)
Sí No
Mètodes Explicatius (de Dependència)
Mètodes descriptius (de Interdependència)
Quantes Variables Dependents (VD)?
Escala mesura de la VD?
Escala de mesura de les VI?
Qualitativa Ordinal
Quantitativa ( Interval)
Quantitatives ( Interval)
Quantitatives ( Interval)
Qualitatives Ordinal
Escala de mesura de les VI?
Nº VD=
Qualitatives Ordinal
Quantitatives ( Interval)
Qualitatives i quantitatives
Escala mesura de les VD?
Regressió Múltiple
Anàlisi de la Covariança : ANOVA ANCOVA
Anàlisi Discriminant
Regressió Logística
Anàlisi de Correspondències
MANOVA
Nº VD>
Escala de les Variables?
Quantitatives ( Interval)
Qualitatives Ordinal
Anàlisi de Conglomerats Anàlisi Canònica
Components Principals
Qualitatives i Quantitatives
Tema 1 Temes 2, 3, 4 i 5 Tema 6
Tema 7
Tema 9
Tema 8
Tema 11
Tema 10
Per a un banc de dades, amb i= 1 ,..n objectes i Y 1 , Y 2 , … Yp variables, la primera component principal serà una variable: Z (^) i 1 a Y 11 i (^) 1 a Y 12 i (^) 2 .. a Y 1 p ip on ( a 11 ,.., a 1p) són les coordenades del primer vector propi de C , matriu de var-covar de Y, amb les variables Y centrades.
10.1.-.Obtenció i interpretació de les Components principals.
GEOMÈTRICAMENT Buscar la direcció què al projectar les dades queden el més separades possible (la variable projectada té la major variança) La segona component principal serà la direcció perpendicular a la primera en què al projectar les dades queden el més separades possible
La segona component principal, incorrelada amb l’anterior i de màxima variança, resultaria ser la combinació lineal
Y així fins a p.
Zi (^) 2 a Y 21 i (^) 1 a Y 22 i (^) 2 .. a 2 (^) p Yip Amb (a 21 ,..,a2p) coordenades del segon vector propi de C (matriu de var-covar de Y, Y centrades).
Si les variances de les variables originals són molt distintes (el valor de la més gran és més de quatre vegades el valor de la menor), treballarem amb les dades estandarditzades, equivalentment amb la matriu de correlacions R.
10.1.-.Obtenció i interpretació de les Components principals.
Usem la matriu de correlacions R
¡Variances molt distintes!
Els valors propis obtinguts corresponen a les variances de les noves variables (PC) i la suma dels valors propis és igual a la suma de les variances de les variables originals. Si hem estandarditzat les variables, o treballat amb R, llavors la suma dels valors propis serà p.
10.1.-.Obtenció i interpretació de les Components principals.
Cada valor propi dividit per la suma total representa la variança explicada per la corresponent PC Els percentatges acumulats indiquen la quantitat de variança que expliquen la PC considerada junt amb les anteriors.
Exemples d’interpretació de les components principals
grandària =Altura + Pes Forma =Altura - Pes
Altura - Pes amb valor gran ===> persona alta i prima: forma estilitzada. Altura - Pes amb valor menut ===> persona menuda y gruixuda: forma obesa
10.1.-.Obtenció i interpretació de les Components principals.
10.1.-.Obtenció i interpretació de les Components principals.
Interpretació de les Components Principals i les puntuacions dels objectes Com que un vector multiplicat per una constant continua indicant la mateixa direcció, existeixen infinites formes d’expressar les components principals. Els valors i els signes dels coeficients (i els pesos) de les components i de les puntuacions de PC no tenen significat aïlladament. Ens fixarem únicament en les diferències relatives i els signes contraposats entre variables.
10.1.2-.Resum de les Components principals.
De la matriu de dades calculem la matriu de var- cov o correlacions (equival a var-cov de les variables estandarditzades)
Càlcul dels vectors i valors propis
Vectors propis Proporcionen el coeficient de cada variable original en la combinació lineal que proporciona la corresponent PC
Valors propis Proporcionen la mesura de la quantitat de variació entre individus que explica cada PC
Decidir quantes PC es conserven per a reduir la dimensió
A partir dels Coeficients de les variables en les components, determinar les PUNTUACIONS EN PC DELS OBJECTES = Coeficient de la component en la variable x valor estandarditzat del objecte en la variable
Hi ha diversos mètodes que ajuden a elegir el nombre de components principals a considerar: Totes les corresponents fins que deixa d’haver un descens brusc en la gràfica de valors propis. Les que tenen valor propi major que 1 (si usem matriu de correlacions). Les que proporcionen un % de variabilitat explicada acumulada per dalt del 50% (> 50%-70%) Test del bastó trencat Test d’igualtat de valors propis
10.2.-.Selecció del nombre de Components principals i representació gràfica.
10.1.2-.Resum de les Components principals.
De la matriu de dades calculem la matriu de var- cov o correlacions (equival a var-cov de les variables estandarditzades)
Càlcul dels vectors i valors propis
Vectors propis Proporcionen el coeficient de cada variable original en la combinació lineal que proporciona la corresponent PC
Valors propis Proporcionen la mesura de la quantitat de variació entre individus que explica cada PC
Decidir quantes PC es conserven per a reduir la dimensió
A partir dels Coeficients de les variables en les components, determinar les PUNTUACIONS EN PC DELS OBJECTES = Coeficient de la component en la variable x valor estandarditzat del objecte en la variable
Representar els objectes en un diagrama de punts mitjançant les seues puntuacions en les dos o tres primeres PC
Podem rotar els eixos principals de manera que les noves variables queden definides de forma clara i amb correlacions molt grans amb algunes variables originals i molt menudes amb altres. La rotació varimax és la més utilitzada:
10.2.-.Selecció del nombre de Components principals i representació gràfica.
1 175 1225 25 117 56 2 156 1050 31 122 63 n 202 1350 58 154 67
10.2.-.Selecció del nombre de Components principals i representació gràfica.
Els pesos (correlacions) de cada variable en cada component rotada revelen un patró més simple i millor: SO 4 (+), Mg (+), log 10 H (-) i Ca (+) tenen alta correlació amb la component rotada 1, NO 3 (-), N total (-) tenen elevada correlació amb la component rotada 2, i log 10 C orgànic dissolt (+) i NH 4 (-) estan correlacionades amb la component rotada 3. Amb la solució rotada hi ha menys variables que tenen correlacions moderades (0,4-0,6) amb els tres components rotades.
La rotació dels eixos principals, de manera que les noves variables presenten correlacions molt grans (pròximes a +1 o a -1) amb algunes variables originals i molt menudes (pròximes a 0) amb altres, permet interpretar les components més fàcilment en indicar una associació positiva o negativa clara entre la variable i la component (o absència de relació si està pròxim a 0). La rotació VARIMAX és la més utilitzada:
xj
xi
xij
1 13
Podem representar els n individus en l’espai p- dimensional definit per les Variables
Podem representar les p variables en l’espai n- dimensional definit pels individus
10.2.-.Selecció del nombre de Components principals i representació gràfica.
p (13)
i
n (150) (^) n
1 1
j
xi
p
2
150 individus + 13 variables
10.2.-.Selecció del nombre de Components principals i representació gràfica.
Amb CP reduïm la dimensió, de p a 2. En les noves dimensions tenim: Les puntuacions del individus i els pesos de les variables
2