Exercices sur l'analyse des données , Exercices de Mathématiques pour l'informatique
Christophe
Christophe3 March 2014

Exercices sur l'analyse des données , Exercices de Mathématiques pour l'informatique

PDF (91.8 KB)
3 pages
1Numéro de téléchargement
653Numéro de visites
Description
Exercices d’informatique sur l'analyse des données (formulaire). Les principaux thèmes abordés sont les suivants: Analyse factorielle en composantes principales, La technique utilisée, Les grandes étapes du calcul, descr...
20points
Points de téléchargement necessaire pour télécharger
ce document
Télécharger le document

Page 1 sur 3

Analyse des données (formulaire) Analyse factorielle en composantes principales

La technique utilisée consiste à projeter l'ensemble des individus sur un espace de dimension q (inférieur à p) en minimisant la déformation lors de la projection. En général q est égal à 2.

Généralités - nombre d'individus : n (indice i) - nombre de variables : p (indice j)

- tableau de données :   pnjixX  - vecteur individu : ix (correspond à la ligne i du tableau de donnée)

- vecteur variable : jx (correspond à la colonne j du tableau de donnée)

- moyenne :  i

j ii

j xpx avec n

pi 1  le poids

- variance :    2var   i

jj ii

j xxpx

- écart-type :  jj xvar - covariance :       

i

jj i

jj ii

jj xxxxpxx ,cov

- corrélation :    jj jj

jj xxxx  

  

,cov,cor

- centre de gravité :  i

ii xpG

- inertie du nuage :   i

iiN GxdpI , 2

- distance du 2 (pour tableaux de données quantitatives) :     

  

  

 

 

j i

j i

i

j i

jii x x

x x

x xxd 1,2

Les grandes étapes du calcul 1. calcul de X~ , le tableau de données centré par rapport aux variables.

2. calcul de la matrice des variances - covariances : XX n

V t ~~1 de dimension p.

3. calcul de la matrice des corrélations : 2/12/1 VMMS  avec  

  

  2

1 j

diagM

.

docsity.com

Page 2 sur 3

4. calcul des valeurs propres k ( q 1 ) de S et des vecteurs propres kv . 5. calcul des axes principaux d'inertie : kk vMu

2/1 . 6. calcul de la kème composante principale ky qui donne les (nouvelles) coordonnées des n

individus sur  ku : ktikiki uMxuxy ..,  . Description des individus et des variables

- calcul de l'inertie expliquée :    VMtraceIE k

u k

  ,    VMtraceIE

kk uu kk

 

 , . La représentation

est d'autant meilleure que l'inertie expliquée est proche de 0 (cas limite où il n'y a pas de déformation).

description des individus - Les individus sont projetés sur la plan  kk uu , . - calcul du cos² (qualité ponctuelle de la représentation) : La qualité ponctuelle par rapport à

l'axe  ku est  

2

2

i

k ik

i x ye  . Plus cette quantité est proche de 1, meilleure sera la

représentation du point par rapport à cet axe. La qualité ponctuelle par rapport au plan  kk uu , est kiki ee  .

- calcul de la contribution absolue des points par rapport aux axes :Contribution de

l'individu ix à l'axe  ku :   1

2

 k

k iik

i yp

 .

description des variables - Les variables sont projetés sur le plan  kk yy , .

- calcul des coordonnées de la variable jx sur l'axe  ku : jkjk kj uyx

 

, . Les variables

jx vont se projeter sur le cercle des corrélations.

Méthode 1. On choisit le plan de projection  21,uu , ayant la plus forte inertie expliquée. 2. On repère dans le tableau sur les individus les contributions élevées (réparties entre des

coordonnées négatives et positives) pour chacun de ces axes. On identifie 4 groupes apposées sur le plan  21,uu . On marque la dépendance d'un axe par une flèche.

3. On repère dans le tableau sur les individus les corrélations absolues les plus élevées et l'on

forme 4 groupes sur le plan   21

, yy . Il faut penser à dessiner le cercle des corrélations (qui peut être déformé).

docsity.com

Page 3 sur 3

4. Interprétation : On décrit les 4 groupes individus - variables mis en évidence par la

méthode.

Analyse factorielle des correspondances Cette méthode traite les tableaux de contingences. Elle utilise deux analyses en composantes principales : l'une sur le nuage des individus, l'autre sur le nuage des variables.

Méthode 1. On choisit le plan de projection  21,uu , ayant la plus forte inertie expliquée. 2. On peut appeler les axes soit par les variables, soit par les individus. Il convient de donner

une signification à cette axe, simplement en le nommant : "échelle de…". 3. Si l'on choisit d'appeler les axes par les variables, on retiendra d'une part les variables

ayant une contribution absolue élevée et d'autre part les individus ayant une contribution relative élevée (cos²). Et inversement, si l'on choisit d'appeler les axes par les individus.

4. On forme ainsi 4 groupes principaux pour les variables et 4 groupes principaux pour les

individus que l'on met en relation pour l'interprétation.

Classification automatique

Méthode

docsity.com

commentaires (0)
Aucun commentaire n'a été pas fait
Écrire ton premier commentaire
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Docsity n'est pas optimisée pour le navigateur que vous utilisez. Passez à Google Chrome, Firefox, Internet Explorer ou Safari 9+! Téléchargez Google Chrome