Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Analisi Multivariata: Tecniche e Modelli, Sintesi del corso di Metodologia della ricerca

Cos'è l'analisi multivariata, confronto tra tecniche e modelli, analisi variabili, procedure da seguire, come riportare i dati nel sistema cartesiano. ACM, ACP, ADG, MLL

Tipologia: Sintesi del corso

2017/2018

In vendita dal 15/03/2018

Giulia.A.
Giulia.A. 🇮🇹

4.6

(7)

10 documenti

1 / 7

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
ANALISI MULTIVARIATA
- Come raccolgo i dati? Con rilevazioni campionarie (raramente ricerche quasi-sperimentali
usate in psicologia sociale).
- Operativizzazione: Trasformo le informazioni in dati (primari/secondari)
- Costruisco matrici di dati C x V casi (righe) per variabili (colonne, stati sulle proprietà).
- Unità di analisi: individuo/gruppo/aggregato ecologico
ANALISI MULTIVARIATA: analisi di più di due variabili. Si può effettuare attraverso due strumenti,
tecniche o modelli, a seconda dello scopo prefissato.
Le TECNICHE:
- Si rappresentano gli n casi rilevati sulle p variabili come uno sciame di n punti in uno spazio
a p dimensioni
- Scopo: descrizione, esplorazione dei dati
- Identificano baricentro e assi principali dello sciame
- Valutano se è possibile rappresentare lo sciame in un nuovo spazio con un numero ridotto
di dimensioni
I MODELLI:
- Scopo: esplicazione delle relazioni tra variabili
- Si controllano ipotesi formulate in sede di progetto di ricerca, testando la generalizzabilità
del campione
TECNICHE
ACM: Analisi delle CORRISPONDENZE MULTIPLE
Consente l’analisi simultanea di un insieme di variabili categoriali riducendole in un numero minore
di dimensioni (fattori) che esprimono delle combinazioni delle stesse, e che siano in grado di
riprodurre la maggior parte dell’inerzia presente tra le variabili-modalità stesse. Per inerzia s’intende
la misura della dispersione dell’insieme delle distanze calcolate fra i punti (lo spazio migliore è quello
che massimizza l’inerzia).
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Analisi Multivariata: Tecniche e Modelli e più Sintesi del corso in PDF di Metodologia della ricerca solo su Docsity!

ANALISI MULTIVARIATA

  • Come raccolgo i dati? Con rilevazioni campionarie (raramente ricerche quasi-sperimentali usate in psicologia sociale).
  • Operativizzazione: Trasformo le informazioni in dati (primari/secondari)
  • Costruisco matrici di dati C x V casi (righe) per variabili (colonne, stati sulle proprietà).
  • Unità di analisi: individuo/gruppo/aggregato ecologico

ANALISI MULTIVARIATA: analisi di più di due variabili. Si può effettuare attraverso due strumenti, tecniche o modelli, a seconda dello scopo prefissato.

Le TECNICHE :

  • Si rappresentano gli n casi rilevati sulle p variabili come uno sciame di n punti in uno spazio a p dimensioni
  • Scopo: descrizione , esplorazione dei dati
  • Identificano baricentro e assi principali dello sciame
  • Valutano se è possibile rappresentare lo sciame in un nuovo spazio con un numero ridotto di dimensioni

I MODELLI :

  • Scopo: esplicazione delle relazioni tra variabili
  • Si controllano ipotesi formulate in sede di progetto di ricerca, testando la generalizzabilità del campione

TECNICHE

ACM: Analisi delle CORRISPONDENZE MULTIPLE

Consente l’analisi simultanea di un insieme di variabili categoriali riducendole in un numero minore di dimensioni (fattori) che esprimono delle combinazioni delle stesse, e che siano in grado di riprodurre la maggior parte dell’inerzia presente tra le variabili-modalità stesse. Per inerzia s’intende la misura della dispersione dell’insieme delle distanze calcolate fra i punti (lo spazio migliore è quello che massimizza l’inerzia).

Si individuano due insiemi di variabili-modalità e casi: le attive , che contribuiscono alla formazione dei fattori; le illustrative , usate per arricchirne l’interpretazione.

Procedure da seguire:

  1. Costruzione della matrice di Burt o matrice delle corrispondenze multiple: E’ speculare rispetto alla diagonale principale e contiene tutte le tabelle di contingenza che si possono ottenere incrociando a due a due le variabili modalità immesse nell’analisi. La matrice serve a produrre i fattori.
  • L’acm è molto sensibile alle variazioni presenti nei dati. Pertanto, per ottenere risultati robusti è necessario che il numero dei casi sottoposti ad analisi sia elevato: minimo 20 casi per ciascuna modalità attiva.
  • Le variabili-modalità con frequenze molto basse (2% o meno) vengono eliminate oppure aggregate in una nuova modalità residuale o definite come variabili-modalità illustrative.
  1. La scelta dei fattori : sono combinazioni delle variabili-modalità attive inserite nell’analisi; sono ortogonali tra loro (indipendenti l’uno dall’altro) e riproducono in ordine decrescente il massimo della dispersione presente nella matrice di Burt. Vengono estratti i fattori che riproducono tutta la inerzia della nuvola dei punti. I primi infatti riproducono la maggior parte dell’inerzia, ma a volte i successivi contengono informazioni più rilevanti in quanto meno prevedibili e ovvie.
  2. Interpretazione dei risultati dell’acm mediante l’uso di coefficienti e di proiezioni:
  • Permettono di analizzare le modalità attive e illustrative in relazione ai fattori scelti
  • Nelle proiezioni se due modalità sono vicine nello spazio, sono direttamente associate (concordanti); se non sono vicine ed esibiscono segni opposti sono inversamente associate (discordanti). Le configurazioni grafiche della nuvola dei punti possono avere forma di: ellissi/nuvole sparse/cavallo/triangolo
  • I coefficienti utilizzati sono: Contributo assoluto di ciascuna modalità attiva: rappresenta la parte di inerzia del fattore dovuta alla modalità cui si riferisce. Il c.a. di una modalità è proporzionale alla sua massa e al quadrato della sua coordinata fattoriale. Per ogni fattore la somma di tutti i contributi assoluti di ciascuna modalità è uguale a 100. Con il c.a. si valuta quanta influenza una modalità ha avuto nel determinare un certo fattore. Contributo relativo /coseno quadrato/qualità della rappresentazione: è un valore che permette di valutare il contributo che un certo fattore F fornisce alla riproduzione della dispersione di ogni modalità attiva. Se il c.r. è basso la modalità in questione non è ben rappresentata dal fattore F; se invece è alto bisogna analizzare il ruolo che essa gioca nella formazione: dell’asse sul quale è ben rappresentata. Il coseno quadrato è espresso da una proporzione che varia da 0 a 1 e moltiplicando per 100 otteniamo la percentuale di dispersione di una modalità riprodotta da un fattore. Coordinate fattoriali : possono avere segno positivo o negativo e stabiliscono la posizione delle modalità, attive e illustrative, sugli assi. Il valore 0 corrisponde alla media delle

COEFFICIENTI :

  • Autovalore : di una componente estratta consente di valutare la sua rilevanza
  • Comunalità : quantifica la percentuale della varianza dei una variabile che è riprodotta dall’insieme delle componenti estratte
  • Pesi componenziali : analizzando il vettore dei pesi componenziali relativi a tutte le variabili si constata quali variabili siano rilevanti per quella dimensione. Quanto più alto è il peso componenziale tanto più la relativa variabile è importante per quella componente
  • Punteggio componenziale : è attribuito ad ogni caso su ciascuna componente estratta. È assegnato dopo aver interpretato le componenti principali, dopo aver effettuato le rotazioni (vedi punto 3)
  1. Come scegliere il numero di componenti da estrarre? Tre criteri:
    1. Si continua ad estratte componenti fino a che non si raggiunge una quota di varianza da riprodurre precedentemente stabilita
    2. Si prendono in considerazione solo le componenti che presentano un autovalore almeno uguale ad 1 (pag 118)
    3. Si rappresentano graficamente secondo l’ordine d’estrazione ponendo sull’asse orizzontale le componenti e verticale gli autovalori corrispondenti
  2. Tecniche di ROTAZIONE :

Per determinare quanto due componenti siano correlate tra loro si opta per la rotazione, grazie alla quale è possibile individuare un nuovo sistema di assi in cui ciascuna variabile si dispone il più vicino possibile ad un solo asse. Si ruotano le componenti mantenendo fissa l’origine degli assi.

Rotazioni ortogonali :

  • Varimax: modifica i vettori-colonna della matrice dei pesi componenziali agevolando la scelta di un numero limitato di variabili che saturano ciascuna componente
  • Quartimax: semplifica le righe della matrice dei pesi componenziali così che ciascuna variabile saturi una sola componente
  • Equamax: compromesso tra le precedenti. Tenta una semplificazione dei pesi sia sulle righe (rispetto alle variabili) che sulle colonne (rispetto alle componenti) mantenendo costante la varianza totale riprodotta dalle componenti

Rotazioni oblique : procedimenti iterativi di variazione dell’angolo tra coppie di componenti dopo una rotazione ortogonale

  • Promax: si effettua partendo da una rotazione Varimax ed eliminando il requisito di ortogonalità fra le componenti. Si cerca rotazione che aumenti i pesi più grandi e riduca i più piccoli. Il parametro K (4) accresce la correlazione tra le componenti
  • Oblimin diretto: sottotipo della Promax. Si parte dalla Varimax. Si usa il parametro delta (0; -1)
  1. Si interpretano le componenti estratte tenendo conto dei diagrammi e dei vettori di pesi componenziali
  2. Si assegnano i punteggi componenziali ad ogni caso su ciascuna componente estratta creando nuovi vettori-colonna, gli INDICI : si sommano i punteggi dei casi su un certo numero di variabili scelte come indicatori di un concetto specifico.

L’acp a 2 stadi usata per rilevare dimensioni concettuali di grande generalità attraverso un largo numero di indicatori.

ADG: Analisi dei GRUPPI/ cluster analysis

Tecniche:

  • GERARCHICHE : producono una sequenza di partizioni da un numero di gruppi unitari ad un unico gruppo che aggrega tutti i casi (tecniche aggregative), oppure da un unico gruppo fino ad n gruppi con un solo individuo (t. scissorie, non trattano più di 10 casi). Danno una visione completa delle distanze. Non richiedono una scelta a priori del numero di gruppi da formare. Le aggregative : si limitano al trattamento di un centinaio di casi
    • Si produce la matrice delle distanze o delle similarità
    • si considerano n gruppi per n casi
    • si aggregano i gruppi che risultano più vicini fino a raggiungere ad un unico gruppo
    • le partizioni sono rappresentate con un dendrogramma Per aggregare i casi è sufficiente ricorrere ai valori di distanza/similarità. Per aggregare i casi con i gruppi o i gruppi tra loro si ricorre ad uno dei seguenti algoritmi:
    • Criterio del legame singolo: si fondono i casi più vicini o simili
    • // completo: considera i casi più lontani o dissimili
    • // medio: per determinare la distanza tra i gruppi si calcola la media non ponderata delle distanze tra tutte le coppie di casi appartenenti ai gruppi
    • della media dentro i gruppi: unisce i gruppi in modo da avere la distanza media minima tra tuti i casi del gruppo risultante
    • della mediana: si calcola la mediana all’interno di ogni gruppo. La distanza tra due gruppi è pari alla distanza tra le rispettive mediane
    • di Ward: si aggregano i casi che minimizzano l’incremento della varianza delle variabili entro i gruppi
    • del centroide: per ogni gruppo si definisce il baricentro o centroide che è costituito dalla media delle coordinate di tutti i casi. Si considerano le distanze tra i centroidi
  • NON GERARCHICHE : conducono direttamente ad un’unica partizione degli n casi in k gruppi. Possono trattare molti più casi rispetto alle gerarchiche, e consentono lo spostamento dei casi da un gruppo ad un altro. Richiedono una scelta a priori del numero di gruppi da formare. Le tecniche adottate per spostare i casi sono:

Se 𝜆𝑖𝑗𝐴𝐵^ > 0 concordanza tra le due variabili

Se 𝜆𝑖𝑗𝐴𝐵^ < 0 associazione discordante tra le modalità delle variabili A e B

Se 𝜆𝑖𝑗𝐴𝐵^ = 0 non c’è associazione tra le due variabili

odds rapporto di probabilità: assume valore 1quando le due categorie di una variabile hanno le stesse frequenze. Varia da 0 a infinito.

Analisi dei RESIDUI:

valuta l’adattamento delle singole celle della tab di contingenza.

  • Di riga:
  • Standardizzati:
  • Corretti:
  • Di devianza: