1. Nei metodi agglomerativi (cluster) in base a quale distanza viene creato il primo gruppo:
distanza tra i punti più vicini
2. Cosa hanno in comune analisi delle corrispondenze semplici e multiple: si basano su
variabili qualitative (qualitative: ordinali e nominali). La differenza sono le variabili
illustrative o l’interpretazione dei profili di riga e di colonna?
3. Variabili età e reddito cosa usi per studiare la relazione: regressione
4. Diagramma di shepard cosa rappresenta: usato nello scaling multidimensionale per
verificare l’adattamento. Raffigura la relazione tra le prossimità osservate, le pseudo
distanze e le distanze tra ogni coppia di elementi. Sulle ascisse troviamo le prossimità
osservate, sulle ordinate le due diverse distanze. I punti bianchi rappresentano le pseudo
distanze, i punti neri sono le distanze della soluzione tra le coppie. Se c’è molta differenza
tra pseudo distanze e distanze ci sarà un elevato errore (stress).
5. Profili di riga e di colonna: frequenze condizionate che si ottengono rapportando la
frequenza di ogni cella al rispettivo totale di riga/colonna. Servono per calcolare le
coordinate dei punti nello spazio.
6. Quando utilizziamo la standardizzazione nell’analisi delle corrispondenze: mai (perché sono
variabili qualitative; la standardizzazione la usano nella regressione, nell’analisi delle
componenti principali/fattoriale, nello scaling e nella cluster)
7. Coefficienti fattoriali: legame tra variabili e dimensioni latenti estratte. Coefficiente di
Correlazione: somiglianza tra le variabili nella matrice di correlazione (componenti
principali e cluster). Autovalore: % di variabilità spiegata da una dimensione latente.
Comunalità: % di variabilità spiegata da tutte le dimensioni latenti
8. Contributo assoluto: quota di inerzia di una dimensione spiegata da una modalità, si legge
in colonna. Contributo relativo: quota di inerzia della modalità spiegata dalla dimensione, si
legge in riga.
9. Punteggi fattoriali: punteggio di ognuno dei soggetti presente nel data set sui fattori
estratti.
10. Da cosa dipende la numerosità di un campione: dalla variabilità (ma anche dal livello di
precisione, dall’errore, dal tipo di analisi e dai costi)
11. Stress 0,5: lo scaling non si adatta bene ai nostri dati.
12. Misure di tendenza centrale: riassumono in un unico dato l’intera distribuzione indicandone
il punto centrale
13. Autovalore e autovettore: l'autovettore è un vettore di valori che viene estratto dalla
matrice di correlazione, mentre l'autovalore è quel numero che ci permette di trovare la %
di varianza spiegata.
14. Calcolare mediana di valori non in ordine: devo prima ordinarli poi calcolare la mediana sui
casi (non sulle variabili!!) o guardando la % cumulata. Se i casi sono dispari prendo il valore
centrale (N+1/2) , se sono pari prendo il valore centrale +1 N/2 e (N/2+1).
15. Scree test analisi componenti principali/fattoriale: x dimensioni; y autovalori
16. Scree test analisi corrispondenze: x dimensioni; y: inerzia
17. Scree test scaling: x: dimensioni; y: raw stress
18. Punteggi fattoriali: punteggio di ognuno dei soggetti presente nel dataset sui fattori estratti
19. Beta standardizzati: variano tra -1 e +1 (quelli non standardizzati possono assumere
qualsiasi valore)
20. Media di riga= totale colonna/ totale casi