Risposte crocette esame statistica | Schemi e mappe concettuali di Analisi Statistica

1. Nei metodi agglomerativi (cluster) in base a quale distanza viene creato il primo gruppo:

distanza tra i punti più vicini

2. Cosa hanno in comune analisi delle corrispondenze semplici e multiple: si basano su

variabili qualitative (qualitative: ordinali e nominali). La differenza sono le variabili

illustrative o l’interpretazione dei profili di riga e di colonna?

3. Variabili età e reddito cosa usi per studiare la relazione: regressione

4. Diagramma di shepard cosa rappresenta: usato nello scaling multidimensionale per

verificare l’adattamento. Raffigura la relazione tra le prossimità osservate, le pseudo

distanze e le distanze tra ogni coppia di elementi. Sulle ascisse troviamo le prossimità

osservate, sulle ordinate le due diverse distanze. I punti bianchi rappresentano le pseudo

distanze, i punti neri sono le distanze della soluzione tra le coppie. Se c’è molta differenza

tra pseudo distanze e distanze ci sarà un elevato errore (stress).

5. Profili di riga e di colonna: frequenze condizionate che si ottengono rapportando la

frequenza di ogni cella al rispettivo totale di riga/colonna. Servono per calcolare le

coordinate dei punti nello spazio.

6. Quando utilizziamo la standardizzazione nell’analisi delle corrispondenze: mai (perché sono

variabili qualitative; la standardizzazione la usano nella regressione, nell’analisi delle

componenti principali/fattoriale, nello scaling e nella cluster)

7. Coefficienti fattoriali: legame tra variabili e dimensioni latenti estratte. Coefficiente di

Correlazione: somiglianza tra le variabili nella matrice di correlazione (componenti

principali e cluster). Autovalore: % di variabilità spiegata da una dimensione latente.

Comunalità: % di variabilità spiegata da tutte le dimensioni latenti

8. Contributo assoluto: quota di inerzia di una dimensione spiegata da una modalità, si legge

in colonna. Contributo relativo: quota di inerzia della modalità spiegata dalla dimensione, si

legge in riga.

9. Punteggi fattoriali: punteggio di ognuno dei soggetti presente nel data set sui fattori

estratti.

10. Da cosa dipende la numerosità di un campione: dalla variabilità (ma anche dal livello di

precisione, dall’errore, dal tipo di analisi e dai costi)

11. Stress 0,5: lo scaling non si adatta bene ai nostri dati.

12. Misure di tendenza centrale: riassumono in un unico dato l’intera distribuzione indicandone

il punto centrale

13. Autovalore e autovettore: l'autovettore è un vettore di valori che viene estratto dalla

matrice di correlazione, mentre l'autovalore è quel numero che ci permette di trovare la %

di varianza spiegata.

14. Calcolare mediana di valori non in ordine: devo prima ordinarli poi calcolare la mediana sui

casi (non sulle variabili!!) o guardando la % cumulata. Se i casi sono dispari prendo il valore

centrale (N+1/2) , se sono pari prendo il valore centrale +1 N/2 e (N/2+1).

15. Scree test analisi componenti principali/fattoriale: x dimensioni; y autovalori

16. Scree test analisi corrispondenze: x dimensioni; y: inerzia

17. Scree test scaling: x: dimensioni; y: raw stress

18. Punteggi fattoriali: punteggio di ognuno dei soggetti presente nel dataset sui fattori estratti

19. Beta standardizzati: variano tra -1 e +1 (quelli non standardizzati possono assumere

qualsiasi valore)

20. Media di riga= totale colonna/ totale casi

Anteprima parziale del testo

Scarica Risposte crocette esame statistica e più Schemi e mappe concettuali in PDF di Analisi Statistica solo su Docsity!

Nei metodi agglomerativi (cluster) in base a quale distanza viene creato il primo gruppo: distanza tra i punti più vicini
Cosa hanno in comune analisi delle corrispondenze semplici e multiple: si basano su variabili qualitative (qualitative: ordinali e nominali). La differenza sono le variabili illustrative o l’interpretazione dei profili di riga e di colonna?
Variabili età e reddito cosa usi per studiare la relazione: regressione
Diagramma di shepard cosa rappresenta: usato nello scaling multidimensionale per verificare l’adattamento. Raffigura la relazione tra le prossimità osservate, le pseudo distanze e le distanze tra ogni coppia di elementi. Sulle ascisse troviamo le prossimità osservate, sulle ordinate le due diverse distanze. I punti bianchi rappresentano le pseudo distanze, i punti neri sono le distanze della soluzione tra le coppie. Se c’è molta differenza tra pseudo distanze e distanze ci sarà un elevato errore (stress).
Profili di riga e di colonna: frequenze condizionate che si ottengono rapportando la frequenza di ogni cella al rispettivo totale di riga/colonna. Servono per calcolare le coordinate dei punti nello spazio.
Quando utilizziamo la standardizzazione nell’analisi delle corrispondenze: mai (perché sono variabili qualitative; la standardizzazione la usano nella regressione, nell’analisi delle componenti principali/fattoriale, nello scaling e nella cluster)
Coefficienti fattoriali: legame tra variabili e dimensioni latenti estratte. Coefficiente di Correlazione: somiglianza tra le variabili nella matrice di correlazione (componenti principali e cluster). Autovalore: % di variabilità spiegata da una dimensione latente. Comunalità: % di variabilità spiegata da tutte le dimensioni latenti
Contributo assoluto: quota di inerzia di una dimensione spiegata da una modalità, si legge in colonna. Contributo relativo: quota di inerzia della modalità spiegata dalla dimensione, si legge in riga.
Punteggi fattoriali: punteggio di ognuno dei soggetti presente nel data set sui fattori estratti.
Da cosa dipende la numerosità di un campione: dalla variabilità (ma anche dal livello di precisione, dall’errore, dal tipo di analisi e dai costi)
Stress 0,5: lo scaling non si adatta bene ai nostri dati.
Misure di tendenza centrale: riassumono in un unico dato l’intera distribuzione indicandone il punto centrale
Autovalore e autovettore: l'autovettore è un vettore di valori che viene estratto dalla matrice di correlazione, mentre l'autovalore è quel numero che ci permette di trovare la % di varianza spiegata.
Calcolare mediana di valori non in ordine: devo prima ordinarli poi calcolare la mediana sui casi (non sulle variabili!!) o guardando la % cumulata. Se i casi sono dispari prendo il valore centrale (N+1/2) , se sono pari prendo il valore centrale +1 N/2 e (N/2+1).
Scree test analisi componenti principali/fattoriale: x dimensioni; y autovalori
Scree test analisi corrispondenze: x dimensioni; y: inerzia
Scree test scaling: x: dimensioni; y: raw stress
Punteggi fattoriali: punteggio di ognuno dei soggetti presente nel dataset sui fattori estratti
Beta standardizzati: variano tra -1 e +1 (quelli non standardizzati possono assumere qualsiasi valore)
Media di riga= totale colonna/ totale casi

Massa di riga= totale riga/totale casi
Autovalore/n.variabili= inerzia spiegata
Prossimità dirette: le distanze sul piano sono già rilevate coppia per coppia e non servono formule (indirette: bisogna calcolare le prossimità delle coppie)

Risposte crocette esame statistica, Schemi e mappe concettuali di Analisi Statistica

Documenti correlati

Anteprima parziale del testo

Scarica Risposte crocette esame statistica e più Schemi e mappe concettuali in PDF di Analisi Statistica solo su Docsity!