Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


dispense statistica e SPSS, Appunti di Statistica

dispense statistica e SPSS utilissime e complete

Tipologia: Appunti

2018/2019

Caricato il 03/09/2019

luigi_di_iorio
luigi_di_iorio 🇮🇹

4.5

(16)

18 documenti

1 / 6

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1. Operazioni su dataset
fare esercizio non su tutto il campione e dividerlo (es: dato il seguente campione creare
sottocampioni M/F e vedere le differenze
DATI-DIVIDI (dove inseriamo la variabile che ci serve per dividere, in questo caso sesso)-
CONFRONTI (ogni cosa la dividiamo per entrambi)
N.B se per le operazioni future non mi serve tornare su dividi devo togliere il comando altrimenti
Rimane.
fare esercizio su una parte del campione e lavorare solo su quella
DATI-SELEZIONA CASI e a questo punto abbiamo di fronte tre scelte:
1) Qualcuno di specifico: es: stato civile=1 & sesso=”M” & età= > 30 per quanto riguarda
le scritte (M) dobbiamo metterle tra virgolette (solo le stringhe) e dobbiamo prendere il
valore esatto dell’etichetta (1=M)
N.B stare attenti alle maiuscole e alle minuscole, bisogna copiare il valore esatto!
| vuol dire “o”
2) Casuale: due tipologie
Percentuale
Numero es: 100 campioni causali dal soggetto 200 a 7000 (inserire numeri al)
3) Intervallo preciso: es: dal 2 al 20
doppio criterio di selezione:
prima selezione es: M
copia i casi selezionati in un nuovo insieme es: sposati e non sposati
nel nuovo dataset es: sposati si fa SELEZIONE-CASUALE 100 casi
N.B finito l’esercizio togliere criteri di selezione e chiudere nuovo dataset per tornare alla
situazione di partenza
2. Operazioni sulle variabili
Consiste nell’effettuare operazioni sulle variabili che non abbiamo. Necessità di creare nuova
variabile es: abbiamo come variabile l’età e vogliamo creare la variabile classe d’età.
1) Crea nuova variabile da variabile di partenza:
TRASFORMA-RICODIFICA-SEMPRE VARIABILI DIFFERENTI DA età- A età in classi, si
seleziona età e si inserisce, inserire anche nome (es: età2) ed etichetta (es: età in classi)
Abbiamo un’altra pagina con valori vecchi e valori nuovi. Nei valori vecchi inseriamo per esempio
un intervallo: dal più piccolo a 35=1 (che vuol dire giovane), da 36 a 50=2 (che vuol dire adulto),
da
51 a tutti gli altri=3 (che vuol dire anziano). In questo caso passiamo da una variabile quantitativa
ad una ordinale.
Cliccare su continua e poi ok. Poi sistemare in visualizzazione variabili i valori e le etichette della
nuova variabile
N.B dicotomizzare una variabile significa crearla.
2) Calcola variabile: creare variabile da zero
Per esempio, se creiamo una variabile nuova da due vecchie -> voglio creare variabile reddito
procapite
Inserire reddito della famiglia in relazione con il numero dei componenti.
In questo caso è quantitativa perciò non inserisco valori.
pf3
pf4
pf5

Anteprima parziale del testo

Scarica dispense statistica e SPSS e più Appunti in PDF di Statistica solo su Docsity!

  1. Operazioni su dataset

fare esercizio non su tutto il campione e dividerlo (es: dato il seguente campione creare sottocampioni M/F e vedere le differenze DATI-DIVIDI (dove inseriamo la variabile che ci serve per dividere, in questo caso sesso)- CONFRONTI (ogni cosa la dividiamo per entrambi) N.B se per le operazioni future non mi serve tornare su dividi devo togliere il comando altrimenti Rimane.

fare esercizio su una parte del campione e lavorare solo su quella DATI-SELEZIONA CASI e a questo punto abbiamo di fronte tre scelte:

  1. Qualcuno di specifico: es: stato civile=1 & sesso=”M” & età= > 30 per quanto riguarda le scritte (M) dobbiamo metterle tra virgolette (solo le stringhe) e dobbiamo prendere il valore esatto dell’etichetta (1=M) N.B stare attenti alle maiuscole e alle minuscole, bisogna copiare il valore esatto! | vuol dire “o”

  2. Casuale: due tipologie

  • Percentuale
  • Numero es: 100 campioni causali dal soggetto 200 a 7000 (inserire numeri al)
  1. Intervallo preciso: es: dal 2 al 20

doppio criterio di selezione: prima selezione es: M copia i casi selezionati in un nuovo insieme es: sposati e non sposati nel nuovo dataset es: sposati si fa SELEZIONE-CASUALE 100 casi N.B finito l’esercizio togliere criteri di selezione e chiudere nuovo dataset per tornare alla situazione di partenza

  1. Operazioni sulle variabili

Consiste nell’effettuare operazioni sulle variabili che non abbiamo. Necessità di creare nuova variabile es: abbiamo come variabile l’età e vogliamo creare la variabile classe d’età.

1) Crea nuova variabile da variabile di partenza: TRASFORMA-RICODIFICA-SEMPRE VARIABILI DIFFERENTI DA età- A età in classi, si seleziona età e si inserisce, inserire anche nome (es: età2) ed etichetta (es: età in classi) Abbiamo un’altra pagina con valori vecchi e valori nuovi. Nei valori vecchi inseriamo per esempio un intervallo: dal più piccolo a 35=1 (che vuol dire giovane), da 36 a 50=2 (che vuol dire adulto), da 51 a tutti gli altri=3 (che vuol dire anziano). In questo caso passiamo da una variabile quantitativa ad una ordinale. Cliccare su continua e poi ok. Poi sistemare in visualizzazione variabili i valori e le etichette della nuova variabile N.B dicotomizzare una variabile significa crearla.

2) Calcola variabile : creare variabile da zero Per esempio, se creiamo una variabile nuova da due vecchie -> voglio creare variabile reddito procapite Inserire reddito della famiglia in relazione con il numero dei componenti. In questo caso è quantitativa perciò non inserisco valori.

3) Creare variabile con 4 valori : per esempio M single, M sposato, F single, F sposata (in questo caso è sconnessa) Possiamo chiamare la variabile di destinazione “gruppi” e poi inseriamo i valori: 1 se sesso= “M” & stato civile= “0” e così per tutti gli altri. N.B il se corrisponde al tasto in fondo alla pagina. N.B è meglio prima appuntarsi i valori a parte e poi inserirli

4) Conta valore all’interno dei casi TRASFORMA-CONTA VALORI TRA I CASI-inserisco variabili-DEFINISCI VALORI-1 (es:num beni per ciascuno) -OK ANALIZZA-FREQUENZE DESCRITTIVE- in questo modo esce tabella Es: quanti oggetti tecnologici hai? Conta quante volte c’è un oggetto tecnologico per ogni soggetto. Inserire i nomi degli oggetti tecnologici e poi fare DEFINISCI VALORI dove inseriamo per esempio 1 che significa che ha quell’oggetto

5 ) Spulciare variabili : ANALIZZA-DESCRITTIVE-FREQUENZE (qui scegli la variabile da spulciare) Es: quanto sei d’accordo con tua madre? 1=per niente 7=del tutto (scala likert) (non è dicotomica) Es: ricchi e poveri, dobbiamo scegliere il valore che corrisponde all’essere ricchi, la prof ci può dare una percentuale per esempio i ricchi sono il 20% perciò dobbiamo fare FREQUENZE- PERCENTILE-80-AGGIUNGI e in questo modo otteniamo il numero che corrisponde ai poveri

ESERCIZIO 1

Il primo esercizio consiste nello studio della relazione tra due variabili, esistono 4 tipi di variabili perciò abbiamo varie procedure:

1) Quantitativa-quantitativa Es: relazione tra età e reddito ANALIZZA-CORRELAZIONE-BIVARIATA, inserire le variabili e poi selezionare PEARSON, nell’output comparirà una tabella che è da commentare, come?

  • Guardare il pvalue: ci dice se c’è o non c’è una relazione. 0,05 è la nostra soglia, al di sopra è considerato grande e al di sotto piccolo. A questo punto abbiamo due possibilità:
    • Se il pvalue è grande non esiste una relazione significativa e perciò l’esercizio è concluso
    • Se il pvalue è piccolo esiste una relazione significativa perciò bisogna verificare la forza di questa. Le tipologie di commento a questa prima tabella sono: tra la variabile x e la variabile y esiste una relazione significativa tra la variabile x e la variabile y non esiste una relazione significativa

Verificare la forza della relazione: Pearson è l’indicatore di forza (va da -1 a 1, tanto più è vicino a 0 tanto più la relazione è debole e tanto più si allontana più è forte. Es: 0,25 è abbastanza forte, oltre 0,25 (segno + o -) è forte (se è + è forte e positiva, cioè quando una variabile si muove l’altra la segue, aumentano o diminuiscono insieme) se è – è forte e negativa, cioè una va da una parte e l’altra dall’altra) N.B in questo caso non dire nulla sulla proprietà diretta o inversa.

Fare descrizione della direzione: determinata in base a positiva-negativa, due casi: Positivo: all’aumentare dell’età aumenta il reddito, per esempio: divento adulto, ho più esperienza sul luogo di lavoro e quindi mi pagano di più. Negativo: all’aumentare dell’età cala il reddito, per esempio: a lavoro faccio fatica perché sono anziano e perciò mi pagano meno.

5) Ordinale-ordinale ANALIZZA-STATISTICHE DESCRITTIVE-TAVOLE DI CONTINGENZA (crosstabs) Si inseriscono 2 variabili, una in riga e una in colonna, (indifferente la posizione). STATISTICHE-CHI QUADRATO (dice se c’è relazione) e GAMMA (dice la forza) CELLE-STANDARDIZZATI (da spuntare) -OK Cosa c’è da dire? esiste relazione significativa? guardare chi quadrato. se è piccolo o grande .se è piccolo esiste una relazione significativa. il valore di gamma stabilisce la forza N.B non guardare il pvalue. Il valore di gamma è nella prima colonna e va da -1 a + guarda la tavola di contingenza. Dobbiamo commentare i residui significativi. I valori di riferimento sono quelli >2 (significa che son tanti i casi con quella condizione rispetto alla variabile indipendente) e < -2 (significa che son pochi i casi con quella condizione rispetto alla variabile indipendente). N.B. I valori compresi tra -2 e 2 non sono significativi. Es di commento: sono tante le persone con scuola non completata e con reddito inferiore a 25.000 euro

6) Ordinale-sconnessa, sconnessa-dicotomica, sconnessa-sconnessa, ordinale-dicotomica Si fanno tutte allo stesso modo. ANALIZZA-STATISTICHE DESCRITTIVE-TAVOLE DI CONTINGENZA STATISTICHE-CHI QUADRATO- non si chiede gamma, ma si chiede V DI KRAMER (ci fa vedere la forza) N.B la forza si vede sempre dal valore e non dal pvalue Non si parla di forza positiva o negativa, ma di FORTE o DEBOLE Es: 0,25 è abbastanza forte, oltre è forte, 0,1 è debole Dobbiamo guardare anche i residui significativi, Vai su celle e metti standardizzati

7) Dicotomica-dicotomica ANALIZZA-STATISTICHE DESCRITTIVE-TAVOLE DI CONTINGENZA In questo caso le variabili hanno una precisa posizione nelle righe e nelle colonne. Es: uso di internet tra pensionati -> pensionati in colonna e internet in riga. CHI QUADRATO e COEFFICIENTE DI RISCHIO (da spuntare) IN CELLE GLI STANDARDIZZATI Output: cosa guardare? Guardare chi quadrato e vedere se c’è relazione, Se c’è relazione vai alla tabella stima di rischio ES commento: tra coloro che sono in pensione (gruppo che si guarda) quelli che non hanno internet (numeratore del rapporto) sono l’85% (valore) in più di quelli (denominatore del rapporto) che ce l’hanno. N.B le cose tra parentesi non sono da scrivere nel commento N.B 85% corrisponde a 1,85, un altro esempio può essere 0,97 che corrisponde a 3% REGOLA: se c’è 0, si guarda quello che manca ad arrivare a 100 e il valore mancante si tramuta in percentuale, se non c’è 0, (es: 1,85)si prendono le due cifre dopo la virgola (85) e si tramuta in percentuale. N.B se ho difficoltà a commentare la stima di rischio posso commentare la tavola di contingenza.

Esercizio 2: creare un modello

Un modello è una relazione più ampliata. Ho una variabile e voglio capire cosa la influenza cioè devo cercare le possibili cause che determinano la variazione della variabile in questione. Devo cercare i PREDITTORI. Es: trova modello per spiegare il reddito N.B bisogna fare attenzione a non mettere gli effetti es: costo dell’auto, non è il costo dell’auto a determinare il reddito ma il contrario.

Trovo il modello per spiegare una variabile quantitativa o ordinale e come predittori non posso usare variabili sconnesse ANALIZZA-REGRESSIONE-LINEARE DIPENDENTE: variabile y, cioè quella che voglio spiegare (es: reddito) INDIPENDENTE: tutte le variabili predittori (no sconnesse! E non effetti!) Poi fare OK Esempi di predittori: età, stato civile dato che è M/F sarebbe sconnessa perciò bisogna trasformarla in dicotomica cioè assegnare valore 1 a M e 2 a F, grado di istruzione.

3 cose da dire:

  • Se il modello è valido cioè se le variabili che abbiamo scelto come predittori hanno senso. Dobbiamo guardare nella tabella 1 (ANOVA) il pvalue, se è piccolo è valido se è grande non è valido. N.B dobbiamo trovarlo per forza valido!
  • Quanti predittori influenzano la variabile indipendente. Bisogna guardare tabella 2 (RIEPILOGO DI MODELLO) nel valore RR QUADRATO CORRETTO es: 1 è 100%, 0,132 è 13,2%
  • Quanto le variabili indipendenti (predittori) influenzano la variabile dipendente. Si guarda la TABELLA COEFFICENTI. Dobbiamo cercare quanto un singolo predittore influenza la VD e cerchiamo quelli significativi (sig -> è sempre il pvalue, dobbiamo considerare quelli piccoli ed escludere i grandi. Il sig si trova nell’ultima colonna) e dobbiamo commentare B. B è la variazione della variabile dipendente (y) per un incremento unitario di x. Se B è negativo significa che all’incremento unitario di x cala di un tot y.

Es di commento: all’aumentare di tot anni di istruzione (variabile y, variabile indipendente) aumenta il reddito (variabile x, dipendente) Es: all’aumentare di tot anni di età aumenta il reddito.

Esercizio 3: analisi da raggruppamento, analisi fattoriale

Nell’analisi fattoriale si prende un insieme di variabili e si provano a unire (es: bellezza, profumo, colore etc.. diventano giudizio estetico). Nell’analisi fattoriale utilizziamo variabili quantitative o ordinali mai sconnesse o dicotomiche. Cosa fare? acquisire il dataset verificare se si possono unire variabili

  • ANALIZZA-SCALA-ANALISI DI AFFIDABILITA’
  • Inserire variabili da fattorizzare
  • Otteniamo una tabella nell’output che ci dice se è possibile farlo: da 0,65 a 0,7 in su è buono, 0,5 non è il massimo, 0,4 fa schifo (l’alfa non è molto alto)
  • In quante le posso ridurre?
  • ANALIZZA-RIDUZIONE DIMENSIONE (data reduction) -FATTORIALE
  • INSERIRE LE VARIABILI DA FATTORIZZARE-ESTRAZIONE-RICHIEDERE GRAFICO (SCREE PLOT)
  • DECRESCENTE AUTOVALORI (le altre cose non le conto)
  • ROTAZIONE-VARIMAX
  • OPZIONI-ORDINARE PER DIMENSIONI E SOPPRIMERE COEFFICENTI PICCOLI- CAMBIARE
  • VALORE ASSOLUTO IN ,
  • GRAFICO DECRESCENTE AUTOVALORI -> i pallini sono i possibili fattori
  • REGOLE: si cerca gomito e fattori. Se il gomito non è ben delineato si prendono fattori superiori a 1 (su colonna) Se il gomito è netto e sopra o a cavallo dell’1 e se sopra l’1 c’è solo un fattore bisogna prendere anche quello a cavallo del gomito
  • ANALIZZA-RIDUZIONE DIMENSIONE-FATTORIALE-ESTRAZIONE poi gli diciamo NUMERO FISSO FATTORI:2-CONTINUA-PUNTEGGI-SALVA COME VARIABILI- CONTINUA-OK