Prepara i tuoi esami
Ottieni punti
Guide e consigli
Vendi su Docsity
Docsity AI

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Guide e consigli

Vendi su Docsity

Docsity AI

Accedi Registrati

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Cerca documenti

Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity

Cerca la tua università

Trova i documenti specifici per gli esami della tua università

Video Corsi

Preparati con lezioni e prove svolte basate sui programmi universitari!

Quiz

Rispondi a reali domande d’esame e scopri la tua preparazione

Docsity AINEW

Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali

Maturità 2026

Studia con prove svolte, tesine e consigli utili

Esplora domande

Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te

Argomenti di studio

Esplora i documenti più scaricati per gli argomenti di studio più popolari

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Condividi documenti

20 Punti

Per ogni documento caricato

Rispondi alle domande

5 Punti

per ogni risposta data (max 1 al giorno)

Tutti i modi per ottenere punti gratis

Ottieni punti subito

Scegli un piano Premium con tutti i punti di cui hai bisogno

Opportunità di studio

Scegli il tuo prossimo programma di studio

Entra in contatto con le migliori università del mondo e scegli il tuo percorso di studi

Classifica delle migliori università

Scopri le migliori università italiane secondo gli studenti

Community

Chiedi alla community

Chiedi aiuto alla community e sciogli i tuoi dubbi legati allo studio

Guide Gratuite

I nostri eBook salva studente

Scarica gratuitamente le nostre guide sulle tecniche di studio, metodi per gestire l'ansia, dritte per la tesi realizzati da tutor Docsity

Guida pratica e teorica SPSS, Dispense di Statistica

Università degli Studi di Modena e Reggio Emilia (UNIMORE)Statistica

Guida alle funzioni base SPSS con esercizi esplicativi

Tipologia: Dispense

2016/2017

In vendita dal 12/10/2017

daphne89 🇮🇹

4.4

(13)

12 documenti

1 / 46

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

Operazioni preliminari

Acquisire dataset

Esistono tre formati in cui può essere il dataset a cui corrispondono tre diverse

modalità di acquisizione:

• .sav: FILE → APRI → DATI → SELEZIONARLO CON DOPPIO CLICK

• File excel: FILE → APRI → DATI → CAMBIARE CON FORMATO EXCEL poi

spss fa due domande: 1) Se la prima riga del ﬁle contiene i nomi delle

variabili? 2) In quale foglio si trovano i dati (se ce n’è più di uno)? 3)

L’intervallo di celle da importare. Aprire il ﬁle anche in excel per

veriﬁcarlo.

• .txt e .dat (ﬁle di testo): FILE→APRI→DATI o FILE→LEGGI DATI DI

TESTO

Anche qui occorre aprire prima il ﬁle per capire come è fatto.

Si apre una schermata a 6 passi:

1) non fare nulla

2) fare due cose:

• Chiede se le variabili sono delimitate (uno o più caratteri, compreso spazio o

tabulazione, indicano il cambio di variabile) o a larghezza ﬁssa (è possibile

tirare delle righe a mano per separare le variabili).

• Poi chiede se i nomi delle variabili sono nella prima riga.

3) Indicare il numero di riga in cui inizia il primo caso dei dati.

4) operazioni diverse in base alla scelta tra larghezza ﬁssa o delimitata.

•Larghezza ﬁssa: dobbiamo dire noi che spazio c’è tra le variabili utilizzando

come guida il tracciato record. Dobbiamo tirare delle righe per dividere le

variabili.

•Delimitata: individuare delimitatori ed eventuali qualiﬁcatori. Certe volte non

riconosce le doppie virgolette come qualiﬁcatore: mettere le virgolette

singole.

Il qualiﬁcatore serve per delimitare una parola e far sì che spss non vi legga al suo

interno delimitatori. Ad esempio se il delimitatore è la virgola, ma la variabile indirizzo

è “via Mazzoleni, 2”, per tenere insieme l’indirizzo indicheremo come qualiﬁcatore le

doppie virgolette.

5) Formato: spss capisce numeri o stringhe ma non i numeri con il punto al

posto della virgola! I numeri con il punto al posto della virgola vanno cambiati

di formato da numerico a virgola (comma). Mentre il formato giusto per i

numeri con la virgola è quello numerico.

6) Cliccare su ﬁne.

Inﬁne impostare il dataset con le indicazioni date dalla prof (etichette, valori,

valori mancanti)

Tipi di variabili:

•Quantitative (riguardano caratteristiche numeriche): sono valori (numeri) che

rimandano a sé stessi, es: età 31 vuol dire che ha 31 anni.

Scopri Dispense di Statistica Università degli Studi di Modena e Reggio Emilia (UNIMORE)

Documenti correlati

Guida teorica al programma Spss , Martini

(1)

SPSS: riassunto e guida completa per l'esame.

(2)

Guida completa di SPSS

Tabella riassuntiva Spss

SPSS - Guida per svolgimento esercizi d'esame

Analisi statistica SPSS

Spss gestione dei dati

(1)

guida spss

(1)

esame 18 gennaio spss

(1)

SPSS - Guida per svolgimento esercizi d'esame AGGIORNATA E CORRETTA

(1)

Appunti programma SPSS statistica

(2)

PROVA D'ESAME STATISTICA SPSS

Anteprima parziale del testo

Scarica Guida pratica e teorica SPSS e più Dispense in PDF di Statistica solo su Docsity!

Operazioni preliminari

Acquisire dataset Esistono tre formati in cui può essere il dataset a cui corrispondono tre diverse modalità di acquisizione:

.sav: FILE → APRI → DATI → SELEZIONARLO CON DOPPIO CLICK
File excel: FILE → APRI → DATI → CAMBIARE CON FORMATO EXCEL poi spss fa due domande: 1) Se la prima riga del file contiene i nomi delle variabili? 2) In quale foglio si trovano i dati (se ce n’è più di uno)? 3) L’intervallo di celle da importare. Aprire il file anche in excel per verificarlo.
.txt e .dat (file di testo): FILE→APRI→DATI o FILE→LEGGI DATI DI TESTO Anche qui occorre aprire prima il file per capire come è fatto.

Si apre una schermata a 6 passi:

non fare nulla
fare due cose:

Chiede se le variabili sono delimitate (uno o più caratteri, compreso spazio o tabulazione, indicano il cambio di variabile) o a larghezza fissa (è possibile tirare delle righe a mano per separare le variabili).
Poi chiede se i nomi delle variabili sono nella prima riga.

Indicare il numero di riga in cui inizia il primo caso dei dati.
operazioni diverse in base alla scelta tra larghezza fissa o delimitata.

Larghezza fissa : dobbiamo dire noi che spazio c’è tra le variabili utilizzando come guida il tracciato record. Dobbiamo tirare delle righe per dividere le variabili.
Delimitata : individuare delimitatori ed eventuali qualificatori. Certe volte non riconosce le doppie virgolette come qualificatore: mettere le virgolette singole.

Il qualificatore serve per delimitare una parola e far sì che spss non vi legga al suo interno delimitatori. Ad esempio se il delimitatore è la virgola, ma la variabile indirizzo è “via Mazzoleni, 2”, per tenere insieme l’indirizzo indicheremo come qualificatore le doppie virgolette.

Formato: spss capisce numeri o stringhe ma non i numeri con il punto al posto della virgola! I numeri con il punto al posto della virgola vanno cambiati di formato da numerico a virgola (comma). Mentre il formato giusto per i numeri con la virgola è quello numerico.
Cliccare su fine.

Infine impostare il dataset con le indicazioni date dalla prof (etichette, valori, valori mancanti)

Tipi di variabili:

Quantitative (riguardano caratteristiche numeriche): sono valori (numeri) che rimandano a sé stessi, es: età 31 vuol dire che ha 31 anni.

Quantitative continue : possono assumere qualsiasi valore numerico anche non intero (es. peso, altezza, distanze).
Quantitative discrete : possono assumere solo valori interi (es. numero di figli, numero di componenti della famiglia, numero di pezzi difettosi prodotti, etc.).
Dicotomiche : se le modalità sono 2 (1 vuol dire M e 2 vuol dire F, questa è stringa e dicotomica). Non tutte le dicotomiche sono stringhe.
(^) Qualitative : non possono essere misurate con i numeri.
Ordinali : una variabile ordinale rimanda a significato ordinabile (es: 1=medie 2=superiori 3=laurea, in questo caso all’aumentare dei valori aumenta il grado di istruzione).
Sconnesse : es: tipo di religione professata, tipo di diploma. Le sconnesse sono stringhe.

Operazioni sul dataset

Per analizzare separatamente alcuni gruppi di unità, è possibile creare questi gruppi: (es: dato il seguente campione creare sottocampioni M/F e vedere le differenze). DATI→DIVIDI (dove inseriamo la variabile che ci serve per dividere, in questo caso sesso) CONFRONTA GRUPPI (ogni cosa la dividiamo per entrambi). Poi togliere dividi.

Per analizzare solo una parte del dataset acquisito: DATI→SELEZIONA CASI e a questo punto abbiamo di fronte tre scelte:

Scegliere i casi che soddisfano qualche condizione : es: stato civile=1 & sesso=”M” & età= > 30.
Campione Casuale : due tipologie

Percentuale.
Numero: es: 100 casi dal soggetto 1 al 7000 (inserire numeri alti)

Campione basato su un intervallo preciso di casi : es: dal 2 al 20. N.B finito l’esercizio togliere criteri di selezione e chiudere nuovo dataset per tornare alla situazione di partenza

Operazioni sulle variabili

Consiste nell’effettuare operazioni sulle variabili o nel crearne di nuove. Necessità di creare nuova variabile es: abbiamo come variabile l’età e vogliamo creare la variabile classe d’età. Tutte queste operazioni le facciamo dal menù “Trasforma”.

Calcola variabile : creare o trasformare una variabile come funzione di altre variabili. Per esempio se creiamo una variabile nuova da due vecchie → voglio creare variabile reddito procapite.

Creare variabile con 4 valori : per esempio M single, M sposato, F single, F sposata (in questo caso è sconnessa). Es. maschio sposato: calcola variabile -> sesso = m e stat civile =1, ecc. faccio lo stesso procedimenti per calcolare le altre variabili maschio non sposato, femmina sposata e femmina non sposata. Ottengo così 4 dicotomiche con valori 0 e 1.

Poi faccio una ricodifica nelle stesse variabili dove a tre delle dicotomiche ottenute assegno i valori 2, 3 e 4. (1-> 2; 1-> 3; 1->4). La prima la lasciamo con il valore 1.

Poi faccio calcola variabile e faccio la variabile unica: maschisposati + maschinonsposati + femminesposate + femminenonsposate.

RELAZIONI TRA VARIABILI

Il p-value rappresenta la probabilità di osservare un valore della statistica test uguale o più estremo del valore che si calcola a partire dal campione, quando l’ipotesi H0 è vera. Un p-value basso porta a rifiutare l’ipotesi nulla H0. In base all’approccio del p-value, la regola decisionale per rifiutare H0 è la seguente: ■ Se il p-value è ≥ a, accetto l’ipotesi nulla

■ Se il p-value è < a, rifiuto l’ipotesi nulla

Il p-value varia fra 0 e 1. Un p-value significativo è più piccolo di 0,05 (con intervallo di confidenza al 95%) e più piccolo di 0,01 (con intervallo di confidenza al 99%).

ALLA VOCE ANALIZZA→CONFRONTA MEDIA , incontriamo 4 possibilità:

ANALIZZA→CONFRONTA MEDIE→MEDIE : mi mostra le medie della variabile dipendente (QUANTITATIVA) per i sottogruppi generati dalle variabili indipendenti (ordinali o sconnesse). Es. “Costruire una tabella con l’età media corrispondente a ciascun livello di istruzione”.

ANALIZZA → CONFRONTA MEDIE→ TEST T:CAMPIONE UNICO : esegue un test per verificare l’ipotesi che la media della variabile QUANTITATIVA sottoposta al test sia uguale a un dato valore.

Output: Se il P-VALUE è piccolo <0,05 (significativo) e l’intervallo di confidenza NON contiene lo zero, RIFIUTO H0, quindi la media è significativamente diversa da H0. Se il P-VALUE è grande >0,05 (non significativo) e l’intervallo di confidenza CONTIENE lo zero, ACCETTO H0, quindi la media non è significativamente diversa da H0.

Si può usare anche per verificare se la percentuale di chi ha una caratteristica dicotomica. Es. “verificare se la percentuale di coloro che possiedono internet è significativamente diversa da 0,25.”

Acquisire il dataset demo.sav

Verificare se il reddito medio pro-capite è pari a 44

Per prima cosa bisogna calcolare la variabile “reddito procapite”. calcola variabile → reddito_procapite= reddito/nfamiglia

La media risulta essere 43,4 quindi accetto l’ipotesi che questo valore sia venuto da una popolazione con media pari a 44. Accetto questo perché il p- value è 0,439 (>0,05). La medie non è significativamente diversa.

Verificare se il costo del mezzo di trasporto è significativamente diverso da 30

Il p-value risulta essere 0,640 quindi >0,05. Quindi possiamo dire che il costo medio del trasporto non è significativamente diverso dal 30 come si

il p-value risulta essere molto piccolo e quindi rifiuto H0. Le variabili appaiate hanno quindi media diversa. Fratelli e sorelle hanno altezze diverse come si evince anche dalla tabella. I fratelli sono mediamente più altri di 5 cm.

ANALIZZA→CONFRONTA MEDIE→TEST T: CAMPIONI INDIPENDENTI : esegue un test per verificare l’ipotesi che le medie di due gruppi indipendenti siano uguali. H0: m1=m I gruppi sono indipendenti se non sono in una relazione biunivoca.

IMPORTANTE → SPSS FORNISCE UNA TABELLA COI RISULTATI DEL TEST DI LEVENE SULL’UGUAGLIANZA DELLE VARIANZE.

GUARDARE LA VOCE SIGN. DEL TEST DI LEVENE, SE IL P-VALUE è >0, ACCETTO L’IPOTESI H0, QUINDI LE VARIANZE SONO UGUALI. SE SONO UGUALI DEVO CONSIDERARE LA PRIMA RIGA “ASSUME VARIANZE UGUALI” E GUARDARE LA SIGN. (2-CODE) PER STABILIRE SE LE MEDIE SONO UGUALI O DIVERSE. SE IL P-VALUE RISULTA ESSERE >0,05 LE MEDIE SONO UGUALI.
GUARDARE LA VOCE SIGN. DEL TEST DI LEVENE, SE IL P-VALUE è <0,05 RIFIUTO L’IPOTESI H0, QUINDI LE VARIANZE NON SONO UGUALI. QUINDI DEVO CONSIDERARE LA SECONDA RIGA “NON ASSUME VARIANZE UGUALI” E GUARDARE LA SIGN. (2-CODE) PER STABILIRE SE LE MEDIE SONO UGUALI O

DIVERSE. SE IL P-VALUE RISULTA ESSERE <0,05 LE MEDIE SONO SIGNIFICATIVAMENTE UGUALI.

Acquisire il dataset demo.sav

Verificare se ci sono differenze statisticamente significative tra pensionati e non pensionati riguardo

alla percentuale di abbonati a riviste, alla proporzione di coloro che usano internet e che possiedono un fax

Prima di fare un confronto con le medie, vado a guardare le varianze. In tutti e tre i casi il p-value è <0,05 quindi le varianze sono diverse. Dopodiché vado a guardare la riga “non assumo varianze uguali” la quale ci dice in tutte e tre i casi le medie sono diverse tra pensionati e non dato che il p-value risulta essere <0.05.

In particolare i non pensionati possiedono in misura significativamente maggiore un fax e un accesso ad internet e sono maggiormente abbonati a riviste.

Verificare se il costo del mezzo di trasporto principale varia significativamente fra maschi e femmine, fra laureati e diplomati (escludendo tutte le altre categorie) e fra persone fino a 40 anni e sopra i 40 anni

Prima di condurre un’analisi della varianza occorre fare un test di Levene per l’uguaglianza delle varianze:

Se il test di levene non è significativo (>0,05) le varianze sono uguali e si può procedere con l’anova: - Guardando la significatività, se è <0,05 le medie sono uguali e mi fermo qui - Guadando la significatività, se è <0,05 le medie non sono uguali e guardo i test post-hoc per varianze uguali (Turkey)
Se il test di Levene è significativo (<0,05) le varianze sono diverse ed è necessario utilizzare un test più robusto per il confronto delle medie (Welch o Brown-Forsuthe) - Guardando la significatività, se è >0,05 le medie sono uguali e mi fermo qui - Guardando la significatività, se è <0,05 le medie sono diverse e guardo i test post-hoc per varianze diverse (Tamhane)

Guardando i test post-hoc i dati da commentare sono quelli asteriscati Nel caso io debba richiedere i post-hoc ( quindi c’è relazione tra le due variabili ), li richiedo dalla finestra e poi li commento. Post-hoc:

- Confronti a coppie (Tukey, Scheffe, Bonferroni, Sidak) : per ciascuna coppia di gruppi la tabella mostra la differenza delle medie e la significatività della differenza. Si commentano solo le differenze significative, spiegando quale gruppo mostra la media maggiore e di quanto. Naturalmente metà dei confronti sono replicazioni di quelli precedenti, con segno invertito.

Sottogruppi omogenei (Tukey-b, Duncan, S-n-K) : l’output mostra i gruppi ordinati in senso crescente rispetto alla media. I valori riportati sono le medie dei gruppi. Sono significativamente diverse al livello di significatività scelto tutte e sole quelle coppie di medie che non compaiono mai nella medesima colonna.

1

Si commentano solo le differenze significative, spiegando quale gruppo mostra la media maggiore, e quali sono i valori medi dei gruppi. Le medie che non compaiono mai nella stessa colonna sono significativamente diverse.

N.B. Se una delle modalità della variabile gruppo ha un solo caso, o lo accorpiamo con un’altra modalità o lo segniamo il valore di tale caso come mancante, perché compromette i test robusti e i post-hoc.

Acquisire il dataset Belgio.sav

Verificare se il numero di anni di istruzione completati, il livello di felicità e il numero di componenti della famiglia variano al variare della condizione lavorativa

Eseguendo il test di levene noto che per anni di istruzione e numero di componenti della famiglia accetto H0 e dico che le varianze sono uguali. Vado quindi a guardare la tabella dell’anova per queste due variabili

Per la variabile numero di componenti della famiglia posso affermare che le medie sono uguali. Quindi tra i gruppi di lavoratori hanno lo stesso numero di componenti della famiglia. Per la variabile anni di istruzione le medie sono significativamente diverse e bisogna guardare i test post hoc per varianze uguali

Per la variabile anni di istruzione posso dire che le medie sono uguali, quindi non ci sono differenze tra i gruppi gli anni di istruzione non varia al variare del domicilio. Per la variabile età invece le medie sono significativamente diverse quindi procediamo con i test post-hoc per varianze uguali.

La differenza significativamente rilevante è presente tra grande città e sobborghi di una grande città. La differenza d’età è di circa 23 anni. Chi abita in una grande città è mediamente più giovane di 23 anni rispetto a chi abita in un sobborgo.

Acquisire il dataset demo.sav

Costruire 4 categorie: maschi sposati, maschi non sposati, femmine sposate e femmine non sposate; verificare se i 4 gruppi hanno lo stesso reddito e auto dello stesso valore

Per costruire le 4 categorie vado in calcola variabile, per fare questo è necessario utilizzare il “SE” sottoscrivendo di volta in volta sulla variabile creata mentre nello spazio della prima schermata metto i numeri che vanno da 1 a 4.

Le varianze per entrambi i gruppi sono diverse infatti rifiuto H0 dato che <0,05. Osservo quindi i test robusti e rifiuto nuovamente H0. Le medie quindi sono significativamente diverse, c’è differenza tra i gruppi.

Osservo adesso i test post-hoc per varianze diverse utilizzando Tamhane.

Possiamo dire che il reddito familiare di un maschio sposato è di circa 8217$ più alto rispetto ad una femmina sposata e viceversa. Mentre il costo di un mezzo di trasporto per un maschio sposato è di circa 2122$ in più rispetto ad una femmina sposata.

1

Guardare il p-value: ci dice se c’è o non c’è una relazione. Se il p-value è >0,05 relazione non significativa, rifiuto H0 (non c’è relazione tra le due variabili). Se il p-value è <0,05 significa che c’è una relazione tra le due variabili.

Le tipologie di commento a questa prima tabella sono:

tra la variabile x e la variabile y esiste una relazione significativa tra la variabile x e la variabile y non esiste una relazione significativa

In base al segno del coefficiente, descrivo la relazione: Se r = 1, c’è una perfetta relazione positiva. Se 0<r<1 c’è una relazione positiva Se r=0 non c’è nessuna relazione lineare Se -1<r<0 c’è una relazione negativa Se r = -1 c’è una perfetta relazione negativa

Verificare la forza della relazione :

(^) Valori compresi tra 0,3 e 0,7 indicano già che esiste una relazione abbastanza forte.
Da 0,7 in più relazione molto forte.

Pearson è l’indicatore di forza (va da -1 a 1, tanto più è vicino a 0 tanto più la relazione è debole e tanto più si allontana più è forte). Se il coefficiente è positivo (+) la relazione è positiva, nel senso che se una variabile aumenta, aumenta anche l’altra. Se il coefficiente è negativo(-), la relazione è negativa, cioè quando una variabile aumenta l’altra diminuisce. N.B in questo caso non dire nulla sulla proprietà diretta o inversa

Fare descrizione della direzione : determinata in base a positiva-negativa, due casi:

Positivo: all’aumentare dell’età aumenta il reddito.
Negativo: all’aumentare dell’età cala il reddito.

Copiare l’output su word e scrivere massimo 3 righe di commento es: esiste una relazione significativa, quindi c’è una relazione debole/forte e positiva, quindi all’aumentare dell’età aumenta il reddito. N.B non parlare statistichese! Non scrivere mai p-value, Pearson, ecc.

ANALIZZA-CORRELAZIONE-BIVARIATA -> chiedo Spearman. (Varia tra -1 e +1, quanto più si avvicina a -1 e +1, tanto più la relazione è forte, tanto più si avvicina a 0 tanto più la relazione è debole. Se Spearman vale 0 non c’è relazione tra le due variabili. Tra 0,3 e 0,7 relazione abbastanza forte. ▲ (^) Guardo se Spearman è significativo.

Se è significativo c’è una relazione tra le due variabili.
Se la relazione è significativa, stabilisco quanto è forte.
Stabilisco se la relazione è positiva o negativa e la descrivo.

Faccio un breve commento sulla relazione, ad esempio all’aumentare del grado di istruzione aumenta il livello di felicità, oppure all’aumentare di una variabile l’altra diminuisce.

ANALIZZA→STATISTICHE DESCRITTIVE→TAVOLE DI CONTINGENZA

(anche più di due variabili). Si inseriscono 2 variabili, una in riga e una in colonna, (indifferente la posizione). In “Statistiche” richiedo “Chi-quadro”, che ci dice se la relazione c’è ed è significativa, e richiedo il coefficiente Gamma (o anche Tau-b) per le variabili ordinali, che ci dice qual è la forza della relazione. In “Celle” seleziono “residui standardizzati”. Gamma e Tau-b variano tra -1 e +1. Tanto più si avvicinano a + 1 e -1, tanto più la relazione è forte, tanto più si avvicinano a 0, tanto più la relazione è debole. Se Tau b = 0 o Gamma = 0, le variabili sono indipendenti.

Coefficiente positivo (+): la relazione è positiva (all’aumentare di una variabile, aumenta anche l’altra). Coefficiente negativo (-1): la relazione è negativa (all’aumentare di una variabile, l’altra diminuisce).

Cosa c’è da dire? Guardo il chi-quadrato: se è significativo, la relazione tra le due variabili esiste. Se è significativo significa che c’è una relazione tra le due variabili, perché rifiuto l’ipotesi H0 di indipendenza delle variabili. Poi guardo il valore del coefficiente e stabilisco la forza della relazione. Ad esempio un gamma di 0,829 stabilisce una relazione molto forte.

N.B non guardare il pvalue. Il valore di gamma è nella prima colonna. Dico se è una relazione positiva o negativa (in base al segno del coefficiente) e faccio un breve commento (es. più è buona la salute, meno si è ostacolati nelle attività).

Successivamente commento i residui standardizzati, maggiori di 2 o di -2. Es. di commento: In particolare, chi è in cattive condizioni di salute è più frequentemente ostacolato nelle attività quotidiane.

Nel caso di due ordinali e di una quantitativa: CORRELAZIONE -> BIVARIATA -> Pearson e Spearman e guardo la tabella che mi interessa.

ANALIZZA → STATISTICHE DESCRITTIVE → TAVOLE DI CONTINGENZA

Con il Chi-quadrato H0: non esiste nessuna relazione tra le due variabili. Richiedo Chi-quadrato e V di Cramer, e in “Celle” i residui standardizzati. La V di Cramer varia tra 0 e 1 (anche il coefficiente di contingenza C). Quanto più il valore è alto, tanto più la relazione è forte.

Coefficiente pari a 1: esiste una perfetta relazione lineare.
(^) Coefficiente pari a 0: non esiste alcuna relazione lineare tra le due variabili.

significativa.

Output: cosa guardare?

Guardare chi quadrato e vedere se c’è relazione
Se c’è relazione vai alla tabella stima di rischio

[ES. commento: tra coloro che sono in pensione (gruppo che si guarda) quelli che non hanno internet (numeratore del rapporto) sono l’85% (valore) in più di quelli (denominatore del rapporto) che ce l’hanno. N.B le cose tra parentesi non sono da scrivere nel commento N.B 85% corrisponde a 1,85, un altro esempio può essere 0,97 che corrisponde a 3% REGOLA: se c’è 0, si guarda quello che manca ad arrivare a 100 e il valore mancante si tramuta in percentuale, se non c’è 0, (es: 1,85) si prendono le due cifre dopo la virgola (85) e si tramuta in percentuale.] N.B se ho difficoltà a commentare la stima di rischio posso commentare la tavola di contingenza tramite i residui standardizzati. Posso commentarla sia in termini di rischio sia in termini di probabilità. Dalle diapositive: il valore da leggere è nella prima colonna e nella prima riga della tabella “stima di rischio”: indica la probabilità che accada il primo evento fra parentesi al gruppo indicato nella prima riga rispetto al secondo. In alternativa posso leggerlo come probabilità che accada il secondo evento tra parentesi per il secondo gruppo rispetto al primo

Es. lettura residui standardizzati della tabella di contingenza Tavola di contingenza Nato sottopeso * Madre ipertesa Madre ipertesa Totale No Sì Nato sottopeso

No, peso normale

Conteggio 125 5 130 Residui stand.

,3 -1,

Sì, sottopeso Conteggio 52 7 59 Residui stand.

-,4 1,

Totale Conteggio 177 12 189

Per una madre ipertesa è meno probabile avere un bambino di peso normale (-1,1). Es. lettura stima di rischio Stima di rischio Valore Intervallo di confidenza 95% Inferiore Superiore Rapporto odd per Nato sottopeso (No, peso normale / Sì, sottopeso)

3,365 1,021 11,

Per coorte Madre ipertesa = No

1,091 ,987 1,

Per coorte Madre ipertesa = Sì

,324 ,107 ,

N. di casi validi 189

E’ più probabile che il primo evento tra parentesi (peso normale) accada al caso della prima riga, cioè ad una madre non ipertesa.

Acquisire il dataset Belgio.sav e verificare se c’è relazione fra:

Condizione professionale e luogo dove si vive

Il Chi quadrato indica che tra le due variabili non vi è una relazione, sono indipendenti.

Condizioni di salute e essere ostacolato nelle attività;

Gamma ci indica che esiste una relazione inversa molto forte e che all'aumentare delle condizioni di salute, diminuisce l'essere ostacolati da problemi.

(^) Sicurezza della zona e aver subito furti

In questo caso il Chi indica che non c'è relazione tra le due variabili, che sono indipendenti.

1