







Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Spiegazione della verifica delle ipotesi attraverso l'uso del programma statistico SPSS.
Tipologia: Dispense
1 / 13
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!








Abbiamo visto che con i dati possiamo fare diverse operazioni tra cui guardarli, controllarli e sintetizzarli mediante:
- MISURE DI CENTRALITA’ - MISURE DI DISPERISIONE Abbiamo visito che è possibile rappresentarli graficamente, fare una verifica delle ipotesi mediante il calcolo dello SE, fare confronti e cercare relazioni tra coppie di variabili. ESEMPIO: IL DISTRIBUTORE DEL CAFFE’ La ditta che ha in gestione i distributori automatici di caffè e bevande calde installa una nuova macchina e, dopo le operazioni di taratura, vuole controllare se la macchina eroga la quantità corretta di caffè. Per verificarlo, il tecnico per la taratura misura la quantità di caffè erogata in un campione di bicchierini. Se il caffè è tarato a 15 e nel mentre che faccio la verifica delle ipotesi mi esce 14 come faccio a capire se quel 14 è dovuto da una casualità irrilevante oppure no? Si fa la verifica delle ipotesi che ci permette di stabilire e capire se il campione osservato conferma o smentisce la nostra teoria/ipotesi: - H0:μ = valore teorico - H1:μ ≠ valore teorico Chiameremo H0 l’ipotesi nulla e H1 l’ipotesi alternativa. In questa procedura si cercherà di stabilire se, nel caso fosse vera H0, avremo una possibilità più alta o più bassa di ottenere i dati che abbiamo ottenuto. La verifica delle ipotesi si basa sul calcolo di una statistica test: Il valore ottenuto si confronta con le tavole della distribuzione normale (se lo s.q.m. della popolazione è noto) , o della distribuzione t di Student (se lo si può solo ricavare dai dati osservati, come accade solitamente nella pratica) con (n-1) gradi di libertà. Dalle tavole si ricava un valore che è detto “p-value”. SPSS ci fornisce direttamente il valore della statistica test, e anche il suo p- value. La distribuzione t è molto simile a quella normale, ma leggermente più dispera. La sua forma dipende da un parametro chiamato: NUMERO DI GRADI DI LIBERTA’. Una distribuzione t è tanto più dispersa quanti meno gradi di libertà ha. È invece più simile a una distribuzione normale quanti più gradi di libertà ha.
Il p-value o livello di significatività osservato rappresenta la probabilità di ottenere valori della statistica test uguali o più grandi di quello osservato, cioè valori della media campionaria lontani dal valore teorico se H0 fosse vera. In pratica se il p-value è molto basso H0 non può essere accettata. Il p-value è calcolato sulla base dell’ipotesi nulla (H0) e indica la probabilità di avere un’evidenza empirica meno favorevole all’ipotesi nulla di quella realmente osservata. Trattandosi di una probabilità, varia da 0 a 1. Quindi, un p-value grande indica che i dati sono compatibili con l’ipotesi nulla, mentre un p-value piccolo indica che dobbiamo rifiutare l’ipotesi nulla ovvero H0. LIVELLO DEL TEST Il livello del test è un concetto simile al livello dell’intervallo di confidenza (SE) e mi dice quanta evidenza contraria ad H0 devo trovare per rifiutare l’ipotesi nulla (H0)
- Se il livello del test è al 95% (di default troviamo questa), rifiuto H0 se il p-value è più piccolo di 0,05. - Se il livello del test è al 99% (si può aumentare la percentuale per essere ancora più sicuri), rifiuto H0 se il p-value è più piccolo si 0,01. Di solito si aumenta la percentuale di modifica nel momento in cui rifiutare H0 avesse delle conseguenze pesanti, al contrario quando gli obiettivi e le conseguenze son piccole il livello del test può essere fatto anche al 90%. TEST UNILATERALI I test descritti fin ora sono volti a capire se il valore del campione è uguale o diverso da un valore teorico , quindi sono TEST BILATERALI o A DUE CODE. I test UNILATERALI o A UNA CODA servono a stabilire se il valore del campione è maggiore o uguale, oppure minore o uguale al valore teorico. - H0:μ ≥ valore teorico - H1:μ < valore teorico Oppure - H0:μ ≤ valore teorico - H1:μ > valore teorico
- Acquisire il datasetdemo.sav - Verificare se il reddito medio pro-capite è pari a 44 - Costruire una tabella con l’età media corrispondente a ciascun livello di istruzione - Verificare se il costo del mezzo di trasporto è significativamente diverso da 30 - Verificare se il costo del mezzo di trasporto di chi è in pensione e di chi non lo è sia significativamente diverso da 30 - Verificare se la percentuale di coloro che possiedono internet è significativamente diversa dal 25% VERIFICA DELLE IPOTESI – DUE CAMPIONI La verifica di ipotesi si può utilizzare anche per capire se due popolazioni (due gruppi sperimentali, due parti del campione, la stessa popolazione prima e dopo un trattamento, etc…) hanno lo stesso valore rispetto a una caratteristica (quantitativa!). Innanzitutto occorre capire se i due campioni sono: DIPENDENTI (o appaiati): ad ogni elemento del primo gruppo corrisponde necessariamente un certo elemento dell’altro gruppo (es. marito e moglie, la stessa unità prima e dopo un trattamento, padri e figli, etc…) ES. Nell’ultimo anno il vice presidente dell’area di risorse umane di una società ha promosso l’introduzione di una serie di programmi volti a incentiare i lavoratori e quindi ad aumentare i livelli di performance. Alla fine dell’anno il vice p. vuole verificare la validità dei programmi implementati basandosi su un indicatore di performance valutato sugli addetti prima e dopo la nuova formazione. Come procedere? Vogliamo sapere se c’è stata una differenza nella spesa prima e dopo la promozione e quindi possiamo scrivere: - H0:μ1=μ - H1:μ1≠μ Oppure, se chiamiamo d la differenza d=(μ1-μ2): - H0:d= - H1:d≠ Per come sono strutturati i dati, è possibile costruire questa differenza per ciascuna coppia (prima/dopo, marito/moglie, padre/figlio ecc.) ottenendo così una nuova variabile riferita non più al singolo ma alla coppia:
A questo punto il test riguarda una sola variabile e un’unica media e si conduce nel solito modo: avremo un valore della statistica test e il suo p-value (o livello di significatività). Stavolta accettare H0 significa dire che la differenza tra i due gruppi è pari a zero, cioè i due gruppi sono uguali (oppure che non c’è stato effetto del trattamento, se si tratta di osservazioni prima e dopo), mentre rifiutare H0 vuol dire affermare che c’è qualche differenza. A questo punto la statistica test riguarda un’unica variabile e un’unica media e si conduce nel solito modo: avremo un valore della statistica test e il suo p-value (o livello di significatività: sign.). stavolta accettare H0 equivale a dire che la differenza tra i due gruppi è pari a zero, cioè che i due gruppi sono uguali (oppure che non c’è stato effetto del trattamento, se si tratta di osservazioni prima e dopo – come nel caso precedentemente preso in esame), mentre rifiutare H0 vuol dire affermare che c’è qualche differenza. VERIFICA IPOTESI -B- (Analyze ⇒ Compare means ⇒ Independent-SamplesT Test/ Analizza ⇒ Confronta medie ⇒ Test T: campioni indipendenti)
- Esegue un test per verificare l’ipotesi che le medie di due gruppi indipendenti siano uguali. (Analyze ⇒ Compare means ⇒ Paired-SamplesT Test/ Analizza ⇒ Confronta medie ⇒ Test T: campioni appaiati) - Esegue un test per verificare l’ipotesi che le medie di due o più gruppi non indipendenti siano uguali (Analyze ⇒ Compare means ⇒ One-Way ANOVA/ Analizza ⇒ Confronta medie ⇒ ANOVA univariata) - Esegue il test F per verificare l’ipotesi che le medie di più di due gruppi siano significativamente diverse tra loro TEST T PER CAMPIONI APPAIATI Nella apposita finestra occorre scegliere: - Una coppia di variabili appaiate su cui si vuol condurre il test (“PairedVariables/Variabili appaiate”) - Il livello dell’intervallo di confidenza attorno alla differenza tra le variabili appaiate (col pulsante “Options…/Opzioni…”) L’output consiste di tre tabelle: - La prima riporta numerosità, media, s.q.m. e SE delle variabili appaiate - La seconda riporta numerosità, correlazione e significatività della correlazione tra le variabili appaiate - La terza riporta il risultato del test: media, s.q.m., SE e intervallo di confidenza per la differenza tra le variabili appaiate, valore della statistica test (t), numero di gradi di libertà
L’uguaglianza delle varianze dei gruppi è una condizione necessaria per condurre un test per il confronto fra le medie. Prima di condurre un test per due campioni indipendenti, occorre quindi verificare che le varianze dei due gruppi siano uguali e questo si può fare eseguendo il test di Levene
- H0:σ1= σ - H1:σ1≠ σ Se il p-value è alto accetto l’ipotesi nulla ovvero H0 quindi posso usare il test t; se il p-value è basso devo rifiutare H0 ed utilizzare un test più robusto. TEST DI LEVENE E TEST T Naturalmente,se l’argomento che stiamo analizzando indica che è più adeguato un test a una coda (ipotesi unilaterale), non dobbiamo fare altro che leggere il p-value per un test unilaterale, o in alternativa leggere il p-value confrontandolo con il doppio del valore-soglia che ci interessa (es. per un test di livello 95% la nostra soglia sarà 0,10 anziché 0.05), o ancora dimezzare il p-value a due code ottenuto (quindi se il p-value è 0,08 dimezzato sarà 0,04). TEST T PER CAMPIONI INDIPENDENTI Nella apposita finestra occorre scegliere: - La/e variabile/i quantitativa/e di cui verificare l’uguaglianza nei gruppi (“Test Variable(s)/ Variabili oggetto del test”) - La variabile attraverso cui si formano i due gruppi (“Grouping Variable/Variabile di raggruppamento”) e il modo con cui i due gruppi saranno formati (il valore che ciascun gruppo assume nella variabile di raggruppamento, o una soglia tra i gruppi) - Il livello dell’intervallo di confidenza attorno alla differenza tra medie (col pulsante “Options…/Opzioni…”) L’output consiste di due tabelle: - La prima riporta numerosità, media, s.q.m. e SE dei gruppi
- La seconda riporta il test di Levenesull’uguaglianza delle varianze (un p-valuepiccolo indica varianze diverse) e il risultato del test per il confronto dei gruppi sia nel caso che le varianze siano uguali, sia se sono diverse (un p-valuepiccolo indica che i gruppi hanno media diversa) ESERCIZIO: VERIFICA D’IPOTESI Acquisire il datasetdemo.sav Verificare se ci sono differenze statisticamente significative tra pensionati e non pensionati riguardo alla percentuale di abbonati a riviste, alla proporzione di coloro che usano internet e che possiedono un fax Verificare se il costo del mezzo di trasporto principale varia significativamente fra maschi e femmine, fra laureati e diplomati e fra persone di meno di 40 anni o di 40 anni e più ANALISI DELLA VARIANZA A UNA VIA Es. per decidere riguardo all’aumento del bollo auto sui SUV e i fuoristrada, si rivelano i consumi (misurati in chilometri percorsi con un litro di carburante) di un campione di 76 modelli di auto, di cui 31 berline, 31 SUV e 14 fuoristrada. Esiste una sufficiente evidenza del fatto che SUV e fuoristrada abbiano consumi maggiori? NUOVO PROBLEMA: CONFRONTI MULTIPLI - Sappiamo eseguire un test per confrontare i due gruppi, in questo asso sarebbe possibile fare i tre confronti ma non otterremo un indicatore globale. - Inoltre all’aumentare dei numero di gruppi, anche se le unità non differiscono realmente tra loro, diventa più facile ottenere almeno un valore estremo. - L’analisi della varianza, detta anche ANOVA è il metodo statistico che serve a confrontare le medie fra i diversi gruppi. ANALISI DELLA VARIANZA Confronta la variabilità dovuta a fonti specifiche con la variabilità interna a gruppi di osservazioni simili fra loro. In particolare, con l’ANOVA verifichiamo se differenti popolazioni hanno la stessa media tenendo conto al tempo stesso di quanto le medie campionarie sono distanti fra loro, e di quanta variabilità c’è all’interno del campione.
Se le medie sono uguali, vuol dire che nella scomposizione precedente la variabilità è tutta dovuta alla variabilità entro i gruppi, cioè la variabilità tra le medie dei gruppi è nulla e quindi possiamo scrivere: LA DISTRIBUZIONE F Detta anche distribuzione di Fisher-Snedecor. È una distribuzione asimmetrica con coda a destra che assume solo valori positivi, molto simile alla distribuzione. Si tratta in realtà di una famiglia di distribuzioni che assumono forme un po’ diverse al variare di due parametri: i gradi di libertà al numeratore (che vengono sempre indicati per primi) e i gradi di libertà al denominatore. ESEMPIO DEI SUV: ANOVA E TEST DI LEVENE L’analisi della varianza si applica quando
- La varianza è la stessa in ogni gruppo - La variabile di interesse ha una distribuzione normale in ciascuno dei gruppi Prima di condurre l’analisi della varianza occorre fare un TEST DI LEVENE per l’uguaglianza delle varianze.
- Se il test non è significativo, le varianze sono uguali e si può procedere al calcolo dell’ANOVA. - Se il test di Levene è significativo, le varianze sono diverse ed è necessario utilizzare un test più robusto per il confronto delle medie (Welch o Brown-Forsythe) - È possibile condurre un’analisi della varianza quando il fenomeno non si distribuisce normalmente purché i campioni siano abbastanza numerosi. CONFRONTI FRA MEDIE Se i gruppi da confrontare sono più di due è necessario descrivere quali sono e come si differenziano: tutte le medie sono diverse, oppure alcune medie specifiche differiscono fra di loro, o certe combinazioni di medie differiscono da una singola media o da un’altra combinazione? A tal fine si possono distinguere due approcci: 1- CONFRONTI PIANIFICATI O A PRIORI: sono importati prima ancora di verificare i risultati dell’ANOVA (non seguiremo questo approccio) 2- CONFRONTI POST-HOC O A POSTERIORI: si fanno dopo l’ANOVA e permettono di confrontare, a due a due, con diverse statistiche, le medie ottenute per ciascun gruppo. È possibile che test diversi diano risultati leggermente diversi ma non a livelli sostanziali, per tanto si può scegliere un test a cazzo. Esistono test post-hoc per gruppi con varianze uguali e gruppi con varianze diverse, a seconda che il test di Levene abbia indicato omogeneità o non delle varianze dei gruppi, scegliere la tipologia appropriata! Sono confronti specifici tra particolari coppie di gruppi che vengono impostate definendo una serie di coefficienti detti CONTRASTI. La somma dei contrasti deve dare 0 ANOVA UNIVARIATA – SCELTE Nella apposita finestra occorre scegliere: - La/e variabile/i quantitativa/e di cui verificare l’uguaglianza nei gruppi (“DependentList/Variabili dipendenti”) - La variabile con cui si formano i gruppi (“Factor/Fattore”)
Acquisire il dataset Belgio.sav Verificare se il numero di anni di istruzione completati, il livello di felicità e il numero di componenti della famiglia variano al variare della condizione lavorativa Verificare se il numero di anni d’istruzione e l’età (l’indagine è stata condotta nel 2005) variano al variare del luogo dove si vive Acquisire il dataset spesa.sav Verificare se esiste una relazione fra età e metodo di pagamento preferito Acquisire il dataset demo.sav Costruire 4 categorie: maschi sposati,maschinon sposati, femmine sposate e femmine non sposate; verificare se i 4 gruppi hanno lo stesso reddito e auto dello stesso valore