



Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Relazioni bivariate parte 2 attraverso l'uso del programma SPSS
Tipologia: Dispense
1 / 7
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!




Le tavole di contingenza sono tabelle di frequenza a più dimensioni, ovvero riportano il numero di osservazioni per tutte le combinazioni di risposte a due o più variabili (Analyze ⇒ DescriptiveStatistics ⇒ Crosstabs/ Analizza ⇒ Statistiche descrittive ⇒ Tavole di contingenza) Nella finestra che compare è possibile scegliere le variabili (almeno due) da tabulare, scegliere se devono essere rappresentate in riga o in colonna, richiedere alcuni indici bivariati, si può stabilire l’aspetto dell’output e richiedere o evitare la stampa di tabelle e grafici. Ricordate che in genere le percentuali sono più leggibili delle frequenze assolute, e che la scelta fra percentuali di riga o di colonna dipende esclusivamente dal tipo di informazione che si vuole veicolare con la tabella. TAVOLE DI CONTINGENZA – ASPETTO Con il pulsante “ Cells…/Celle…” si possono richiedere varie opzioni di presentazione della tabella:
riga rispetto al secondo (in alternativa posso leggerlo come probabilità che accada il secondo evento fra parentesi per il secondo gruppo rispetto al primo) Per gli Odds-Ratio vengono forniti anche gli estremi superiore e inferiore dell’intervallo di confidenza al 95%; se l’intervallo nella prima riga contiene il valore 1 il rischio non è significativamente diverso da 1 (quindi non è significativo). Come regola generale, chiedete solo indici di cui conoscete bene il significato!! ESERCIZIO: TAVOLE DI CONTINGENZA Acquisire il dataset Belgio.sav Verificare se c’è una relazione fra:
spesa aumenta allora io voglio un test ad una coda. Se io voglio dimostrare una cosa più specifica allora è a una coda. Quando la variabile qualitativa è dicotomica, il test t è un ottimo modo per verificare se una variabile quantitativa è in relazione con la dicotomica (se il reddito medio di maschi e femmine differisce, vuol dire che esiste relazione fra reddito e genere). Non esistono indicatori di associazione per qualsiasi coppia di variabili; per esempio, non c’è un indice specifico per la relazione tra una variabile ordinale e una nominale, o tra una ordinale e una quantitativa Talvolta può essere utile dicotomizzare una o entrambe le variabili considerate, costruendo nuove variabili che abbiano un significato utile alla nostra ricerca; non abusate però di questo approccio quando non è necessario, perché comporta una perdita di informazioni! CERCARE DI EVITARE QUESTA PROCEDURA. In altri casi, è possibile applicare metodi adatti a variabili misurate su scale di misura inferiore (mai superiore, però!); per esempio, per analizzare la relazione tra una ordinale e una sconnessa si può trattare la variabile ordinale come se fosse sconnessa e utilizzare il χ2. ESEMPIO: quando diciamo che c’è rel fra due variabili noi abbiamo una forte idea di causazione. In alcuni casi la rel che stiamo guardando dentro la nostra testa non ha semplicemente la forma del vediamo se ci azzeccano , ma “secondo me quando una variabile si sposta, sposta l’altra”. Quindi abbiamo in ment4e un legame causale che è alla base del MODELLO DI REGRESSIONE. LA RETTA DI REGRESSIONE È un modello piccolo in cui c’è una variabile effetto dipendente e una variabile causa indipendente. Il modellino lo scriviamo in questo modo: Y è la variabile indipendente e un passetto che dice che all’aumentare di una sigaretta in più fumata la mortalità aumenta di 0, qualche cosa. Il parametro a è l’intercetta e b è la pendenza della retta. Scrivere questa retta ci permette di vedere quale Y corrisponda a qualsiasi valore di x anche quelle che non abbiamo osservato. Nb. La b è la r di Pearson!!!! Il denominatore di b è diverso perché in questo caso il b non è vincolato a variare tra -1 e + 1. La formula della a non è particolarmente rilevante. A non sempre ha un senso perché mi sdice qual è il valore di Y che corrisponde a X=0 ovvero il reddito di una persona che ha studiato 0 anni che non ha senso. Come dire il reddito di un neonato. Nel caso del fumo mi direbbe il caso della mortalità che si riesce a raggiungere
C’è una tabella che si chiama ANOVA che mi da un p-value del test per r quadro = a 0 o diverso da 0. Perché se non è significativamente diverso da zero allora è inutile andare a fare delle grandi pontificate. La prima cosa da guardare è se questo modello spiega qualcosa o meno. Se non è significativo accetto l’ipotesi che questo modello è del tutto inutile. Tutto ha senso se il p-value è piccolo vuol dire che r quadro qualcosa spiega. Se è significativamente diverso vado a vedere quanto spiega guardando r quadro. Il 3,8% della variabilità che si osserva nei diversi redditi dipende dal fatto che i rispondenti hanno età diverse. Non ci darà delle soglie per dire quando r quadro ha senso perché ci sono delle soglie che non arrivano a spiegare quello che succede fra due variabili. Lo scopo è quello di ottenere delle spiegazioni interessanti e non riuscire a fare i calcoli. Quindi la tabella ANOVA è la prima che guardiamo anche se ce la mette per seconda. Se spiega qualcosa guardo quanto spiega e poi guardo nei coefficienti quanto mi dice. Prima di questo dovevo guardare il p- value per capire se il coefficiente che vado a guardare è significativo. Se la prof non lo ha fatto subito è perché se io ho una variabile con un unico predittori e si riesce a spiegare qualcosa allora il modello sarà produttivo. Nb. Il modello spiega qualcosa ma non tutte le variabili utilizzate spiegano qualcosa. Se c’è una sola variabile e il modello spiega qualcosa allora vuol dire che anche la variabile lo spiega proprio perché è l’unica. ESERCIZIO: REGRESSIONE SEMPLICE Acquisire il dataset sottopeso; stimare e interpretare modelli di regressione semplice per spiegare il peso alla nascita tramite: