




Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
relazioni bivariate parte 1 attraverso l'uso del programma SPSS.
Tipologia: Dispense
1 / 8
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!





L’ultimo punto che indica cosa possiamo fare con i dati è: creare delle relazioni tra coppie di variabili. L’ANALISI BIVARIATA Le abbiamo già viste nelle analisi precedenti. Ci permette di fare delle ipotesi per capire quale può essere la direzione nella relazione tra variabili ed è un’operazione che sta solo nella nostra testa perché se io cerco di mettere in relazione un modello causale in cui dico che il reddito determina il sesso, se io trovo una relazione che funziona, funziona in tutti e due i sensi dal punto di vista matematico, nella realtà no. Spesso siamo quindi interessati a capire la relazione che lega due variabili, la sua direzione e la sua forza. Una relazione può essere
che porta ad un tasso di natalità più alto. La rel non è tra cicogna e bambin. Ma ci sono casi in cui è più difficile individuare quello che ci sta dietro, la causa nascosta. La prima cosa da tenere in considerazione quando si deve misurare l’associazione fra variabili è la loro scala di misura; la distinzione principale è fra variabili:
Come si interpreta il valore del χ? Se il test del χ₂ deve essere confrontato con una nuova distribuzione: la distribuzione χ₂. Questa non è ₂ deve essere confrontato con una nuova distribuzione: la distribuzione χ₂. Questa non è assume valori grandi, il p-value (area sotto la curva a destra del valore osservato) risulta piccolo. Il p-value è la probabilità di osservare valori più estremi di quello osservato (in questo caso valori più grandi) nell’ipotesi che H0 sia vera. (ipotesi di variabili indipendenti). Se il test assume valori grandi, e quindi se il p-value è piccolo, è poco probabile osservare valori così grandi nell’ipotesi ossrvata e quindi rifiuto. LA FORZA DI UNA RELAZIONE Una volta stabilito che tra le variabili esiste una relazione (e che quindi non sono indipendenti) occorre capire quanto questa relazione è forte. Abbiamo già imparato a valutare se la relazione fra due variabili è statisticamente significativa oppure è legata al caso. Tuttavia la forza di una relazionenon è la stessa cosa della significatività: la forza mi dice quanta relazionec’è, la significatività mi dice se mi posso fidare. ESEMPIO Eppure c’è la stessa relazione! Il chi quadrato però mi dice solo la significatività perché assume semplicemente valori da 0 a tantissimo perché assume solo valori. Quindi abbiamo bisogno di un altro indice che ci faccia capire se la relazione dipende dal caso o meno e se sia forte o meno. Per faro uso il coefficiente V di cramer.
Se il test χ ₂ deve essere confrontato con una nuova distribuzione: la distribuzione χ₂. Questa non è ci dice che le variabili non sono indipendenti, la V di Cramer misura la forza ovvero che forma ha questa relazione. Se analizziamo ad una ad una le differenze tra le celle osservate e quelle attese nell’ipotesi di indipendenza, possiamo capire quali modalità registrano gli scarti maggiori. Perciò calcoliamo i residui standardizzati: I residui più grandi andranno ad indicare le celle che si discostano maggiormente dall’ipotesi di indipendenza, valori superiori a 2 in valore assoluto rappresentano valori assolutamente significativi. I residui positivi indicano che in quella cella si accumulano più osservazioni di quelle attese nell’ipotesi di indipendenza; residui negativi indicano meno osservazioni delle attese. ASSOCIAZIONE FRA VARIABILI QUALITATIVE ORDINALI Una tipica associazione di questo genere è monotona: all’aumentare di una variabile l’altra aumenta, oppure diminuisce. In questo senso avremo un unico valore che esprime la forza della relazione (quanto più si avvicina a 1) e la sua forma (l’indice è positivo se la relazione è diretta, viceversa è negativo). Si possono usare gli indici per variabili sconnesse, ma perdiamo informazione: si tinee conto solo del fatto che le osservazioni siano uguali o diverse rispetto alle attese, e non quanto lontane siano. Nel caso in cui gli indici per variabili ordinali indichino che non vi sono associazioni di tipo monotono, è possibile però cercare relazioni di altra forma attraverso χ ₂ deve essere confrontato con una nuova distribuzione: la distribuzione χ₂. Questa non è e i residui standardizzati. Quando le variabili sono qualitative ordinali, molti indici di associazione si basano sul concetto di concordanze e discordanze. Se si considerano tutte le n(n-1)possibili coppie di unità, avremo che: 1- CONCORDANZE: Sono “concordanze” quelle in cui una delle unità ha valori superiori all’altra in entrambe le variabili 2- DISCORDANZE: Sono “discordanze” quelle in cui una delle unità ha un valore superiore all’altra su una variabile, e un valore inferiore sull’altra 3- APPAIATE: Sono “appaiate”, o “ties”, o “coppie simili” quelle in cui le due unità della coppia hanno lo stesso valore su almeno una variabile
η2 dice quanta parte della variabilità della quantitativa è spiegata dai gruppi (variabile qualitativa). Se molta variabilità è piegata dalla variabile qualitativa la relazione sarà forte. (Analyze ⇒ DescriptiveStatistics ⇒ Crosstabs/ Analizza ⇒ Statistiche descrittive ⇒ Tavole di contingenza) Nella finestra che compare è possibile scegliere le variabili (almeno due) da tabulare, scegliere se devono essere rappresentate in riga o in colonna, richiedere alcuni indici bivariati, si può stabilire l’aspetto dell’output e richiedere o evitare la stampa di tabelle e grafici. Ricordate che in genere le percentuali sono più leggibili delle frequenze assolute, e che la scelta fra percentuali di riga o di colonna dipende esclusivamente dal tipo di informazione che si vuole veicolare con la tabella.