Statistica bivariata
1.TIPO DI RELAZIONI TRA DUE VARIABILI. Affermare che tra due variabili c’è relazioni, vuol dire che è possibile
prevedere una variabile a partire da un’altra. Le relazioni tra due variabili x e y possono essere di due tipi
- Possiamo trovare una relazione simmetrica, detta anche di interdipendenza/associazione, dove troviamo la
variabile x e y che si influenzano reciprocamente.
- Possiamo trovare una relazione asimmetrica, detta anche di dipendenza, dove troviamo la variabile x che influenza
y o y che influenza x, è una relazione unidirezionale.m5
Inoltre, anche se molto raro, possiamo trovarci di fronte a una relazione perfetta, quando a ogni variabile di x ne
corrisponde una di y e viceversa; oppure ci possiamo trovarci di fronte a una relazione imperfetta quando al variare
delle modalità di x, la distribuzione di y non cambia; oppure ancora possiamo trovarci di fronte a una relazione
spuria, cioè ingannevole in quanto sembra che la relazioni tra le variabili ci sia ma in realtà questa è data per effetto
di altre variabili che intervengono nelle variabili che abbiamo preso in considerazione.
2. TABELLA DOPPIA quaderno
3. MISURE DI ESISTENZA DEL LEGAME/MISURE DI TIPO ASSOCIATIVO. Le misure di esistenza del legame vengono
utilizzate in funzione del tipo di variabile che prendiamo in considerazione, infatti distinguiamo le misure per variabili
qualitative, le misure per variabili quantitative, e le misure per graduatorie.
3.1. MISURE DI TIPO ASSOCIATIVO PER VARIABILI QUALITATIVE.
- Lo strumento che utilizziamo per visualizzare simultaneamente le due variabili è la tabella a doppia entrata *
- L’indice che utilizziamo per calcolare l’esistenza del legame è l’indice chi quadro. Esso si esprime facendo la
sommatoria delle frequenze osservate – le frequenze teoriche, il tutto alla seconda, fratto le frequenze teoriche.
Le frequenze teoriche corrispondono all’ipotesi di indipendenza, ovvero esprimono i valori, ipotizzando che non vi
sia legame tra le variabili.
- Per misurare l’intensità del legame utilizziamo l’indice v di Cramer. Esso si esprime facendo la radice quadrata di x2
fratto il suo valore massimo ovvero n*m. Il suo valore varia tra 0 e 1, se questo si avvicina a 1 allora siamo di fronte a
un legame intenso, se questo si avvicina a 0 allora siamo adi fronte a un legame basso
3.2. MISURE DI TIPO ASSOCIATIVO PER VARIABILI QUANTITATIVE.
- Lo strumento che utilizziamo per visualizzare simultaneamente le due variabili è il diagramma di dispersione.
Questo diagramma, è l’equivalente della tabella doppia. È uno strumento che utilizza l’asse verticale per la variabile y
e l’asse orizzontale per la variabile x; i valori di x e y sono rappresentati del diagramma da un punto, e ogni punto
corrisponde a ogni unità che compone il fenomeno statistico.
- L’indice che utilizziamo per calcolare l’intensità del legame è la covarianza. Questa esprime la variabilità congiunta
di due caratteri, questa è inoltre una misura della dispersione ed esprime gli scostamenti dalla media. Si esprime
calcolando la sommatoria degli scarti dalla media di x, per egli scarti della media di y, fratto la numerosità. I suoi
valori sono compresi tra + infinito e – infinito, se il suo valore fa 0 allora il legame è assente
- Per misurare l’intensità del legame che abbiamo trovato, utilizziamo l’indice di correlazione lineare r, questa ci
fornisce delle indicazioni circa la direzione del legame tra due variabili. Si esprime facendo la covarianza di x e y,
fratto il massimo della covarianza, che si trova calcolando il sigma di x per il sigma di y. Il suo valore varia da 1 a -1, se
questo si avvicina a 1 allora il legame è diretto e positivo, se si avvicina a 0 allora il legame è molto basso, se si
avvicina a -1 allora il legame sarà inverso e negativo.
Il segno – o + sta per “inverso” e “diretto”; il suo valore sta per l’intensità. Questa misura non risente dell’unità di
misura