



Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Formule di statistica bivariata utili ai fini della preparazione dell'esame.
Tipologia: Formulari
1 / 7
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!




Frequenze assolute
Frequenze relative condizionate
Poiché X si manifesta attraverso h modalità distinte, si possono individuare h
sottoinsiemi di unità statistiche, uno per ciascuna modalità di X. Per confrontare il
comportamento di Y nelle varie sottopopolazioni che presentano modalità xi per X, è
necessario fare riferimento alle distribuzioni condizionate relative di Y, ottenute
dividendo ciascuna frequenza congiunta per il totale della sottopopolazione di
riferimento. Le h distribuzioni condizionate relative di Y sono riportate nella
seguente tabella:
Poiché X si manifesta attraverso h modalità distinte, si possono individuare h
sottoinsiemi di unità statistiche, uno per ciascuna modalità di X. Per confrontare il
comportamento di Y nelle varie sottopopolazioni che presentano modalità xi per X, è
necessario fare riferimento alle distribuzioni condizionate relative di Y, ottenute
dividendo ciascuna frequenza congiunta per il totale della sottopopolazione di
riferimento. Le h distribuzioni condizionate relative di Y sono riportate nella
seguente tabella:
Indipendenza e tabella teorica di indipendenza
X è indipendente da Y se e solo se tutte le distribuzioni condizionate relative di X
coincidono con la distribuzione relativa marginale e viceversa. Si può riassumere con:
a) a ogni modalità della Y corrisponde una sola modalità` a della X (su ogni
colonna una sola nij > 0)
b) a ogni modalità` a della X corrisponde una sola modalità della Y (su ogni
riga una sola nij > 0)
Indice di Pearson
Quando non c’è indipendenza si dice che c’è connessione tra i due caratteri studiati
ed è interessante stabilire il grado di connessione esistente. Si può dire che il legame
tra X e Y è tanto più forte quanto più la tabella osservata dei dati è lontana dalla
tabella teorica di indipendenza e vicina ad una tabella di massima connessioneUna
misura di distanza complessiva tra la tabella osservata e la tabella teorica è l’indice X
2
di Pearson:
Indice di Pearson normalizzato (chi quadrato normalizzato)
2
≤ 1. Lo zero corrisponde all’indipendenza e l’uno alla massima connessione; più
2
è vicino a 0, più X e Y sono vicini alla condizione di indipendenza, viceversa, più
2
è
vicino a 1, più è forte il legame tra i due caratteri.
Dipendenza
Se X e Y sono connesse, si può essere interessati a indagarne il legame: è necessario
specificare a questo punto chi è la variabile esplicativa (che spiega) e chi la variabile
dipendente (spiegata). Chiamiamo Y la variabile dipendente e X quella esplicativa. Se
Y è quantitativa una tipologia di legame che possiamo indagare è la dipendenza in
media di Y da X. In altri termini, si vuole stabilire se la media di Y cambia
significativamente a seconda delle modalità (numeriche o meno) assunte da X
La media delle medie condizionate, pesata con la dimensione del gruppo, coincide
con la media marginale di Y:
Varianza between
È la varianza delle h medie condizionate Y, pesata con la dimensione del gruppo
Varianza within
È la media delle h varianze condizionate, misura la variabilità delle unità statistiche
dovuta all’appartenenza a gruppi distinti
dispersione è un grafico in cui si rappresentano i valori che le variabili X e Y
assumono sulle n unità statistiche. Una variabile (ad esempio la X) viene
rappresentata sull’asse delle ascisse e l’altra (Y) viene rappresentata nell’asse delle
ordinate, facendo corrispondere un punto ad ogni coppia di valori osservati (xi;yi),
per i = 1,...,n
Interpretazione geometrica della covarianza
Nell’interpretazione geometrica della covarianza, riveste un ruolo centrale il
cosiddetto “baricentro” dei dati, ovvero il punto di coordinate ( x , y )
Se la maggior parte dei punti si trovano nel I e III quadrante, allora prevalgono i
i
i
Viceversa, se i punti si addensano maggiormente nel II e IV quadrante, prevarranno i
termini di segno negativo.
Quindi valori positivi di
s xy identificano andamenti concordi di X ed Y e viceversa
Coefficiente di correlazione lineare (Bravais-Pearson)
Misura l’intensità della relazione lineare tra X e Y ed è dato dal rapporto tra
covarianza e prodotto delle due deviazioni standard ovvero dalla seguente formula:
con
− 1 ≤ ρ xy
positivamente (relazione lineare perfetta positiva). Più ρ assume valori
prossimi a 1, più significa che ci avviciniamo a una relazione lineare crescente
tra le variabili
negativamente (relazione lineare perfetta negativa). Più ρ assume valori
prossimi a −1, più significa che ci avviciniamo a una relazione lineare
decrescente tra le variabili
situazioni: quando non sussiste alcun legame tra le due variabili e quando, pur
essendoci un legame funzionale tra X e Y, questo non è di tipo lineare (ossia di
tipo monotono crescente o decrescente). Quando ρ = 0, le variabili X e Y si
dicono incorrelate.