Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica bivariata formule, Formulari di Statistica

Formule di statistica bivariata utili ai fini della preparazione dell'esame.

Tipologia: Formulari

2023/2024

Caricato il 11/05/2025

Sto-Essendo-Ricco
Sto-Essendo-Ricco 🇮🇹

4.8

(5)

6 documenti

1 / 7

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
TABELLA DI CONTINGENZA
Frequenze assolute
Frequenze relative condizionate
Poiché X si manifesta attraverso h modalità distinte, si possono individuare h
sottoinsiemi di unità statistiche, uno per ciascuna modalità di X. Per confrontare il
comportamento di Y nelle varie sottopopolazioni che presentano modalità xi per X, è
necessario fare riferimento alle distribuzioni condizionate relative di Y, ottenute
dividendo ciascuna frequenza congiunta per il totale della sottopopolazione di
riferimento. Le h distribuzioni condizionate relative di Y sono riportate nella
seguente tabella:
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Statistica bivariata formule e più Formulari in PDF di Statistica solo su Docsity!

TABELLA DI CONTINGENZA

Frequenze assolute

Frequenze relative condizionate

Poiché X si manifesta attraverso h modalità distinte, si possono individuare h

sottoinsiemi di unità statistiche, uno per ciascuna modalità di X. Per confrontare il

comportamento di Y nelle varie sottopopolazioni che presentano modalità xi per X, è

necessario fare riferimento alle distribuzioni condizionate relative di Y, ottenute

dividendo ciascuna frequenza congiunta per il totale della sottopopolazione di

riferimento. Le h distribuzioni condizionate relative di Y sono riportate nella

seguente tabella:

Poiché X si manifesta attraverso h modalità distinte, si possono individuare h

sottoinsiemi di unità statistiche, uno per ciascuna modalità di X. Per confrontare il

comportamento di Y nelle varie sottopopolazioni che presentano modalità xi per X, è

necessario fare riferimento alle distribuzioni condizionate relative di Y, ottenute

dividendo ciascuna frequenza congiunta per il totale della sottopopolazione di

riferimento. Le h distribuzioni condizionate relative di Y sono riportate nella

seguente tabella:

Indipendenza e tabella teorica di indipendenza

X è indipendente da Y se e solo se tutte le distribuzioni condizionate relative di X

coincidono con la distribuzione relativa marginale e viceversa. Si può riassumere con:

a) a ogni modalità della Y corrisponde una sola modalità` a della X (su ogni

colonna una sola nij > 0)

b) a ogni modalità` a della X corrisponde una sola modalità della Y (su ogni

riga una sola nij > 0)

Indice di Pearson

Quando non c’è indipendenza si dice che c’è connessione tra i due caratteri studiati

ed è interessante stabilire il grado di connessione esistente. Si può dire che il legame

tra X e Y è tanto più forte quanto più la tabella osservata dei dati è lontana dalla

tabella teorica di indipendenza e vicina ad una tabella di massima connessioneUna

misura di distanza complessiva tra la tabella osservata e la tabella teorica è l’indice X

2

di Pearson:

Indice di Pearson normalizzato (chi quadrato normalizzato)

^

X

2

1. Lo zero corrisponde all’indipendenza e l’uno alla massima connessione; più

^

X

2

è vicino a 0, più X e Y sono vicini alla condizione di indipendenza, viceversa, più

^

X

2

è

vicino a 1, più è forte il legame tra i due caratteri.

Dipendenza

Se X e Y sono connesse, si può essere interessati a indagarne il legame: è necessario

specificare a questo punto chi è la variabile esplicativa (che spiega) e chi la variabile

dipendente (spiegata). Chiamiamo Y la variabile dipendente e X quella esplicativa. Se

Y è quantitativa una tipologia di legame che possiamo indagare è la dipendenza in

media di Y da X. In altri termini, si vuole stabilire se la media di Y cambia

significativamente a seconda delle modalità (numeriche o meno) assunte da X

La media delle medie condizionate, pesata con la dimensione del gruppo, coincide

con la media marginale di Y:

Varianza between

È la varianza delle h medie condizionate Y, pesata con la dimensione del gruppo

Varianza within

È la media delle h varianze condizionate, misura la variabilità delle unità statistiche

dovuta all’appartenenza a gruppi distinti

dispersione è un grafico in cui si rappresentano i valori che le variabili X e Y

assumono sulle n unità statistiche. Una variabile (ad esempio la X) viene

rappresentata sull’asse delle ascisse e l’altra (Y) viene rappresentata nell’asse delle

ordinate, facendo corrispondere un punto ad ogni coppia di valori osservati (xi;yi),

per i = 1,...,n

Interpretazione geometrica della covarianza

Nell’interpretazione geometrica della covarianza, riveste un ruolo centrale il

cosiddetto “baricentro” dei dati, ovvero il punto di coordinate ( x , y )

Se la maggior parte dei punti si trovano nel I e III quadrante, allora prevalgono i

termini ( x

i

− x ) ( y

i

− y )di segno positivo.

Viceversa, se i punti si addensano maggiormente nel II e IV quadrante, prevarranno i

termini di segno negativo.

Quindi valori positivi di

s xy identificano andamenti concordi di X ed Y e viceversa

Coefficiente di correlazione lineare (Bravais-Pearson)

Misura l’intensità della relazione lineare tra X e Y ed è dato dal rapporto tra

covarianza e prodotto delle due deviazioni standard ovvero dalla seguente formula:

con

− 1 ≤ ρ xy

  • ρ =1 se e solo se i dati si allineano perfettamente lungo una retta inclinata

positivamente (relazione lineare perfetta positiva). Più ρ assume valori

prossimi a 1, più significa che ci avviciniamo a una relazione lineare crescente

tra le variabili

  • ρ = −1 se e solo se i dati si allineano perfettamente lungo una retta inclinata

negativamente (relazione lineare perfetta negativa). Più ρ assume valori

prossimi a −1, più significa che ci avviciniamo a una relazione lineare

decrescente tra le variabili

  • ρ =0 indica assenza di legame lineare tra X e Y e ciò può avvenire in due diverse

situazioni: quando non sussiste alcun legame tra le due variabili e quando, pur

essendoci un legame funzionale tra X e Y, questo non è di tipo lineare (ossia di

tipo monotono crescente o decrescente). Quando ρ = 0, le variabili X e Y si

dicono incorrelate.