Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Formule statistica commentate, Appunti di Statistica

Formulario statistica commentato accuratamente

Tipologia: Appunti

2018/2019

Caricato il 20/08/2019

Ggg99
Ggg99 🇮🇹

6 documenti

1 / 3

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA
VARIANZA: metodo diretto Metodo
indiretto
si dice varianza di una variabile statistica X la media aritmetica del quadrato degli scarti di ogni singola
modalità dalla media aritmetica della v.s. È una misura sempre positiva o nulla. La varianza è il valore
assunto dalla funzione nel suo punto minimo.
Varianza di una trasformata lineare: data la v.s. X con media µX e varianza σ2X, la varianza della
trasformata Y = a + b X, con a, b R `e data da V [Y ] = b^2 V [X]
DEVIANZA
DEVIANZA STANDARD O SCARTO QUADRATICO MEDIO
La varianza ha lo svantaggio di essere una grandezza quadratica e quindi non direttamente confrontabile con
la media o con altri valori. E’ sufficiente dunque estrarre la radice quadrata della varianza per avere una
misura confrontabile. Ha sempre un calore positivo. Un esempio riportato di seguito.
Più il valore della deviazione standard è grande, più significa che i voti sono dispersi dalla media; più il
valore è piccolo più significa che i dati sono concentrati intorno alla media.
COVARIANZA:
si dice covarianza di una v.s. bivariata (X, Y ) la media aritmetica del prodotto fra gli scarti delle x˜α dalla
media di X e gli scarti delle y˜α dalla media di Y
all’aumentare di una aumenta anche l’altra
una aumenta e l’altra diminuisce
quando una delle due variabili aumenta,
l’altra rumane costante
CORRELAZIONE
pf3

Anteprima parziale del testo

Scarica Formule statistica commentate e più Appunti in PDF di Statistica solo su Docsity!

STATISTICA

VARIANZA: metodo diretto Metodo indiretto

si dice varianza di una variabile statistica X la media aritmetica del quadrato degli scarti di ogni singola modalità dalla media aritmetica della v.s. È una misura sempre positiva o nulla. La varianza è il valore assunto dalla funzione nel suo punto minimo.

Varianza di una trasformata lineare: data la v.s. X con media μX e varianza σ2X, la varianza della trasformata Y = a + b X, con a, b ∈ R `e data da V [Y ] = b^2 V [X]

DEVIANZA

DEVIANZA STANDARD O SCARTO QUADRATICO MEDIO

La varianza ha lo svantaggio di essere una grandezza quadratica e quindi non direttamente confrontabile con la media o con altri valori. E’ sufficiente dunque estrarre la radice quadrata della varianza per avere una misura confrontabile. Ha sempre un calore positivo. Un esempio riportato di seguito.

Più il valore della deviazione standard è grande, più significa che i voti sono dispersi dalla media; più il valore è piccolo più significa che i dati sono concentrati intorno alla media.

COVARIANZA:

si dice covarianza di una v.s. bivariata (X, Y ) la media aritmetica del prodotto fra gli scarti delle x˜α dalla media di X e gli scarti delle y˜α dalla media di Y

all’aumentare di una aumenta anche l’altra

una aumenta e l’altra diminuisce

quando una delle due variabili aumenta, l’altra rumane costante

CORRELAZIONE

Questo indice varia da -1 a 1; si tratta di una misura standardizzata che quindi può essere confrontata con altri valori significativi.

R=1 i punti sono perfettamente allineati su una retta con pendenza positiva (se cresce X cresce anche Y); R=-1 i punti sono allineati perfettamente su una retta con pendenza negativa (se cresce X, Y decresce); R= non c’è relazione di dipendenza lineare tra Xe Y

La correlazione è molto sensibile agli outliers, perché possono portare a livelli di correlazione molto bassi.. SERVE PER STUDIARE IL GRADO DI INTENSITA’ DEL LEGAME LINEARE TRA COPPIE DI VARIABILI.

CODEVIANZA D X,Y =

CHI QUADRATO

Si ottiene calcolando per ogni cella della tabella di contingenza la differenza al quadrato tra la frequenza assoluta osservata e quella attesa diviso la frequenza attesa e sommando quindi il risultato di ogni cella. Se valore osservato e valore atteso sono uguali =0 (indipendenza tra il carattere X e Y: due caratteri si dicono indipendenti se le distribuzioni relative condizionate di un carattere rispetto alle modalità dell’altro sono uguali: non abbiamo quindi una variabile che dipende dall’altra ma assumono tutti e due lo stesso ruolo). Basta che un solo valore sia diverso perché esista una qual forma di relazione. Più la somma cresce, più sarà forte il legame di dipendenza (serve appunto per studiare il grado di dipendenza tra le modalità distinte.

Viceversa se >0 significa che vi è dipendenza, cioè frequenze teoriche sono diverse da quelle osservate; più aumenta più il grado di dipendenza aumenta.

Questo indice è poco significativo per caratteri quantitativi con molte modalità distinte e inoltre dipende dalla numerosità della popolazione e dal numero di modalità assunte dai due caratteri.

V DI CRAMER

si definisce indice V di Cramer la radice quadrata del rapporto tra il χ2 ed il suo valore massimo. Serve per studiare il grado di dipendenza statistica. Varia da 0 a 1; se V=0 vi è indipendenza tra le due variabili (la conoscenza di uno dei due non migliora la previsione delle modalità dell’altro), mentre se V=1 vi è una massima dipendenza, connessione (se conosco l’andamento di una variabile posso desumere come l’altra variabile possa variare.

RETTA DEI MINIMI QUADRATI: si tratta di un modello di regressione lineare semplice, che stabilisce una relazione di dipendenza lineare tra le due variabili X e Y. Si assume che al variare del valore X sia atteso un