

Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Formulario statistica commentato accuratamente
Tipologia: Appunti
1 / 3
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!


VARIANZA: metodo diretto Metodo indiretto
si dice varianza di una variabile statistica X la media aritmetica del quadrato degli scarti di ogni singola modalità dalla media aritmetica della v.s. È una misura sempre positiva o nulla. La varianza è il valore assunto dalla funzione nel suo punto minimo.
Varianza di una trasformata lineare: data la v.s. X con media μX e varianza σ2X, la varianza della trasformata Y = a + b X, con a, b ∈ R `e data da V [Y ] = b^2 V [X]
La varianza ha lo svantaggio di essere una grandezza quadratica e quindi non direttamente confrontabile con la media o con altri valori. E’ sufficiente dunque estrarre la radice quadrata della varianza per avere una misura confrontabile. Ha sempre un calore positivo. Un esempio riportato di seguito.
Più il valore della deviazione standard è grande, più significa che i voti sono dispersi dalla media; più il valore è piccolo più significa che i dati sono concentrati intorno alla media.
si dice covarianza di una v.s. bivariata (X, Y ) la media aritmetica del prodotto fra gli scarti delle x˜α dalla media di X e gli scarti delle y˜α dalla media di Y
all’aumentare di una aumenta anche l’altra
una aumenta e l’altra diminuisce
quando una delle due variabili aumenta, l’altra rumane costante
CORRELAZIONE
Questo indice varia da -1 a 1; si tratta di una misura standardizzata che quindi può essere confrontata con altri valori significativi.
R=1 i punti sono perfettamente allineati su una retta con pendenza positiva (se cresce X cresce anche Y); R=-1 i punti sono allineati perfettamente su una retta con pendenza negativa (se cresce X, Y decresce); R= non c’è relazione di dipendenza lineare tra Xe Y
La correlazione è molto sensibile agli outliers, perché possono portare a livelli di correlazione molto bassi.. SERVE PER STUDIARE IL GRADO DI INTENSITA’ DEL LEGAME LINEARE TRA COPPIE DI VARIABILI.
Si ottiene calcolando per ogni cella della tabella di contingenza la differenza al quadrato tra la frequenza assoluta osservata e quella attesa diviso la frequenza attesa e sommando quindi il risultato di ogni cella. Se valore osservato e valore atteso sono uguali =0 (indipendenza tra il carattere X e Y: due caratteri si dicono indipendenti se le distribuzioni relative condizionate di un carattere rispetto alle modalità dell’altro sono uguali: non abbiamo quindi una variabile che dipende dall’altra ma assumono tutti e due lo stesso ruolo). Basta che un solo valore sia diverso perché esista una qual forma di relazione. Più la somma cresce, più sarà forte il legame di dipendenza (serve appunto per studiare il grado di dipendenza tra le modalità distinte.
Viceversa se >0 significa che vi è dipendenza, cioè frequenze teoriche sono diverse da quelle osservate; più aumenta più il grado di dipendenza aumenta.
Questo indice è poco significativo per caratteri quantitativi con molte modalità distinte e inoltre dipende dalla numerosità della popolazione e dal numero di modalità assunte dai due caratteri.
V DI CRAMER
si definisce indice V di Cramer la radice quadrata del rapporto tra il χ2 ed il suo valore massimo. Serve per studiare il grado di dipendenza statistica. Varia da 0 a 1; se V=0 vi è indipendenza tra le due variabili (la conoscenza di uno dei due non migliora la previsione delle modalità dell’altro), mentre se V=1 vi è una massima dipendenza, connessione (se conosco l’andamento di una variabile posso desumere come l’altra variabile possa variare.
RETTA DEI MINIMI QUADRATI: si tratta di un modello di regressione lineare semplice, che stabilisce una relazione di dipendenza lineare tra le due variabili X e Y. Si assume che al variare del valore X sia atteso un