


Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
riassunti di statistica bivariata
Tipologia: Schemi e mappe concettuali
1 / 4
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!



Classificazione di due caratteri: tabelle di contingenza Le tabelle di contingenza sono un particolare tipo di tabelle a doppia entrata (cioè tabelle con etichette di riga e di colonna), utilizzate in statistica per rappresentare e analizzare le relazioni tra due o più variabili.
In esse si riportano le frequenze congiunte delle variabili.
Indipendenza: data una tabella di contingenza, due variabili X e Y si dicono indipendenti se le modalità di X non influenzano il verificarsi delle modalità di Y, e viceversa l’indipendenza statistica è una relazione bidirezionale: se X è indipendente da Y anche Y è indipendente da X. Se tutte le distribuzioni condizionate sono uguali (per riga e contestualmente per colonna) allora il presentarsi di una particolare modalità di un fenomeno, non è influenzato dal presentarsi dell’altro. Se tutte le distribuzioni condizionate di X sono uguali, allora sono necessariamente uguali alla distribuzione marginale di X. Se tutte le distribuzioni condizionate di Y sono uguali, allora sono necessariamente uguali alla distribuzione marginale di Y. In formule si ha indipendenza quando:
In assenza di indipendenza statistica si parla di connessione: le due variabili X e Y tendono ad influenzarsi reciprocamente e tra di loro esiste una qualche relazione generica l’indipendenza statistica e la connessione sono concetti che si escludono reciprocamente.
Indice chi-quadrato di Pearson e sua versione normalizzata (o l'indice V di Cramer): Per valutare se e in che misura due variabili X e Y sono tra loro indipendenti si utilizza il c.d. indice di associazione chi-quadrato (χ 2), che si basa sul confronto tra le frequenze assolute osservate fij (contenute nella tabella di contingenza) e le frequenze teoriche fij’ che si osserverebbero in caso di perfetta indipendenza tra X e Y. In formula si ha che:
Dove cij sono le differenze (contingenze) tra le frequenze assolute osservate fij e le frequenze teoriche fij
Da un tabella normale a doppia entrata come quella di seguito:
ricaviamo le frequenze teoriche secondo la formula:
es: 200x70/500, 200x120/500, 200x80/500……
Tali valori vengono riportati in una tabella, detta di indipendenza. Le differenze tra la tabella iniziale semplice a doppia entrata e la tabella delle frequenze teoriche vengono riportate in una ulteriore tabella, detta delle contingenze*.
ATTENZIONE: I totali di riga e di colonna di una tabella delle contingenze sono sempre pari a 0
ATTENZIONE : tabella di contingenza ≠ tabella delle contingenze*!
Da cui
Il χ 2 assume:
Per stabilire se la connessione tra X e Y è alta o bassa è possibile ricorrere alla normalizzazione dell’indice. A tal fine è necessario rapportare il valore di χ 2 ottenuto al suo massimo, che è:
Dove r è il numero delle righe della tabella e c il numero delle colonne
Nella sua forma normalizzata, il χ 2 sarà allora espresso come:
Il valore dell’indice normalizzato è allora:
Tale valore indica che esiste un basso livello di associazione tra Zona di residenza e Marca dell’auto acquistata.
NB. Si ricorda che essendo normalizzata, quest’ultima misura assume valori compresi tra 0 e 1.
Studio congiunto di due caratteri quantitativi: Nel caso in cui si intenda approfondire l’analisi del legame esistente tra due variabili quantitative (continue o discrete) X e Y così da cogliere oltre all’intensità anche l’eventuale natura lineare (proporzionale) del legame, è possibile ricorrere al concetto di correlazione lineare. Si dice che X e Y sono correlate positivamente (o negativamente) quando i due fenomeni in esame tendono ad associare le rispettive modalità in modo che a modalità crescenti dell’uno corrispondano preferibilmente modalità proporzionalmente crescenti (o decrescenti) dell’altro.
Covarianza e coefficiente di correlazione: Un primo modo di misurare il legame tra due variabili quantitative X e Y è quello di analizzare la covarianza delle stesse variabili, ovvero la media aritmetica dei prodotti degli scostamenti delle variabili X e Y dalle rispettive medie. In formula si indica come:
Dove n = numero di modalità es nella tabella sottostante n =
In caso di distribuzione in classi diventa:
Per calcolarla costruiamo una tabella come di seguito:
Vogliamo utilizzare i dati per ricavare un’equazione che permetta di prevedere il consumo pro-capite di gelato in un certo mese, nota la temperatura del mese. E’ noto, infatti, che il consumo di gelato non è costante nell’anno, ma è influenzato dalle condizioni climatiche, in particolare dalla temperatura.
Errore medio F 0 E 0
Bontà di adattamento: coefficiente di determinazione: