Prepara i tuoi esami
Ottieni punti
Guide e consigli
Vendi su Docsity
Docsity AI

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Guide e consigli

Vendi su Docsity

Docsity AI

Accedi Registrati

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Cerca documenti

Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity

Cerca la tua università

Trova i documenti specifici per gli esami della tua università

Video Corsi

Preparati con lezioni e prove svolte basate sui programmi universitari!

Quiz

Rispondi a reali domande d’esame e scopri la tua preparazione

Docsity AINEW

Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali

Maturità 2026

Studia con prove svolte, tesine e consigli utili

Esplora domande

Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te

Argomenti di studio

Esplora i documenti più scaricati per gli argomenti di studio più popolari

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Condividi documenti

20 Punti

Per ogni documento caricato

Rispondi alle domande

5 Punti

per ogni risposta data (max 1 al giorno)

Tutti i modi per ottenere punti gratis

Ottieni punti subito

Scegli un piano Premium con tutti i punti di cui hai bisogno

Opportunità di studio

Scegli il tuo prossimo programma di studio

Entra in contatto con le migliori università del mondo e scegli il tuo percorso di studi

Classifica delle migliori università

Scopri le migliori università italiane secondo gli studenti

Community

Chiedi alla community

Chiedi aiuto alla community e sciogli i tuoi dubbi legati allo studio

Guide Gratuite

I nostri eBook salva studente

Scarica gratuitamente le nostre guide sulle tecniche di studio, metodi per gestire l'ansia, dritte per la tesi realizzati da tutor Docsity

Riassunti statistica bivariata, Schemi e mappe concettuali di Statistica

Università degli Studi di Milano (UNIMI)Statistica

riassunti di statistica bivariata

Tipologia: Schemi e mappe concettuali

2015/2016

Caricato il 28/02/2016

carziii 🇮🇹

2 documenti

1 / 4

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

Classiﬁcazione di due caratteri: tabelle di contingenza

Le tabelle di contingenza sono un particolare tipo di tabelle a doppia entrata (cioè tabelle con etichette di

riga e di colonna), utilizzate in statistica per rappresentare e analizzare le relazioni tra due o più variabili.

In esse si riportano le frequenze congiunte delle

variabili.

Indipendenza:

data una tabella di contingenza, due variabili X e Y si dicono

indipendenti se le modalità di X non inﬂuenzano il veriﬁcarsi

delle modalità di Y, e viceversa l’indipendenza statistica è una

relazione bidirezionale: se X è indipendente da Y anche Y è

indipendente da X. Se tutte le distribuzioni condizionate sono

uguali (per

riga e contestualmente per colonna) allora il

presentarsi di una particolare modalità di un

fenomeno, non è inﬂuenzato dal presentarsi

dell’altro. Se tutte le distribuzioni condizionate di X sono uguali, allora sono necessariamente uguali alla

distribuzione marginale di X. Se tutte le distribuzioni condizionate di Y sono uguali, allora sono

necessariamente uguali alla distribuzione marginale di Y. In formule si ha indipendenza quando:

In assenza di indipendenza statistica si parla di connessione: le due variabili X e Y tendono ad inﬂuenzarsi

reciprocamente e tra di loro esiste una qualche relazione generica l’indipendenza statistica e la

connessione sono concetti che si escludono reciprocamente.

Indice chi-quadrato di Pearson e sua versione normalizzata (o l'indice V di Cramer):

Per valutare se e in che misura due variabili X e Y sono tra loro indipendenti si utilizza il c.d. indice di

associazione chi-quadrato (χ 2), che si basa sul confronto tra le frequenze assolute osservate ﬁj (contenute

nella tabella di contingenza) e le frequenze teoriche ﬁj’ che si osserverebbero in caso di perfetta

indipendenza tra X e Y. In formula si ha che:

Dove cij sono le diﬀerenze (contingenze) tra le frequenze assolute osservate ﬁj e le frequenze teoriche ﬁj

Da un tabella normale a doppia entrata come quella di seguito:

ricaviamo le frequenze teoriche secondo la formula:

Scopri Schemi e mappe concettuali di Statistica Università degli Studi di Milano (UNIMI)

Documenti correlati

STATISTICA DESCRITTIVA BIVARIATA

inizio statistica bivariata

Statistica bivariata formule

Bivariata statistica

statistica bivariata

(1)

Statistica Descritiiva Bivariata

Statistica bivariata

Dispensa statistica descrittiva bivariata

Slide statistica. Analisi Bivariata.

APPUNTI: Statistica Bivariata

(1)

Statistica descrittiva e bivariata

(1)

statistica bivariata

Anteprima parziale del testo

Scarica Riassunti statistica bivariata e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!

Classificazione di due caratteri: tabelle di contingenza Le tabelle di contingenza sono un particolare tipo di tabelle a doppia entrata (cioè tabelle con etichette di riga e di colonna), utilizzate in statistica per rappresentare e analizzare le relazioni tra due o più variabili.

In esse si riportano le frequenze congiunte delle variabili.

Indipendenza: data una tabella di contingenza, due variabili X e Y si dicono indipendenti se le modalità di X non influenzano il verificarsi delle modalità di Y, e viceversa l’indipendenza statistica è una relazione bidirezionale: se X è indipendente da Y anche Y è indipendente da X. Se tutte le distribuzioni condizionate sono uguali (per riga e contestualmente per colonna) allora il presentarsi di una particolare modalità di un fenomeno, non è influenzato dal presentarsi dell’altro. Se tutte le distribuzioni condizionate di X sono uguali, allora sono necessariamente uguali alla distribuzione marginale di X. Se tutte le distribuzioni condizionate di Y sono uguali, allora sono necessariamente uguali alla distribuzione marginale di Y. In formule si ha indipendenza quando:

In assenza di indipendenza statistica si parla di connessione: le due variabili X e Y tendono ad influenzarsi reciprocamente e tra di loro esiste una qualche relazione generica l’indipendenza statistica e la connessione sono concetti che si escludono reciprocamente.

Indice chi-quadrato di Pearson e sua versione normalizzata (o l'indice V di Cramer): Per valutare se e in che misura due variabili X e Y sono tra loro indipendenti si utilizza il c.d. indice di associazione chi-quadrato (χ 2), che si basa sul confronto tra le frequenze assolute osservate fij (contenute nella tabella di contingenza) e le frequenze teoriche fij’ che si osserverebbero in caso di perfetta indipendenza tra X e Y. In formula si ha che:

Dove cij sono le differenze (contingenze) tra le frequenze assolute osservate fij e le frequenze teoriche fij

Da un tabella normale a doppia entrata come quella di seguito:

ricaviamo le frequenze teoriche secondo la formula:

es: 200x70/500, 200x120/500, 200x80/500……

Tali valori vengono riportati in una tabella, detta di indipendenza. Le differenze tra la tabella iniziale semplice a doppia entrata e la tabella delle frequenze teoriche vengono riportate in una ulteriore tabella, detta delle contingenze*.

ATTENZIONE: I totali di riga e di colonna di una tabella delle contingenze sono sempre pari a 0

ATTENZIONE : tabella di contingenza ≠ tabella delle contingenze*!

Da cui

Il χ 2 assume:

valore = 0 se i caratteri sono perfettamente indipendenti (dunque le contingenze sono nulle)
valore > 0 se i caratteri sono associati (il valore sarà tanto maggiore quanto più grande sarà la differenza tra le frequenze osservate e quelle teoriche).

Per stabilire se la connessione tra X e Y è alta o bassa è possibile ricorrere alla normalizzazione dell’indice. A tal fine è necessario rapportare il valore di χ 2 ottenuto al suo massimo, che è:

Dove r è il numero delle righe della tabella e c il numero delle colonne

Es. ( Poiché nella colonna sono presenti 3 righe e 5 colonne, il massimo in questo caso)

Nella sua forma normalizzata, il χ 2 sarà allora espresso come:

Il valore dell’indice normalizzato è allora:

Tale valore indica che esiste un basso livello di associazione tra Zona di residenza e Marca dell’auto acquistata.

NB. Si ricorda che essendo normalizzata, quest’ultima misura assume valori compresi tra 0 e 1.

Studio congiunto di due caratteri quantitativi: Nel caso in cui si intenda approfondire l’analisi del legame esistente tra due variabili quantitative (continue o discrete) X e Y così da cogliere oltre all’intensità anche l’eventuale natura lineare (proporzionale) del legame, è possibile ricorrere al concetto di correlazione lineare. Si dice che X e Y sono correlate positivamente (o negativamente) quando i due fenomeni in esame tendono ad associare le rispettive modalità in modo che a modalità crescenti dell’uno corrispondano preferibilmente modalità proporzionalmente crescenti (o decrescenti) dell’altro.

Covarianza e coefficiente di correlazione: Un primo modo di misurare il legame tra due variabili quantitative X e Y è quello di analizzare la covarianza delle stesse variabili, ovvero la media aritmetica dei prodotti degli scostamenti delle variabili X e Y dalle rispettive medie. In formula si indica come:

Dove n = numero di modalità es nella tabella sottostante n =

In caso di distribuzione in classi diventa:

Per calcolarla costruiamo una tabella come di seguito:

Vogliamo utilizzare i dati per ricavare un’equazione che permetta di prevedere il consumo pro-capite di gelato in un certo mese, nota la temperatura del mese. E’ noto, infatti, che il consumo di gelato non è costante nell’anno, ma è influenzato dalle condizioni climatiche, in particolare dalla temperatura.

si stima una relazione lineare positiva tra temperatura e consumo di gelato;
si valuta che in presenza di una temperatura media mensile di 0 gradi F il consumo pro-capite di gelato sia pari a 0.202 pinte;
si stima che per ogni aumento della temperatura pari ad un grado, il consumo di gelato aumenti di 0.0031 pinte.

Errore medio F 0 E 0

Bontà di adattamento: coefficiente di determinazione: