

Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Documento sintetico dedicato alla sezione sulla connessione e regressione
Tipologia: Sintesi del corso
1 / 3
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!


Relazioni tra caratteri statistici È un aspetto fondamentale della statistica: ci permette di valutare se due caratteri sono legati, così da fare previsioni o supposizioni. Esempio: esiste un legame tra età e atteggiamento verso la scienza e la tecnologia? Parliamo in generale di associazione statistica tra due caratteri.
CONNESSIONE: presenza di un legame tra caratteri fondato sull'analisi delle frequenze di una tabella doppia. In questo caso si studia se i due caratteri sono indipendenti o non lo sono. È l'unica analisi possibile se entrambi i caratteri sono qualitativi. DIPENDENZA IN MEDIA: presenza di un legame tra le medie delle distribuzioni condizionate e la media marginale. Il carattere dipendente deve essere quantitativo. CONCORDANZA: presenza di un legame tra caratteri entrambi quantitativi o qualitativi ordinati.
In caso di concordanza per caratteri quantitativi possiamo valutare la: CORRELAZIONE: valutazione dell'intensità reciproca del legame tra due caratteri quantitativi. DIPENDENZA: esistenza di un legame di causalità tra due caratteri quantitativi. Esistono vari tipi di legami, lineari e non lineari. Il concetto di associazione Se di due caratteri conosciamo a priori relazioni di causa ed effetto diciamo che esiste dipendenza logica (es. altezza ed età) Se invece sappiamo a priori che non esiste relazione di causa ed effetto parliamo di indipendenza logica (es. quantità di pioggia e andamento Borsa) Si parla invece di indipendenza statistica quando la conoscenza delle modalità di un carattere non migliora la previsione delle modalità dell'altro (es. colore occhi e sesso.) Inoltre, si può distinguere tra analisi della dipendenza (legame unidirezionale) e analisi della interdipendenza (legame bidirezionale).
L'associazione spuria è un legame statistico empirico che si verifica tra due caratteri logicamente indipendenti. Talvolta, l'associazione spuria può essere dovuta alla presenza di uno o più caratteri non considerati nell'analisi che influenzano entrambi i caratteri osservati. ⸺-> Esempio: si osserva associazione tra tumore ai polmoni e consumo di alcool. Questa associazione non sembra logica. Infatti occorre tenere in considerazione il carattere "fumo di sigaretta" che è associato ad entrambe. L'associazione dunque è spuria.
La relazioni esistenti tra le modalità di due diversi caratteri si possono studiare in una tabella doppia di frequenze. Il carattere X si dirà indipendente in distribuzione da Y se, qualsiasi sia la modalità con cui si manifesta Y, la distribuzione relativa condizionata di X non cambia. Esempio: Se le quote di fumatori e non fumatori fossero uguali per i residenti al Nord, Centro e Sud Italia, si potrebbe affermare che l'abitudine al fumo (X) sia indipendente dalla residenza geografica (Y). Inoltre, se X è indipendente in distribuzione da Y allora anche Y è indipendente in distribuzione da X. È un legame simmetrico Due caratteri X e Y si dicono indipendenti in distribuzione se le distribuzioni relative condizionate di un carattere rispetto alle modalità dell'altro sono uguali. Connessione Se due caratteri non sono indipendenti esiste quindi connessione. Questa situazione si colloca tra due situazioni estreme: Indipendenza distributiva → connessione nulla: le unità statistiche si ripartiscono casualmente fra le celle della tabella doppia; le distribuzioni condizionate relative sono tutte uguali e uguali a quella marginale, sia per la X sia per la Y. Perfetta dipendenza → connessione massima: ad ogni modalità di un carattere si associa una e una sola modalità dell'altro carattere.
Partiamo dalla condizione di indipendenza tra due caratteri e cerchiamo di misurare l'allontanamento dalla condizione di indipendenza in distribuzione. Indipendenza tra caratteri L'indipendenza in distribuzione si misura valutando le frequenze relative delle distribuzioni condizionate. Due caratteri X e Y si dicono statisticamente indipendenti se le distribuzioni relative condizionate di un carattere rispetto alle modalità dell'altro sono tra loro uguali. In questo caso, conoscere la modalità x; per una unità statistica non rende più o meno probabile la sua appartenenza a una specifica modalità Se Y è indipendente da X, allora anche X è indipendente da Y: il concetto di indipendenza (in distribuzione) tra caratteri è simmetrico. Misure di connessione tra due caratteri La connessione tra due caratteri di una distribuzione doppia va intesa come l'allontanamento dall'indipendenza distributiva. Per misurare la connessione è necessario valutare la differenza tra le frequenze effettive delle classi (le frequenze osservate nij) e le corrispondenti frequenze teoriche (le frequenze attese nell'ipotesi di indipendenza nij") Si deve, innanzitutto, costruire la tabella di indipendenza conservando le distribuzioni marginali e ricavando le frequenze congiunte teoriche tramite la relazione già indicata.
Sulla base delle differenza tra frequenze osservate e frequenze teoriche si costruisce l'indicatore di connessione Chi-quadrato (x}), che indica quanto ci si allontana dalla situazione di indipendenza: Questo indicatore può essere calcolato sia per caratteri QUANTITATIVI, sia per caratteri QUALITATIVI. È sempre positivo e tende ad aumentare al crescere del legame tra i due caratteri. Le differenze tra le frequenze osservate e quelle teoriche si dicono contingenze: Cij= nij-nij* Il valore minimo che può assumere è pari a zero (caso di indipendenza). Valori comunque vicini allo zero mostrano una indipendenza approssimata tra due caratteri.