Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica: principi e metodi Capitolo 9, Slide di Statistica

Statistica: principi e metodi Capitolo 9 - Analisi delle distribuzioni doppie: dipendenza

Tipologia: Slide

2017/2018

Caricato il 19/09/2018

Dennis96
Dennis96 🇮🇹

4.6

(57)

70 documenti

1 / 52

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Capitolo 9
Analisi delle distribuzioni
doppie: dipendenza
Statistica: principi e metodi
Cap. 9-1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34

Anteprima parziale del testo

Scarica Statistica: principi e metodi Capitolo 9 e più Slide in PDF di Statistica solo su Docsity!

Capitolo 9

Analisi delle distribuzioni

doppie: dipendenza

Statistica: principi e metodi

Età

Grado d’istruzione Non ha Totale terminato le superiori

Diploma di scuola superiore

Università da 1 a 3 anni

Università oltre i 4 anni da 25 a 34 4.459 11.562 10.693 11.071 37. da 35 a 54 9.174 26.455 22.647 23.160 81. oltre 55 14.226 20.060 11.125 10.597 56. Totale 27.859 58.077 44.465 44.828 175.

Tabella di contingenza

Cap. 9-

Tabella di contingenza: sinonimo di distribuzione doppia di

frequenze , ossia di distribuzione di frequenze secondo due

caratteri.

Il numero che appare in una data casella è la frequenza delle

unità che presentano le modalità che corrispondono a tale

casella (in alto e nel margine sinistro).

Età

Grado d’istruzione Non ha Totale terminato le superiori

Diploma di scuola superiore

Università da 1 a 3 anni

Università oltre i 4 anni da 25 a 34 4.459 11.562 10.693 11.071 37. da 35 a 54 9.174 26.455 22.647 23.160 81. oltre 55 14.226 20.060 11.125 10.597 56. Totale 27.859 58.077 44.465 44.828 175.

Tabella di contingenza: distribuzione

marginale (2)

Le frequenze che appaiono nell’ultima colonna, pari ai totali di riga, si riferiscono unicamente al carattere “Età”; esse configurano, insieme alle modalità, la distribuzione marginale del carattere in questione.

Carattere X

Carattere Y Totale y 1 y 2 … yj … yt x 1 n 11 n 12

n 1 j

n 1 t n 10 x 2 n 21 n 22

n 2 j

n 2 t n 20 … … … … … … … …

xi ni 1 ni 2

nij

nit ni 0 … … … … … … … …

xs ns 1 ns 2

nsj

nst ns 0 Totale n 01 n 02

n 0 j

n 0 t N

Tabella di contingenza in simboli

 questi simboli indicano modalità di caratteri qualitativi, oppure valori o classi di

caratteri quantitativi (s è il numero di modalità di X, t il numero di modalità di Y)

nij è la frequenza della coppia di modalità (xi, yj) - FREQUENZE CONGIUNTE

ni 0 e n 0 j sono i totali di riga e di colonna - FREQUENZE MARGINALI

Carattere X

Carattere Y Totale y 1 y 2 … yj … yt x 1 p 11 p 12

p 1 j

p 1 t p 10 … … … … … … … …

xi pi 1 pi 2

pij

pit pi 0 … … … … … … … …

xs ps 1 ps 2

psj

pst ps 0 Totale p 01 p 02

p 0 j

p 0 t 100

Tabella di contingenza: percentuali sul

totale in simboli

100 N

n pij  ij

100 N

n pi0  i0 

100 N

n p0j  0j 

Frequenza percentuale congiunta della modalità (xi,yj)

Frequenza percentuale marginale della modalità xi

Frequenza percentuale marginale della modalità yj

p 100

p 100

p 100

t

j 1

0j

s

i 1

i

s

i 1

t

j 1

ij



 

Età

Grado d’istruzione Non ha Totale terminato le superiori

Diploma di scuola superiore

Università da 1 a 3 anni

Università oltre i 4 anni da 25 a 34 4.459 11.562 10.693 11.071 37. da 35 a 54 9.174 26.455 22.647 23.160 81. oltre 55 14.226 20.060 11.125 10.597 56. Totale 27.859 58.077 44.465 44.828 175.

Tabella di contingenza: distribuzioni

condizionate (1)

Cap. 9-

Se, invece, associamo alle modalità del carattere “Grado

d’istruzione” le frequenze di una riga interna della tabella,

otteniamo una distribuzione condizionata.

Prendere una distribuzione condizionata equivale a

considerare la distribuzione del carattere “Grado d’istruzione”

limitatamente ai casi in cui il carattere età è compreso ad

esempio nell’intervallo 35-54.

Carattere X

Carattere Y Totale y 1 y 2 … yj … yt x 1 n 11 n 12

n 1 j

n 1 t n 10 x 2 n 21 n 22

n 2 j

n 2 t n 20 … … … … … … … …

xi ni 1 ni 2

nij

nit ni 0 … … … … … … … …

xs ns 1 ns 2

nsj

nst ns 0 Totale n 01 n 02

n 0 j

n 0 t N

Distribuzione marginale e distribuzioni

condizionate di Y in simboli

Cap. 9-

Le due righe segnalate in rosso configurano la distribuzione marginale del carattere Y. Le due righe segnalate in giallo configurano la generica distribuzione condizionata di Y rispetto ad una data modalità di X

Le distribuzioni condizionate di Y rispetto ad X sono in numero pari al numero di modalità del carattere X (s)

Carattere X

Carattere Y Totale y 1 y 2 … yj … yt x 1 n 11 n 12

n 1 j

n 1 t n 10 x 2 n 21 n 22

n 2 j

n 2 t n 20 … … … … … … … …

xi ni 1 ni 2

nij

nit ni 0 … … … … … … … …

xs ns 1 ns 2

nsj

nst ns 0 Totale n 01 n 02

n 0 j

n 0 t N

Distribuzione marginale e distribuzioni

condizionate di X in simboli

Cap. 9-

Le due righe segnalate in rosso configurano la distribuzione marginale del carattere X. Le due righe segnalate in giallo configurano la generica distribuzione condizionata di X rispetto ad una data modalità di Y

Le distribuzioni condizionate di X rispetto ad Y sono in numero pari al numero di modalità del carattere Y (t)

Tabella di contingenza: confronto delle distribuzioni condizionate- esempio

Esempio : si vuole stabilire se il carattere “Grado d’istruzione” sia

legato all’età; in altre parole, si vuole accertare se l’appartenenza

a una data classe di età influisca, determini, in qualche misura, i

livelli di istruzione degli individui di quella classe.

Non è possibile confrontare direttamente le frequenze assolute

registrate da una data modalità del grado di istruzione nelle

diverse classi di età perché per ogni classe di età si registra un

numero diverso di unità statistiche (frequenza marginale di riga).

Per effettuare il confronto si possono calcolare le percentuali (o

le proporzioni ) sul totale di riga normalizzando in tal modo i

sotto-collettivi distinti per classe di età: si considera un sotto-

collettivo di numerosità 100 ( o 1) per ogni classe di età

Età

Grado d’istruzione Non ha Totale terminato le superiori

Diploma di scuola superiore

Università da 1 a 3 anni

Università oltre i 3 anni da 25 a 34 (^) 11.8% 30.6% 28.3% 29.3% 100% da 35 a 54 (^) 11.3% 32.5% 27.8% 28.4% 100% oltre 55 (^) 25.4% 35.8% 19.9% 18.9% 100% Distribuzione marginale % del grado di istruzione 15.9% 33.1% 25.4% 25.6% 100%

Tabella di contingenza: percentuali sul

totale di riga

(distribuzione percentuale di Y condizionata ad X)

La percentuale che appare in una data casella indica la

percentuale delle unità del sotto-collettivo di età compresa

nella classe indicata in riga che presentano il grado di

istruzione indicato in colonna.

Ad esempio il 32.5% delle unità statistiche che hanno un’età compresa fra i 35 e 54 ha il diploma di scuola superiore

Tabella di contingenza: confronto delle distribuzioni condizionate- esempio (2)

Esempio : se si volesse confrontare la composizione in termini di

età di ogni sotto-collettivo omogeneo rispetto al titolo di studio,

si dovrebbero calcolare le percentuali (o le proporzioni ) sul

totale di colonna normalizzando in tal modo i sotto-collettivi

distinti per grado di istruzione: si considera un sotto-collettivo

di numerosità 100 ( o 1) per ogni livello di istruzione

Età

Grado d’istruzione (^) Distribuzio ne % marginale dell’età

Non ha terminato le superiori

Diploma di scuola superiore

Università da 1 a 3 anni

Università oltre i 3 anni da 25 a 34 (^) 16.0% 19.9% 24.0% 24.7% 21.6% da 35 a 54 (^) 32.9% 45.6% 50.9% 51.7% 46.5% oltre 55 (^) 51.1% 34.5% 25.0% 23.6% 32.0% Totale (^) 100% 100% 100% 100% 100%

Tabella di contingenza: percentuali sul

totale di colonna

(distribuzione percentuale di X condizionata ad Y)

La percentuale che appare in una data casella indica la

percentuale delle unità del sotto-collettivo omogeneo rispetto

al grado di istruzione indicato in colonna che hanno età nella

classe indicata in riga

Ad esempio il 45.6% delle unità statistiche aventi il diploma di scuola superiore ha un’età compresa fra 35 e 54 anni

Confronto delle distribuzioni condizionate- esempio

Numero di Laureati Percentuali riga Percentuali colonna Gruppo di lauree Uomini Donne Totale Uomini Donne Totale Uomini Donne Totale agrario 2002 1664 3666 54.6% 45.4% (^) 100% 2.7% 1.5% 2.0% architettura 4544 5022 9566 47.5% 52.5% 100% 6.2% 4.5% 5.2% chimico-farmaceutico 1954 3299 5253 37.2% 62.8% 100% 2.7% 3.0% 2.8% economico-statistico 12286 13417 25703 47.8% 52.2% 100% 16.7% 12.1% 13.9% educazione fisica 2002 1341 3343 59.9% 40.1% (^) 100% 2.7% 1.2% 1.8% geo-biologico 3264 6627 9891 33.0% 67.0% (^) 100% 4.4% 6.0% 5.4% giuridico 3948 6413 10361 38.1% 61.9% 100% 5.4% 5.8% 5.6% ingegneria 16832 5315 22147 76.0 % 24.0% 100% 22.9% 4.8% 12.0% insegnamento 672 8789 9461 7.1% 92.9 % 100% 0.9% 7.9% 5.1% letterario 4757 11702 16459 28.9% 71.1% (^) 100% 6.5% 10.5% 8.9% linguistico 1570 9335 10905 14.4% 85.6 % (^) 100% 2.1% 8.4% 5.9% medico 6802 13503 20305 33.5% 66.5% 100% 9.3% 12.2% 11.0% politico-sociale 7500 13990 21490 34.9% 65.1% 100% 10.2% 12.6% 11.6% psicologico 1677 8677 10354 16.2% 83.8% 100% 2.3% 7.8% 5.6% scientifico 3680 1896 5576 66.0% 34.0% (^) 100% 5.0% 1.7% 3.0% Totale 73490 110990 184480 39.8% 60.2% (^) 100% 100% 100% 100%

Elaborazione su dati Almalaurea -XV Indagine (2013) - Condizione occupazionale dei laureati

Data la distribuzione congiunta di due caratteri di

natura qualsiasi, i quesiti a cui la statistica deve

rispondere sono

esiste dipendenza o indipendenza fra i due caratteri?

se esiste dipendenza, come sono associate le modalità dei due caratteri?

Analisi delle relazioni di una distribuzione doppia con caratteri di natura qualsiasi