Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica Esercizi n3, Esercizi di Statistica

Esercizi di Statistica n.3 Economia Aziendale

Tipologia: Esercizi

2019/2020

Caricato il 13/11/2020

Peppemar96
Peppemar96 🇮🇹

5

(1)

5 documenti

1 / 7

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Distribuzioni Doppie e Relazioni tra Variabili Esercitazione n° 03
ESERCIZIO 1
Tra le famiglie del Comune di Vigata sono stati rilevati congiuntamente la PROFESSIONE DEL CA-
POFAMIGLIA (X) e l’AMMONTARE DELLA SPESA SETTIMANALE PER MEZZI DI TRASPORTO (Y). I dati
espressi in € sono riportati nella seguente tabella:
1) costruire la tabella dei profili riga (distribuzioni condizionate Y|X)
2) tra le famiglie che spendono più di 50 € determinare la percentuale di quelle che hanno il capo-
famiglia in attività
3) stabilire se tra i due caratteri esiste dipendenza e in caso positivo misurarne l’intensità
1) Per costruire la tabella dei profili riga è necessario dividere ogni frequenza congiunta per la cor-
rispondente frequenza marginale di riga:
In tal modo su ogni riga si ottiene la distribuzione condizionata Y|x
i
Y
0 -|20
20 -|50
50 -|100
100 -|150
Totale
X
Libero Professionista 20
15
8
26
69
Lav. Dipendente 15
5
14
13
47
Disoccupato 5
40
3
8
56
Pensionato 10
16
2
4
32
Totale 50
76
27
51
204
Y
0 -|20
20 -|50
50 -|100
100 -|150
Totale
X
Libero Professionista 20/69
15/69
8/69
26/69
1
Lav. Dipendente 15/47
5/47
14/47
13/47
1
Disoccupato 5/56
40/56
3/56
8/56
1
Pensionato 10/32
16/32
2/32
4/32
1
Totale 50/204
76/204
27/204
51/204
1
Y
0 -|20
20 -|50
50 -|100
100 -|150
Totale
X
Libero Professionista
29%
22%
12%
38%
100%
Lav. Dipendente 32%
11%
30%
28%
100%
Disoccupato 9%
71%
5%
14%
100%
Pensionato 31%
50%
6%
13%
100%
Totale 25%
37%
13%
25%
100%
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Statistica Esercizi n3 e più Esercizi in PDF di Statistica solo su Docsity!

Distribuzioni Doppie e Relazioni tra Variabili Esercitazione n° 03

ESERCIZIO 1

Tra le famiglie del Comune di Vigata sono stati rilevati congiuntamente la PROFESSIONE DEL CA- POFAMIGLIA (X) e l’AMMONTARE DELLA SPESA SETTIMANALE PER MEZZI DI TRASPORTO (Y). I dati espressi in € sono riportati nella seguente tabella:

  1. costruire la tabella dei profili riga (distribuzioni condizionate Y|X)

  2. tra le famiglie che spendono più di 50 € determinare la percentuale di quelle che hanno il capo- famiglia in attività

  3. stabilire se tra i due caratteri esiste dipendenza e in caso positivo misurarne l’intensità

  4. Per costruire la tabella dei profili riga è necessario dividere ogni frequenza congiunta per la cor- rispondente frequenza marginale di riga:

In tal modo su ogni riga si ottiene la distribuzione condizionata Y|xi

Y 0 -|20 20 -|50 50 -|100 100 -|150 Totale X Libero Professionista 20 15 8 26 69 Lav. Dipendente 15 5 14 13 47 Disoccupato 5 40 3 8 56 Pensionato 10 16 2 4 32 Totale 50 76 27 51 204

Y 0 -|20 20 -|50 50 -|100 100 -|150 Totale X Libero Professionista 20/69 15/69 8/69 26/69 1 Lav. Dipendente 15/47 5/47 14/47 13/47 1 Disoccupato 5/56 40/56 3/56 8/56 1 Pensionato 10/32 16/32 2/32 4/32 1 Totale 50/204 76/204 27/204 51/204 1

Y 0 -|20 20 -|50 50 -|100 100 -|150 Totale X Libero Professionista 29% 22% 12% 38% 100% Lav. Dipendente 32% 11% 30% 28% 100% Disoccupato 9% 71% 5% 14% 100% Pensionato 31% 50% 6% 13% 100% Totale 25% 37% 13% 25% 100%

Dalla tabella dei profili riga si evince come ad esempio il 38% delle famiglie con capofamiglia libero professionista sostenga ogni settimana una spesa per trasporti tra 100 e 150 €, mentre solo il 28% delle famiglie con capofamiglia lavoratore dipendente ha lo stesso livello di spesa.

  1. Le famiglie che hanno una spesa settimanale per trasporti maggiore di 50€ sono quelle con un ammontare di spesa tra 50 e 100 € (27 famiglie) e quelle con un ammontare di spesa tra 100 e 150 € (51 famiglie), per un totale di 78 famiglie. Consideriamo in attività i lavoratori dipendenti ed i li- beri professionisti, escludendo i disoccupati e coloro che non sono più in attività, cioè i pensionati. Tra le famiglie con capofamiglia libero professionista 34 spendono più di 50 € (8 + 26), mentre tra le famiglie con capofamiglia dipendente 27 spendono più di 50 € (14 + 13). La percentuale di fami- glie con capofamiglia in attività e ammontare di spesa per trasporti superiore ai 50 € sarà allora pari a (27 + 34)/78 = 0,78 => 78%.

(3) E’ possibile valutare per i due caratteri sia la dipendenza in distribuzione che la dipendenza in media. Valutiamo innanzi tutto la dipendenza in distribuzione. Si verifica la condizione di indipen- denza calcolando una frequenza teorica e quindi confrontando tale quantità con la corrispondente frequenza osservata: possiamo vedere che n 11 = 20 ≠ n 11 *= (n1. x n.1)/n = (50 x 69) / 204 = 16,91 e quindi cade l’ipotesi di indipendenza. Procediamo quindi con lo studio della connessione tra le due variabili calcolando, sotto l’ipotesi di indipendenza, le frequenze teoriche:

Possiamo a questo punto calcolare le contingenze per stabilire se c’è connessione e di che tipo

Dall’analisi delle contingenze si rileva come ci sia un forte addensamento di casi osservati per le famiglie di disoccupati con un ammontare di spesa tra 20 e 50 € rispetto all’ipotesi di indipenden- za. Analogamente si rileva nella stessa classe di spesa un numero di casi osservati decisamente in- feriore all’ipotesi di indipendenza per le famiglie con capofamiglia professionista o dipendente. Essendo le contingenze tutte diverse da 0 dobbiamo concludere che i due caratteri non sono sconnessi e quindi procedere alla valutazione del grado di dipendenza. Calcoliamo innanzi tutto l’indice Chi-quadro:

Y 0 -|20 20 -|50 50 -|100 100 -|150 Totale X Libero Professionista 16,91 25,71 9,13 17,25 69 Lav. Dipendente 11,52 17,51 6,22 11,75 47 Disoccupato 13,73 20,86 7,41 14,00 56 Pensionato 7,84 11,92 4,24 8,00 32 Totale 50 76 27 51 204

Y 0 -|20 20 -|50 50 -|100 100 -|150 Totale X Libero Professionista 3,09 -10,71 -1,13 8,75 0 Lav. Dipendente 3,48 -12,51 7,78 1,25 0 Disoccupato -8,73 19,14 -4,41 -6,00 0 Pensionato 2,16 4,08 -2,24 -4,00 0 Totale 0 0 0 0 0

L’indice Eta-quadro risulta allora pari a:

η^2 Y|X = 21172/391783 = 0,054 => 5,4% (della massima dipendenza in media osservabile)

Anche dall’analisi della dipendenza in media abbiamo quindi la conferma c’è una relazione tra ammontare di spesa e professione del capofamiglia, ma l’intensità è bassa.

ESERCIZIO 2

Nel corso del 2006 sono stati rilevati giornalmente il LIVELLO DEL TRAFFICO CITTADINO e la CON- DIZIONE METEOROLOGICA:

BASSO MEDIO ALTO TOT SERENO 100 13 5 118 VARIABILE 21 105 10 136 PIOGGIA 6 15 90 111 TOT 127 133 105 365

  1. Qual è il collettivo di riferimento?

  2. Fornire una spiegazione per le frequenze n 23 e n 1.

  3. Stabilire se tra i due caratteri vi è dipendenza statistica

  4. Il collettivo oggetto di studio in questo caso è l’insieme dei diversi giorni dell’anno 2006. La fre- quenza congiunta n 23 rappresenta il numero di giorni in cui il tempo è stato variabile ed il livello di traffico alto; la frequenza marginale n 1. rappresenta invece il numero di giorni del 2006 in cui il li- vello di traffico è stato basso.

  5. Per stabilire se c’è dipendenza tra i due caratteri e quindi nel caso, valutarne l’intensità, proce- diamo al calcolo delle frequenze teoriche sotto l’ipotesi di indipendenza in distribuzione (dopo aver verificato che cade l’ipotesi di indipendenza):

BASSO MEDIO ALTO TOT SERENO 41,06 43,00 33,95 118 VARIABILE 47,32 49,56 39,12 136 PIOGGIA 38,62 40,45 31,93 111 TOT 127 133 105 365

Calcoliamo quindi la tabella delle contingenze:

BASSO MEDIO ALTO TOT

SERENO 58,94 -30,00 -28,95 0,

VARIABILE -26,32 55,44 -29,12 0,

PIOGGIA -32,62 -25,45 58,07 0,

TOT 0,00 0,00 0,00 0,

Si nota come sulla diagonale principale della tabella ci sia un addensamento di casi osservati supe- riore alla situazione teorica di indipendenza, mentre in tutte le altre celle i casi osservati sono stati inferiori a quelli che ci saremmo aspettati sotto l’ipotesi di indipendenza statistica. Essendo tutte le contingenze diverse da zero escludiamo l’ipotesi di indipendenza e procediamo al calcolo dell’indice Chi quadro

Il valore dell’indice ci conferma che i due caratteri sono connessi. Misuriamo il livello di dipenden- za calcolando l’indice V di Cramer:

max χ^2 = 365 x min [(3-1);(3-1)] = 730

V = (377,74/730) 1/2^ = 0,521/2^ = 0,72 => 72% (della max connessione osservabile)

Dalla lettura dell’indice di Cramer concludiamo che vi è un alto grado di dipendenza tra la condi- zione atmosferica e il livello di traffico.

ESERCIZIO 3

Un’agenzia di viaggi è interessata a sapere se le tariffe aeree sono in relazione alla durata (in mi- glia) dei voli. L’agenzia ipotizza che più lungo è il volo, più costoso è il biglietto. Vengono allora rac- colti i seguenti dati:

Distanza 2375 1400 1250 2325 985 2025 Tariffa (€) 430 272 252 422 207 373

Verificare se c’è concordanza tra tariffa e distanza percorsa e valutarne l’intensità.

Innanzi tutto costruiamo il diagramma di dispersione per la Distanza (X) e la Tariffa (Y)

Osservando il diagramma è plausibile affermare che i due caratteri sono concordi e che c’è una for- te relazione di dipendenza lineare.

Possiamo calcolare la Tariffa e la Distanza media:

TARIFFA MEDIA = (430+272+252+422+207+373)/6=

DISTANZA MEDIA = 1726,

Pur senza disegnare il grafico degli scostamenti si osserva in generale la presenza di scostamenti concordi

x= 1726, y= 326

150

200

250

300

350

400

450

500 1000 1500 2000 2500

Durata media di vita

% di popolazione con accesso solo a fonti idriche inquinate 79,0 5 72,4 29 70,1 15 69,3 35 68,2 20 55,9 43 57,2 71 54,4 72 45,6 52 33,6 66

C’è una relazione tra l’uso di acqua inquinata e la speranza di vita?

ESERCIZIO 7

È stato studiato il voto di laurea degli studenti di Economia Aziendale e il reddito annuale (in €) del padre, riportando i seguenti dati:

Voto di Laurea

Reddito (in €) 98 20000 102 25000 95 21500 90 27500 110 32000 104 20500 94 40000 85 25500 100 28000 95 20000

Analizzare la relazione tra i due caratteri

SOLUZIONI ESERCIZIO 4 => COV(X,Y) = 1,667 r(X,Y) = 0, ESERCIZIO 5 => COV(X,Y) = 11,583 r(X,Y) = 0, ESERCIZIO 6 => COV(X,Y) = -240,646 r(X,Y) = -0, ESERCIZIO 7 => COV(X,Y) = 900 r(X,Y) = 0,