Scarica Esercizi di Statistica Descrittiva: Distribuzioni, Medie e Quantili e più Esercizi in PDF di Statistica solo su Docsity!
Fotocopia 1. Distribuzioni di frequenze A. Distribuzione di 20 quotidiani per numero di articoli di argomento finanziario contenuti nell’edizione di oggi. xj nj freq. Relative fj=nj/N 0 3 0.15 3 20 1 5 0.25 8 17 2 5 0.25 13 12 3 4 0.2 17 7 4 1 0.05 18 3 5 2 0.1 20 2 TOT 20 1 - - ci sono nj=4 quotidiani con Xj=3 articoli fin., corrispondenti al 20% dei 20 quotidiani ci sono Cj=17 quotidiani pari all'85% che hanno pubblicato X<=3 articoli fin. ci sono Rj=7 quotidiani pari al 35% che hanno pubblicato X>=3 articoli fin. B. Distribuzione di 180 seminari di trading online organizzati nel 2016 da un ente di formazione bancaria secondo il numero xj (classi) nj freq. Relative fj=nj/N freq. Specifiche dj=nj/aj 28-30 36 0.2 3 12 31-32 50 0.277777777777778 2 25 33-34 45 0.25 2 22. 35-37 36 0.2 3 12 38-40 13 0.0722222222222222 3 4. TOT 180 1 1)Frequenza assoluta X<33: nj=n1+n2 86 47.78% 2)Frequenza assoluta X>36: dj(37)+n5 25 13.89% 3)Frequenza assoluta 36<=X=> nj=dj(37)+dj(38)+n(X=36)+n(X=39) 32.67 18.15% C. Distribuzione i 130 clienti di una società di gestione patrimoniale secondo l’ammontare (in migliaia di Euro) del patrimon X=CARATTERE CONTINUO xj (classi) nj 160 -| 165 10 10 130 5 165 -| 170 25 35 120 5 170 -|180 45 80 95 10 180 -|190 35 115 50 10 190 -|195 13 128 15 5 195 -|200 2 130 2 5 TOT 130 1)I clienti sono da 160 a 168 quindi n1+ n(165<X<168):area bh: (168-165)d2. Area= 2)clienti con 176186 sono: n(176<x<180)+n(180<X<186): bh:(180-176)d3+(186-180)*d freq. Cumulative Cj=n1+..+nj=n(x>xj) freq. Cumulative Cj=n1+..+nj=n(x>xj) freq. Retrocumulative Rj=n(X>xj) Ampiezza classi aj=supj- infj
nuti nell’edizione di oggi. Fj=Cj/N Fj*=Rj/N 0.15 1 0.4 0. 0.65 0. 0.85 0.35 xj=3 nj= 0.9 0.15 fj=0,2 20% 1 0.1 Cj=
- Rj= Fj=0,85 85% Fj*=0,35 35% mazione bancaria secondo il numero di iscritti.
are (in migliaia di Euro) del patrimonio conferito in gestione. 2 5
15 25 19.23% 39 30% freq. Relative specifiche dj'=dj/N freq. Specifiche dj=nj/aj
- Distribuzione dei 250 dipendenti dell’azienda considerata nella tabella 3 secondo il tempo X (in minuti) impiegato per raggiungere il posto di lavoro.
- Individuare la classe modale e discuterne la rappresentatività.
- Calcolare la mediana ed il nono decile, commentando i risultati.
- Calcolare il 78-mo centile, commentando il risultato. Classi di X aj=supj-infj+1 dj=nj/aj freq. Cumulate Cj 0 -| 15 25 15 1.66666667 25 1| 15 -| 30 30 15 2 55 26| 30 -| 60 75 30 2.5 130 56| 60 -| 120 90 60 1.5 220 131| 120 -| 180 30 60 0.5 250 221| TOT (N) 250
- Pos (Me)=lj(inf)+(t-c(j-1) -1/2)aj/nj 58 Me=N+1/2 125. almeno il 50% dei dipendenti impiega meno di 58 minuti a raggiungere il posto di lavoro e almeno il 50% dei dipendenti im D9: 9N+1/10 225.9 Pos(D9): 130. almeno il 90% dei dipendenti impiega meno di circa 131 minuti a raggiungere il posto di lavoro e almeno il 10% dei dipend
- 78-mo centile: C78=78*N+1/100 195.78 Pos(C78): 103. almeno il 78% dei dipendenti impiega meno di 103,52 minuti a raggiungere il posto di lavoro e almeno il 22% dei dipenden
- Distribuzione di 200 studenti di Giurisprudenza secondo il numero X di esami sostenuti al termine del primo anno.
- Individuare la moda e discuterne la rappresentatività.
- Calcolare i quartili, commentando i risultati. Xj nj fj=nj/N 0 20 20 1|20 200 0. 1 30 50 21|50 180 0. 2 70 120 51|120 150 0. 3 50 170 121|170 80 0. 4 20 190 171|190 30 0. 5 10 200 191|200 10 0. TOT 200 1 1)la moda è 2 esami; è rappresentativa? 0.35 <0,5 quindi non è rappresentativa 2)Calcolare: almeno il 25% degli studenti ha sostenuto meno di 1 esame e almeno il 75% degli studenti ha sostenuto più di 1 esame Q2(Me): trovare la posizione con la definizione: F(xj) >/= 0,5 e F(xj) >/= 0,5: 2 esami almeno il 50% degli studenti ha sostenuto meno di 2 esami e almeno il 50% degli studenti ha sostenuto più di 2 esami almeno il 75% degli studenti ha sostenuto meno di 3 esami e almeno il 25% degli studenti ha sostenuto piu di 3 esami numero dipendenti nj Posizioni (Cj seq.) freq. Cumulate Cj Posizioni (Cj seq.) freq. Retrocumulate Rj Q1: trovare la posizione con la definizione: F(xj) >/= 0,25 e F(xj) >/= 0,75: 1 esame Q3: trovare la posizione con la definizione: F(xj) >/= 0,75 e F*(xj) >/= 0,
N=
x= carattere qualitativo su scala ordinale nterpolazione: 1.0625 almeno il 25% degli affitti costa x<= 1,0625 e almeno il 75% costa x>= 1, valore mediana: 1.45 almeno il 50% degli affitti costa x<= 1,45 almeno il 50% degli affitti costa x>= 1, nterpolazione: 1.775 almeno il 75% degli affitti costa x<= 1,775 e almeno il 25% costa x>= 1, nterpolazione: t=i+h=xi+h*(x(i+1)-xi) 1.
- Moda: diploma. è rappresentativo? NO 34% DEVE ESSERE > 0, X=qualitativo su scala ordinale F*(xj)=Rj/N Rj 1 250 0.68 170 0.34 85 0.06 15
Esercizi sulle medie algebriche o potenziate: calcolo, proprietà ed impieghi.
- La seguente tabella riporta il carico X (in quintali) trasportato da un corriere nei 5 viaggi effettuati la scorsa settimana. a) Calcolare M-1, M0, M1, M2 sui dati della tabella e verificarne la relazione. b) Commentare il risultato trovato per M1. c) Per ogni viaggio il corriere incassa una quota fissa di 500 Euro e una quota variabile di 1000 Euro per quintale di carico tr Xi 1/xi xi^2 yi=500+1000xi 0.98 1.02 0.9604 1480 1.00 1 1.00 1500 1.10 0.909 1.21 1600 0.99 1.01 0.9801 1490 1.02 0.98 1.0404 1520 5.09 4.920 5.1909 7590 N= a) M-1: N/(som 1/xi) 1. M0:(Prod xi)^1/N 1. M1:TOT(X)/N 1. M2: rad.(1/N(Som xi^2)) 1. b) commento su M1: se il tot dei carichi trasportati fosse equiparato sui 5 (N) viaggi, il corriere avrebbe trasportato un cari c) X=quintali trasportati Y=incasso=500+1000X=? incasso medio: M1(y)=a+bM1(X)= 500+10001,018: 1,518.00 € la p4 (linearità è confermata M1(y)= 1518
- La tabella seguente riporta la distribuzione di 104 utenti abbonati ad un sito di commercio elettronico secondo il numero di banner pubblicitari cliccati duranti l’ultimo accesso al sito: Xi ni xi^2 fj=nj/N fjxj xini xi^2ni 0 6 0 0.057692307692 0 0 0 1 7 1 0.067307692308 0.067308 7 7 2 55 4 0.528846153846 1.057692 110 220 3 21 9 0.201923076923 0.605769 63 189 4 15 16 0.144230769231 0.576923 60 240 TOT (N) 104 - 1 2.307692 240 656 TOT (X) a) Calcolare la media aritmetica di X e commentare. Calcolare la media quadratica. b) E’ possibile calcolare le altre medie algebriche (media geometrica ed armonica)? Motivare la risposta. proprietà associativa (terza proprietà) della media aritmetica, calcolare il numero medio aritmetico di banner cliccati dal c a) M1: con pesi ni: som (xjfj)= 2.308 se i 240 banner cliccati vengono equiparati fra i 104 abbonamenti, M2 ponderata= 2. b) M-1: non si puo fare perché 6/0 non esiste M0: non si puo fare perché x1= c) I 150 utenti abbonati ad un sito concorrente hanno complessivamente cliccato 350 banner pubblicitari durante l’ultimo
ettuati la scorsa settimana. X=carattere quantitativo discreto su scala ordinale 0 Euro per quintale di carico trasportato. Calcolare l’incasso medio Y della scorsa settimana e verificare la quarta proprietà (linearità) d e avrebbe trasportato un carico di 1,018q a viaggio. tà è confermata elettronico secondo il numero X moda= 2 banner X=quantitativo continuo la risposta. metico di banner cliccati dal complesso degli utenti abbonati ai due siti. parati fra i 104 abbonamenti, ciascuno ne avrebbe cliccati 2,308 durante l'ultimo accesso al sito pubblicitari durante l’ultimo accesso al sito. Utilizzando la
fonico secondo il numero X di richieste di intervento ricevute nella mattinata di lunedi scorso x^2*nj xj^fj 20 1. 253.5 1. 1089 2. 1922 2.
assistenza, ciascuno ne avrebbe ricevute 9,
N=5 diretta indiretta società x y (yi-y°)^2 Xi-M1^2 yi-M1^2 xiyi xi^ a 80 120 448.443 324 400 9600 6400 b 70 110 88.581 64 100 7700 4900 c 60 100 5.536 4 0 6000 3600 d 50 80 199.308 144 400 4000 2500 e 50 90 199.308 144 100 4500 2500 tot 310 500 941.176 680 1000 31800 19900 medie 6360 3980
- il rapporto tra 100/60= 1,67 è DI COESISTENZA 166,67%
- y=l0+l1X y=27,058+1,176x cov (x,y) 160 l1 1. Var(x) 136 136 l0 27. var(y) 200 200 m1(x) 62 m1(y) 100 3)I^2d=VS/VT 0.941 94,1% della variabilità tot di y: adattamento ottimo Vs=1/n som(yi*-y°)^2 188.
- x=75 y=27,058+1,176*75= 115.
- variabilità relativa rispetto al centro: coefficiente di variazione perché varx e vary gia calcolate scarto quad medio x: rad(1/n(som(abs(xi-m1))^2)) 11.662 (radq di varx) scarto quad medio y: rad(1/n(som(abs(yi-m1))^2)) 14.142 (radq di vary) scarto quad medio/m1(x) 0. scarto quad medio/m1(y) 0. sono piu variabili gli investimenti pubblicitari che le vendite
- R di gini= delta/2M1 per Y (ordinarli) 0.1 LA CONCENTRAZIONE è PARI AL 10% DEL VALORE MASS delta=s/n(n-1) 20 s=2som yj(2j-N-1):pesi 400 J yj 2j-N-1 yjpesi 1 80 -4 - 2 90 -2 - 3 100 0 0 4 110 2 220 5 120 4 480 tot 0 200 ES 2 1) y e x = caratteri qualitativi su scala nominale A/R italia-cs italia meri. freq. Margi A agricoltura 12 28 40 industra 34 46 80 servizi 48 48 96 freq. Margi R 94 122 216 N
- DPR di A da R A/R A|r1 (dpr) A|r2 (dpr) DMR A
a1 0.128 0.230 0. a2 0.362 0.377 0. a3 0.511 0.393 0. tot 1 1 1 I CARATTERI A E R NON SONO INDIPENDENTI IN DISTRIBUZIONE, QUINDI SON CONNESSI
- CONTINGENZA: Cij=nij-nij* nij=ni.n.j/N A/R A|r1 (dpr) A|r2 (dpr) DMR A a1 17.407 22.593 40 a2 34.815 45.185 80 a3 41.778 54.222 96 tot 94.000 122 216 N A/R A|r1 (dpr) A|r2 (dpr) DMR A a1 -5.407 5.407 0 a2 -0.815 0.815 0 a3 6.222 -6.222 0 tot 0 0 0 i tot delle contingenze per riga e colonna son pari a 0: Indifferenza tra A e R
- I1= abs Cij /N 0. A/R A|r1 (dpr) A|r2 (dpr) DMR A a1 5.407 5.407 10. a2 0.815 0.815 1. a3 6.222 6.222 12. tot 12.444 12.444 24.
- no perché non sappiamo se i due caratteri non dipendono da un terzo carattere
3 4 5 6 7 Column J
es 1 gruppo 1 gruppo 2 gruppo 3 35 30 40 41 28 42 40 27 41 37 153 85 123
- Con riferimeto alla totalità dei dati, si determini la mediana di X e si commenti il risultato.
- Si calcoli la media aritmetica totale di X.
- Si verifichi la terza proprietà (proprietà associativa) della media aritmetica.
- Sapendo che la varianza totale di X è pari a 30,09, si verifichi la seconda proprietà della varianza (scomp
- mediana tot N=10 Pos(Me): 5.5 interpolazione: 38.5 almeno il 50% dei ciclisti ha im Pos(xj) xj almeno il 50% dei ciclisti ha im 1 27 2 28 3 30 4 35 5 37 6 40 7 40 8 41 9 41 10 42 tot x 361 2)M1(x) 36.1 tempo medio aritmetico 4)seconda proprietà della varianza: 1/n Som(m1j-m1x)^2Nj+ 1/N Som sqm^2Nj 30. sqm^2 nei:1/N som sqm^2Nj 2.941666667 sqm^2 fra: 1/N (Xj-XTOT)^2Nj= 27.
- terza proprietà M medie parziali dei gruppi e varianze parziali: SQM^2 PARZIALE: M1(X^2)-X1^ x1i x1i^2 x2i x2i^2 x3i x3i^ 35 1225 30 900 40 1600 37 1369 28 784 42 1764 40 1600 27 729 41 1681 41 1681 153 5875 85 2413 123 5045 X1 38.25 X2 28.33 X3 41 SQM^2= 5.6875 SQM^2= 1.56 SQM^2= 0. es 2 Serie territoriale ISTAT del numero X di imprese nate in ciascuna regione italiana nel 2018 Regione Pos(xi) M1 13667. Valle d'Aosta 502 1 Me: 10. Molise 1402 2 interpolazione: 7694. xi
i il risultato. rietà della varianza (scomposizione della varianza totale). almeno il 50% dei ciclisti ha impiegato meno di 38,5 minuti almeno il 50% dei ciclisti ha impiegato più di 38,5 minuti rapporto di composizione 0. il 90,23% della varianza totale è dovuta alla variabilità fra medie parzialo: effetto fra gruppi
es 1
T Y(t) NIBM (yi/y-1) NIBF (base 1° 2022) var relativa % var relativa %
NIBM + VAR RELATIVA= nel 1° 2023 le spese trimestrali risultano il 70,66% con una variazione diminuita del -29,34% dalla s NIBF + VAR RELATIVA= nel 1° 2023 le spese trimestrali risultano il 63,64% rispetto al 1° 2022 con una variazione diminuita d
- NI (4°-22/4°-23) var % 0.83911671924 -16.09% nel 4° trimestre 2023 la spesa era pari a 83,91% rispetto al 2022 con una variazione diminuita del -16,09%
- mo= 0. tmv= -3.92% es 2: La seguente tabella riporta la distribuzione di 30 clienti titolari di polizza assicurativa RC Auto secondo il numero X di s
- X= carattere quantitativo discreto su scala ordinale(scala di rapporti) xi ni Cj Fj Rj F*j 0 8 8 0.266666666666667 30 1 1 5 13 0.433333333333333 22 0. 2 6 19 0.633333333333333 17 0. 3 9 28 0.933333333333333 11 0. 4 2 30 1 2 0. tot 30
- ci sono almeno 28 clienti che hanno causato <o= 3 sinistri
- Me: non serve interpolare: valore Fj>=0,5 e Fj>=0, Q3: valore con Fj>=0,25 e Fj>=0, 4)differenza media: 1/NN-1S 1. S ponderata =2 somxjnj(2Cj-N-nj) 1324 5)M1 ponderata: 1. Sm1 1. Varianza: var(x) 1. sigma=sqm 1. es 2: Una ditta italiana produttrice di calzature distribuisce i propri prodotti attraverso 100 punti vendita, che sono stati cla italia resto europa 10 -|15 10 6 15 -|20 5 4 20 -|30 45 20 30 -|50 10 0 N= a) concentrazione di gini: r= delta/2m sede/ classi di X