Scarica Esercizi di Statistica: Distribuzioni di Frequenza, Grafici, Media e Varianza, Regressione e più Esercizi in PDF di Statistica solo su Docsity!
Esercitazione 1
5/4/ Distribuzioni di frequenza, grafici, media e varianza, stem and leaf, regressione
Esercizio 1 – distribuzione di frequenza
- Potete scegliere se studiare in un’aula della biblioteca (Biblio 1 ) o in quella a fianco (Biblio 2 ). Nella tabella sottostante sono indicati il numero di studenti e il numero di giorni (del mese scorso) in cui si sono recati nella prima biblioteca. Per la seconda sapete già che la media è 33 e la varianza 7. Confrontare la variabilità delle due aule e scegliere quella con meno variabilità. Numero di studenti Giorni in biblioteca 25 21 36 30 41 15 23 6 33 18
- confrontiamo le due biblioteche Se 𝑆𝑥 |𝑥 | è maggiore 𝑆𝑦 |𝑦 | significa che la prima biblioteca ha un numero di studenti più variabile, viceversa se minore. CV(Biblio1) = 5,97 / 32,8 = 0, CV(Biblio2) = 2,65 / 33 = 0, La seconda biblioteca presenta una minore variabilità.
Esercizio 1 – distribuzione di frequenza
- Un ente di beneficienza riceve le proprie donazioni da: governo (30%), privati cittadini (20%), imprese (28%), altri (22%). Rappresentare graficamente in maniera appropriata queste informazioni.
- Il numero di guasti di un macchinario è dovuto principalmente alle seguenti cause: usura (35%), errato utilizzo (20%), pezzi difettosi (30%), altro (15%).
- Le età di un gruppo di studenti in gita sono state annotate dal professore che sceglie di rappresentarle graficamente. Suggeritegli un grafico idoneo in questa situazione.
Esercizio 2 – grafici
- Il prezzo delle case nella città di Boston dipende principalmente dai metri quadrati della casa. Rappresentare graficamente la relazione tra prezzo e metri quadri.
- In una tabella sono presenti il numero totale di gol segnati in Serie A dal 1990 al 2018. Indicare quale grafico sarebbe più adatto a rappresentare i dati.
- Decidere come rappresentare le seguenti temperature della prima settimana del mese di Gennaio 2019: Lu 6,9° ; Ma 7,1° ; Me 8,4° ; Gi 6,8° ; Ve 7,4° ; Sa 7,6° ; Do 7,2°
Esercizio 2 – grafici
- Il prezzo delle case nella città di Boston dipende principalmente dai metri quadrati della casa. Rappresentare graficamente la relazione tra prezzo e metri quadri. (scatterplot)
- In una tabella sono presenti il numero totale di gol segnati in Serie A dal 1990 al 2018. Indicare quale grafico sarebbe più adatto a rappresentare i dati. (serie storiche)
- Decidere come rappresentare le seguenti temperature della prima settimana del mese di Gennaio 2019: Lu 6,9° ; Ma 7,1° ; Me 8,4° ; Gi 6,8° ; Ve 7,4° ; Sa 7,6° ; Do 7,2° (steam and leaf)
Esercizio 2 – grafici
- In alcuni sport, ad esempio nella boxe, il peso dell’atleta determina la categoria a cui verrà assegnato. Sapendo che il peso medio di un campione di pugili professionisti è 85 kg e la varianza è 6,25, calcolare la percentuale di pugili che rientreranno nella categoria cruiser (80 kg
- 90kg) ipotizzando una distribuzione normale (campanulare e simmetrica).
- Soluzione: sapendo che la varianza è pari a 6,25 sappiamo che lo scarto quadratico medio è di 2,5 kg. Se la media è 85 sappiamo che nell’intervallo μ ± 2 σ ci sono il 95% delle osservazioni, quindi possiamo concludere che il 95% dei pugili rientrerà nella categoria cruiser.
Esercizio 3 – media e varianza
- Qual era la percentuale minima che ci aspettavamo?
- Soluzione: per la disuguaglianza di Čebyšëv ci aspettavamo almeno il 75% dei pugili (1 – 1/λ 2 se λ = 2 allora 1 – ¼ = 0,75).
- Sapendo che le categorie nel pugilato partono dai 45 kg per superare i 90 kg, cosa possiamo concludere relativamente al nostro campione?
- Soluzione: se il nostro campione è sufficientemente numeroso possiamo concludere che la forte concentrazione di osservazioni in un’unica fascia significa che probabilmente abbiamo raccolto i dati in maniera distorta (ad esempio abbiamo raccolto i dati ad un incontro di pesi cruiser)
Esercizio 3 – media e varianza
- Trasformiamo ora il grafico precedente in un diagramma ramo – foglia estraendo prima di tutto i dati. Ricaviamo i seguenti valori da rappresentare: 29, 35, 32, 40, 38, 38, 34, 35, 38, 33.
- Dopodiché dobbiamo ordinarli: 29, 32, 33, 34, 35, 35, 38, 38, 38, 40. 2 9 3 2 3 4 5 5 8 8 8 4 0
Esercizio 4 – steam and leaf
- A questo punto calcoliamo i 5 numeri di sintesi:
- minimo:
- Q 1 :
- mediana:
- Q 3 :
- massimo:
Esercizio 4 – steam and leaf
- Per quanto riguarda il calcolo dei decili applichiamo la seguente formula: (n + 1) 10 * 3 = 3,3. Il terzo decile è compreso tra la terza e la quarta posizione, cioè tra 33 e 34 perciò possiamo dire che è 33,
- Infine, per calcolare il settantesimo percentile dobbiamo svolgere il seguente calcolo: (n + 1) 100 * 70 = 7,7. Il settantesimo percentile è compreso tra 35 e 38.
Esercizio 4 – steam and leaf
Esercizio 5 – regressione
- Un negozio di prodotti hi-tech dispone degli ultimi prezzi di un accessorio molto richiesto. Decide perciò di variare il prezzo in funzione della disponibilità. Di seguito troviamo i prezzi e numero di prodotti venduti fino a questo momento. Quantità (X) Prezzi (Y) 28 44 26 50 25 51 19 80 13 97 6 110 Calcolare: 1) La covarianza 2) Il coefficiente di correlazione lineare 3) 𝑏 0 e 𝑏 1 4) E’ rimasto un ultimo pezzo. A quale prezzo verrà venduto?
Q.tà (X) P (Y) (^) x - μ y - μ 28 44 8,5 - 28 26 50 6,5 - 22 25 51 5,5 - 21 19 80 - 0,5 8 13 97 - 6,5 25 6 110 - 13,5 38
Esercizio 5 – regressione
Q.tà (X) P (Y) x - μ y - μ (x − μ) 𝟐
- 28 44 8,5 - 28 72,
- 26 50 6,5 - 22 42,
- 25 51 5,5 - 21 30,
- 19 80 - 0,5 8 0,
- 13 97 - 6,5 25 42,