Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica Corso Base esercizi Online, Esercizi di Statistica

Statistica, esercizi online di economia

Tipologia: Esercizi

2018/2019

Caricato il 12/08/2019

sara__24
sara__24 🇮🇹

4.6

(11)

36 documenti

1 / 250

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Esercizi di Statistica
Serena Arima, Marilena Barbieri, M.Brigida Ferraro,
Stefania Gubbiotti Brunero Liseo,
MEMOTEF
Università di Roma “La Sapienza”
February 19, 2015
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Anteprima parziale del testo

Scarica Statistica Corso Base esercizi Online e più Esercizi in PDF di Statistica solo su Docsity!

Esercizi di Statistica

Serena Arima, Marilena Barbieri, M.Brigida Ferraro,

Stefania Gubbiotti Brunero Liseo,

MEMOTEF

Università di Roma “La Sapienza”

February 19, 2015

  • 1 Statistica descrittiva
    • 1.1 Popolazione, campione e variabili
    • 1.2 Distribuzioni di frequenza
      • per caratteri qualitativi 1.3 Rappresentazioni grafiche
      • per caratteri quantitativi 1.4 Rappresentazioni grafiche e numeriche
    • 1.5 Moda, media, mediana e quantili
    • 1.6 Gli indici di variabilità
    • 1.7 Proprietà delle medie
    • 1.8 I numeri indice
  • 2 Probabilità
    • 2.1 Probabilità Condizionata
    • 2.2 Estrazioni da popolazioni a bassa numerosità
    • 2.3 Variabili casuali
    • 2.4 Distribuzioni continue
    • 2.5 Distribuzione della media campionaria
    • 2.6 Distribuzioni di variabili casuali
      • 2.6.1 Distribuzione Normale
      • 2.6.2 La distribuzione geometrica
      • 2.6.3 Distribuzione Binomiale
      • 2.6.4 Altre distribuzioni
  • 3 Inferenza - popolazione Normale 3.1 Intervalli di confidenza e test per campioni estratti da una - popolazioni Normali con media e varianza incognite 3.2 Intervalli di confidenza e test per campioni estratti da
    • 3.3 Test t per campioni appaiati
  • 4 Dati categorici
    • 4.1 Tabelle di contingenza
    • 4.2 Inferenza su una singola proporzione
    • 4.3 Inferenza sulla differenza tra due proporzioni
    • 4.4 Verifica della bontà di adattamento
    • 4.5 Test di indipendenza
  • 5 Regressione lineare
    • 5.1 Regressione lineare semplice
    • 5.2 Inference for linear regression
    • 5.3 Correlazione e Regressione
    • 5.4 Analisi dei residui

Prefazione

Lista di esercizi per il corso di Statistica di base

Capitolo 1

Statistica descrittiva

1.1 Popolazione, campione e variabili

Esercizio 1.1.

Secondo un’indagine della Goldman Sachs, soltanto il 4% delle famiglie statunitensi ha un conto online. In un sondaggio della Cyber Dialogue riportato su USA Today si è cercato di indagare sui motivi per cui i clienti hanno chiuso il proprio conto online dopo un periodo di prova. Di seguito trovate le risposte degli intervistati alla domanda: “Perchè hai chiuso il tuo conto online? ”

Perchè hai chiuso il tuo conto online? Troppo complicato o richiede troppo tempo 27% Insoddisfatto dal servizio clienti 25% Non mi necessario o non mi interessa 20% Preoccupato per la sicurezza del conto 11% Troppo costoso 11% Sono preoccupato per la privacy 5% a. Descrivere la popolazione per l’indagine della Goldman Sachs;

b. Descrivere la popolazione per l’indagine della Cyber Dialogue;

8 Cap. 1. Statistica descrittiva

c. La risposta alla domanda considerata è qualitativa o quantitativa?

Soluzione.

a. La popolazione di riferimento per l’indagine della Goldman Sachs è costituita da tutte le famiglie statunitensi.

b. La popolazione di riferimento per l’indagine della Cyber Dialogue è costituita dalle famiglie statunitensi che avevano un conto online e hanno deciso di chiuderlo.

c. La risposta alla domanda considerata è qualitativa.

  • • •

Esercizio 1.2.

In un fast food vengono venduti 3 diversi tipi di bevande: bibite, tè e caffè.

a. Spiegare perchè il tipo di bevanda venduta è un esempio di carattere qualitativo sconnesso.

b. Le bibite vengono vendute in 3 dimensioni diverse: piccola, media e grande. Di che carattere si tratta?

Soluzione.

a. Il tipo di bevanda è un carattere qualitativo sconnesso: le sue modalità sono definite mediante sostantivi e non ammettono un ordinamento tra loro (infatti date due bevande è possibile affermare soltanto se esse sono uguali o diverse tra loro).

10 Cap. 1. Statistica descrittiva

e. quantitativo continuo, scala proporzionale.

f. quantitativo continuo, scala proporzionale.

g. qualitativo sconnesso, scala nominale.

  • • •

Esercizio 1.4. Identificare le componenti di uno studio (dal libro di testo OpenIntro Statistics di Diez et al., es. 1.3-1.7) Identificare (i) le unità, (ii) le variabili e la loro tipologia, (iii) l’obiettivo principale di ricerca, (iv) la popolazione di interesse e il campione negli studi descritti qui di seguito. Discutere inoltre sulla possibilità di generalizzare i risultati dello studio alla popolazione e di stabilire dei nessi causali: a. Alcuni ricercatori hanno raccolto dei dati per esaminare la relazione tra sostanze inquinanti e nascite premature nel sud della California. Durante lo studio i livelli di inquinamento dell’aria (monossido di carbonio CO, diossido di nitrogeno, ozono, particolato PM 10) sono stati misurati in apposite stazioni di monitoraggio della qualità dell’aria. E’ stata inoltre rilevata la durata della gestazione per 143196 nascite tra il 1989 e il 1993 e l’esposizione all’inquinamento dell’aria durante la gestazione è stato calcolato per ciascuna nascita. L’analisi ha mostrato che una maggiore concentrazione di PM 10 e, in misura minore, di CO possono essere associate a nascite premature. b. Il metodo Buteyko è una tecnica di respirazione debole sviluppata dal medico russo Konstantin Buteyko nel 1952. L’evidenza empirica suggerisce che il metodo Buteyko aiuta a ridurre i sintomi dell’asma e a migliorare la qualità della vita. In uno studio clinico volto a dimostrare l’efficacia di questo metodo, i ricercatori hanno reclutato 600 pazienti malati asma di età compresa tra i 18 e i 69 anni che erano stati sottoposti ad una terapia medica contro l’asma. Questi pazienti sono stati suddivisi in due gruppi: uno sottoposto al metodo Buteyko, l’altro no. Sono stati rilevati degli indici di qualità della vita, di attività, di sintomi dell’asma e riduzione dei trattamenti medici su una scala da 0 a 10. In media, i pazienti del gruppo Buteyko

1.1 Popolazione, campione e variabili 11

hanno sperimentato una riduzione significativa nei sintomi dell’asma e un miglioramento di qualità della vita.

  • • • Soluzione. a. (i) Le unità sono 143196 nuovi nati registrati nel sud della California tra il 1989 e il 1993. (ii) Le variabili misurate sono tutte quantitative continue: monossido di carbonio CO, diossido di nitrogeno, ozono, particolato PM 10. (iii) L’obiettivo della ricerca è stabilire se c’è un’associazione tra l’esposizione all’inquinamento dell’aria e le nascite premature. (iv) La popolazione di interesse è quella di tutte le nascite nel sud della California. Il campione considera invece le 143196 nascite avvenute tra il 1989 e il 1993. Se le nascite in questo periodo di tempo possono essere considerate rappresentative di tutte le nascite del sud della California allora si può pensare che i risultati ottenuti siano generalizzabili all’intera popolazione. Tuttavia, poichè lo studio è di tipo osservazionale, non può essere usato per dimostrare una relazione di tipo causale. b. (i) Le unità sono 600 pazienti adulti di età compresa tra i 18 e i 69 anni malati di asma e sotto trattamento. (ii) Le variabili misurate su una scala qualitativa ordinale da 0 a 10 (quindi trattabili come quantitative discrete) sono: indici di qualità della vita, di attività, di sintomi dell’asma e riduzione dei trattamenti medici. Inoltre viene considerata una variabile binaria che indica l’appartenenza o non appartenenza al gruppo sperimentale Buteyko. (iii) L’obiettivo della ricerca è dimostrare l’efficacia del metodo Buteyko nel miglioramento della condizione generale del malato d’asma. (iv) La popolazione di riferimento è l’insieme di tutti i pazienti di età compresa tra i 18 e i 69 anni, malati di asma e sotto trattamento. Il campione contiene 600 di questi pazienti. Se assumiamo che il campione contenga dei pazienti volontari, non possiamo pensare che sia un campione rappresentativo e quindi generalizzare i risultati all’intera popolazione. Tuttavia, la natura sperimentale dello studio consente di poter dimostrare statisticamente l’esistenza di una relazione causale.

1.2 Distribuzioni di frequenza 13

Soluzione.

a. Le unità sono 50 × 3 = 150.

b. Ci sono quattro variabili quantitative: lunghezza dei sepali, larghezza dei sepali, lunghezza dei petali e larghezza dei petali.

c. C’è una sola variabile categorica, il tipo, che presenta tre modalità: setosa, versicolor e virginica.

  • • •

1.2 Distribuzioni di frequenza

Esercizio 1.6. (dal libro di testo Introduzione alla statistica di Sheldon M. Ross, es. 1 pag.59) I dati seguenti indicano il gruppo sanguigno di 50 donatori in un centro di raccolta del sangue.

0 A 0 AB A A 0 0 B A 0 A AB B 0 0 0 A B A A 0 A A 0 B A 0 AB A 0 0 A B A A A 0 B 0 0 A 0 A B 0 AB A 0 B

a. Rappresentare questi dati in una tabella di frequenze.

b. Rappresentare i dati in una tabella di frequenze relative.

c. Calcolare inoltre le frequenze percentuali.

Soluzione.

14 Cap. 1. Statistica descrittiva

(a) (b) (c) gruppo frequenze assolute frequenze relative frequenze percentuali 0 19 0.38 38 A 19 0.38 38 AB 4 0.08 8 B 8 0.16 16 totale 50 1 100

  • • •

Esercizio 1.7. (dal libro di testo Introduzione alla statistica di Sheldon M. Ross, es. 5 pag.35) I seguenti dati indicano la concentrazione di ozono nell’aria del centro di Los Angeles durante 25 giorni consecutivi nell’estate del 1984:

6.2 9.1 2.4 3.6 1.9 1.7 4.5 4.2 3.3 5.1 6.0 1.8 2. 4.9 3.7 3.8 5.5 6.4 8.6 9.3 7.7 5.4 7.2 4.9 6.

Costruire la distribuzione in classi utilizzando le seguenti classi: (0, 2],(2, 4],(4, 7], (7, 10].

Soluzione.

concentrazione frequenze assolute (0,2] 3 (2,4] 6 (4,7] 11 (7,10] 5

  • • •

16 Cap. 1. Statistica descrittiva

c. La seguente tabella riporta le frequenze relative e percentuali:

Costo di un pasto Frequenze Frequenze Frequenze classi assolute relative percentuali [10, 15) 1 0.02 2% [15, 20) 0 0 0% [20, 25) 2 0.05 5% [25, 30) 15 0.36 36% [30, 35) 5 0.12 12% [25, 40) 1 0.02 2% [40, 45) 3 0.07 7%

45 15 0.36 36% totale 42 1 100%

d. A partire dalla distribuzione in classi non è possibile ricostruire quella unitaria, mentre è possibile il viceversa come abbiamo visto nell’esercizio precedente.

  • • •

1.3 Rappresentazioni grafiche per caratteri qualitativi 17

1.3 Rappresentazioni grafiche

per caratteri qualitativi

Esercizio 1.9. (dal libro di testo Introduzione alla statistica di Sheldon M. Ross, es. 1 pag.59) Riprendendo l’Esercizio 1.6, rappresentare la distribuzione mediante un diagramma a barre.

Soluzione.

0 A AB B

Frequenza

0

5

10

15

20

1.3 Rappresentazioni grafiche per caratteri qualitativi 19

c.

Ask Jeeves AOL Google MSN Yahoo Altro

0

5

10

15

20

25

30

35

Esercizio 1.11. Uso degli antibiotici nei bambini (dal libro di testo OpenIntro Statistics di Diez et al., es. 1.47) Nei grafici seguenti viene rappresentata la distribuzione della condizione medica precedente di bambini arruolati in uno studio sulla durata ottimale di una terapia antibiotica per la tracheite.

a. Quali sono le caratteristiche che emergono dal diagramma a barre ma non dal diagramma a torta?

b. Quali sono le caratteristiche che emergono dal diagramma a torta ma non dal diagramma a barre?

c. Quale grafico è preferibile per rappresentare questo tipo di dati?

20 Cap. 1. Statistica descrittiva

(b) What features are apparent in the histogram but not the map? (c) Is one visualization more appropriate or helpful than the other? Explain your reasoning.

1.9.7 Considering categorical data 1.47 Antibiotic use in children. The bar plot and the pie chart below show the distribution of pre-existing medical conditions of children involved in a study on the optimal duration of antibiotic use in treatment of tracheitis, which is an upper respiratory infection. (a) What features are apparent in the bar plot but not in the pie chart? (b) What features are apparent in the pie chart but not in the bar plot? (c) Which graph would you prefer to use for displaying these categorical data?

Gastrointestinal

Immunocompromised

Genetic/metabolic

Neuromuscular

Trauma

Respiratory

Cardiovascular

Prematurity

Relative frequency

0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.

Cardio Gastro Gen/meta Immuno Neuro Premat

Resp

Trauma

Soluzione.

a. Nel diagramma a barre è evidente l’ordinamento tra le categorie e vengono rappresentate le frequenze relative.

b. Il diagramma a torta non aggiunge altre informazioni utili a quanto mostrato nel diagramma a barre.

c. In genere il diagramma a barre è preferibile sia per i motivi espressi al punto a. sia perchè il confronto tra lunghezze è più immediato rispetto a quello tra aree.

  • • •