Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


prova esame statistica 2017, Prove d'esame di Statistica Inferenziale

prova esame per esercitazione statistica 2017

Tipologia: Prove d'esame

2022/2023

In vendita dal 11/09/2024

BarbaraNuvoli01
BarbaraNuvoli01 🇮🇹

7 documenti

1 / 2

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA PER LA RICERCA SOCIALE
PROVA SCRITTA 9 giugno 2017
Le risposte alle domande devono essere adeguatamente motivate.
Il modo in cui vengono argomentate le affermazioni contribuirà a definire il punteggio della prova.
Esercizio 1
Le analisi di seguito riportate si riferiscono ai dati della General Social Survey 2010 (dati USA).
La variabile di interesse è la risposta alla domanda ritieni che lo sforzo delle istituzioni per la protezione
dell’ambiente sia… con modalità di risposta “troppo basso” oppure “giusto”.
La tabella che segue mette in relazione le variabili età (sotto e sopra 30 anni) e la risposta alla domanda.
Sono riportate sia le frequenze congiunte assolute sia le condizionate di riga (in %).
| sforzo protezione ambiente
età | basso giusto | Total
-----------+----------------------+----------
>=30 | 356 456 | 812
| 43.84 56.16 | 100.00
-----------+----------------------+----------
<30 | 63 101 | 164
| 38.41 61.59 | 100.00
-----------+----------------------+----------
Total | 419 557 | 976
| 42.93 57.07 | 100.00
Si immagine di estrarre a caso un individuo da questa popolazione di 976 soggetti.
(i) Sia A l’evento che si verifica se l’individuo estratto ritiene che lo sforzo sia troppo basso e B
l’evento che si verifica se l’individuo estratto ha meno di 30 anni. Si calcolino P(A|B) e la P(B|A) e
si spieghi che cosa rappresentano i numeri trovati [in altri termini, esprimere a parole che cosa
vogliono dire in questo particolare esempio P(A|B) e P(B|A)].
(ii) Si valuti se gli eventi A e B sono o meno indipendenti, motivando la risposta.
Si estraggono a caso 2 individui con reinserimento tra i minori di 30 anni.
(iii) Si determini la probabilità che entrambi ritengano che lo sforzo sia troppo basso.
Ritorniamo ora a considerare i 976 soggetti come facenti parte di un campione casuale della popolazione
adulta statunitense. Nella tabella che segue sono riportate nuovamente le frequenze congiunte osservate, le
frequenze attese, e i risultati relativi alla verifica di ipotesi di indipendenza delle due variabili nella
popolazione complessiva.
| sforzo protezione ambiente
età | basso giusto | Total
-----------+----------------------+----------
>=30 | 356 456 | 812
| 348.6 463.4 | 100.00
-----------+----------------------+----------
<30 | 63 101 | 164
| 70.4 93.6 | 100.00
-----------+----------------------+----------
Total | 419 557 | 976
|
Pearson chi2(1) = 1.6407 Pr = 0.200
(iv) Si spieghi come è stata derivata la frequenza attesa 348.6, e che cosa rappresenta.
(v) Si mostri il sistema di ipotesi sottoposto a verifica.
(vi) Si dice che cosa rappresenta il p-value in questo caso e si traggano le opportune conclusioni.
pf2

Anteprima parziale del testo

Scarica prova esame statistica 2017 e più Prove d'esame in PDF di Statistica Inferenziale solo su Docsity!

STATISTICA PER LA RICERCA SOCIALE

PROVA SCRITTA 9 giugno 2017

Le risposte alle domande devono essere adeguatamente motivate. Il modo in cui vengono argomentate le affermazioni contribuirà a definire il punteggio della prova. Esercizio 1 Le analisi di seguito riportate si riferiscono ai dati della General Social Survey 2010 (dati USA). La variabile di interesse è la risposta alla domanda ritieni che lo sforzo delle istituzioni per la protezione dell’ambiente sia … con modalità di risposta “troppo basso” oppure “giusto”. La tabella che segue mette in relazione le variabili età (sotto e sopra 30 anni) e la risposta alla domanda. Sono riportate sia le frequenze congiunte assolute sia le condizionate di riga (in %). | sforzo protezione ambiente età | basso giusto | Total -----------+----------------------+----------

=30 | 356 456 | 812 | 43.84 56.16 | 100. -----------+----------------------+---------- <30 | 63 101 | 164 | 38.41 61.59 | 100. -----------+----------------------+---------- Total | 419 557 | 976 | 42.93 57.07 | 100. Si immagine di estrarre a caso un individuo da questa popolazione di 976 soggetti. (i) Sia A l’evento che si verifica se l’individuo estratto ritiene che lo sforzo sia troppo basso e B l’evento che si verifica se l’individuo estratto ha meno di 30 anni. Si calcolino P(A|B) e la P(B|A) e si spieghi che cosa rappresentano i numeri trovati [in altri termini, esprimere a parole che cosa vogliono dire in questo particolare esempio P(A|B) e P(B|A)]. (ii) Si valuti se gli eventi A e B sono o meno indipendenti, motivando la risposta. Si estraggono a caso 2 individui con reinserimento tra i minori di 30 anni. (iii) Si determini la probabilità che entrambi ritengano che lo sforzo sia troppo basso. Ritorniamo ora a considerare i 976 soggetti come facenti parte di un campione casuale della popolazione adulta statunitense. Nella tabella che segue sono riportate nuovamente le frequenze congiunte osservate, le frequenze attese, e i risultati relativi alla verifica di ipotesi di indipendenza delle due variabili nella popolazione complessiva. | sforzo protezione ambiente età | basso giusto | Total -----------+----------------------+---------- =30 | 356 456 | 812 | 348.6 463.4 | 100. -----------+----------------------+---------- <30 | 63 101 | 164 | 70.4 93.6 | 100. -----------+----------------------+---------- Total | 419 557 | 976 | Pearson chi2(1) = 1.6407 Pr = 0. (iv) Si spieghi come è stata derivata la frequenza attesa 348.6, e che cosa rappresenta. (v) Si mostri il sistema di ipotesi sottoposto a verifica. (vi) Si dice che cosa rappresenta il p-value in questo caso e si traggano le opportune conclusioni.

Esercizio 2 Si supponga che il punteggio relativo ad un test che consente di accedere a un servizio di assistenza domiciliare sia distribuito come una v.c. normale di media =80 e deviazione standard =21. (i) Si calcoli la probabilità che un individuo estratto a caso ottenga un punteggio inferiore a 73. (ii) Si calcoli la probabilità che il punteggio medio di un campione casuale di n=25 soggetti sia inferiore a 73. (iii) Si calcoli la probabilità che il punteggio medio di un campione casuale di n=100 soggetti sia inferiore a 73. (iv) Si confrontino i risultati ottenuti ai punti (ii) e (iii). Esercizio 3 Un ente di ricerca viene incaricato di stimare la proporzione di lavoratori maschi che effettuano lavoro nero in un comune, e di valutare se tale proporzione sia in linea con gli obiettivi di riduzione del tasso, che avrebbe dovuto scendere al 20%, o se invece sia più elevato. A questo scopo viene estratto un campione casuale di n =100 lavoratori maschi, ai quali viene chiesto (in forma anonima e da intervistatori esperti) se effettuino lavoro nero. 30 lavoratori dichiarano di lavorare in nero.

  1. Si determini l’intervallo di confidenza al 99% della stima della proporzione di individui che effettuano lavoro nero nella popolazione,
  2. Si verifichi il sistema di ipotesi sopra indicato ad un livello di significatività =0.01.
  3. I risultati di cui ai punti precedenti sono coerenti? Esercizio 4 Da una indagine sulle condizioni di lavoro su un campione di 400 lavoratori dipendenti, si rilevano le retribuzioni e alcune variabili socio-demografiche relative a ciascuno individuo. Per valutare se le donne sono discriminate, si considera un modello di regressione lineare in cui la variabile dipendente è la retribuzione mensile netta in euro, e le variabili indipendenti sono:
  • età (in anni compiuti)
  • genere (0=M, 1=F)
  • titolo di studio (licenza media, diploma di scuola superiore, laurea) Per tenere sotto controllo il titolo di studio si introducono nella regressione le variabili dummy: diploma superiore (1=diploma sup, 0=altro) laurea (1=laurea, 0=altro) Si ottengono le seguenti stime: coef p-value Età 25 0. Genere -160 0. Diploma sup 120 0. Laurea 342 0. Costante 540 0.
  1. Per quale motivo per rispondere all’interrogativo è ragionevole tenere sotto controllo il livello di istruzione?
  2. Si interpretino tutti i coefficienti della regressione.
  3. Si spieghi se alla luce dei risultati trovati si può concludere che le donne sono discriminate.