Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Esercizi di Statistica Sociale: Analisi di Dati e Relazioni tra Variabili - Prof. Rivellin, Prove d'esame di Statistica Sociale

assignment statistica anno 2022/23.

Tipologia: Prove d'esame

2022/2023

Caricato il 06/10/2023

chiiaraferrari
chiiaraferrari 🇮🇹

4.6

(8)

19 documenti

1 / 2

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
ASSIGMENT STATISTICA SOCIALE
Ferrari Chiara
1. all’interno del dataset sono presenti 20 unità statistiche che costituiscono la popolazione in analisi. Su queste
possiamo osservare dei caratteri interessanti per lo studio: il genere degli studenti (carattere qualitativo dicotomico,
caso particolare del carattere qualitativo dove la variabile può essere osservata in due sole modalità); le ore dedicate
allo studio nell’ultima settimana (quantitativo continuo); il numero di persone presenti all’interno del nucleo familiare
di ogni studente (quantitativo discreto); vediamo poi un carattere che definisce se gli studenti sono o meno fuorisede
(qualitativo dicotomico); il numero di episodi di serie TV guardati nell’ultima settimana (quantitativo discreto); la
spesa settimanale, in euro, per il tempo libero (quantitativo discreto/continuo. A rigore è discreto, poiché è possibile
enumerare, ma spesso dato il numero elevato di valori viene trattato come una variabile continua. Si parla anche di
carattere semi-continuo o carattere trasferibile); continuando troviamo un carattere che specifica l’intenzione o
meno, di trascorrere un periodo di studio all’estero e se gli studenti abbiano in passato già effettuato un percorso di
studio all’estero (caratteri qualitativi dicotomici); la spesa effettuata per l’ultimo viaggio all’estero (anche qui, avendo
il carattere espresso in euro vale il ragionamento di cui sopra); troviamo poi il grado di sicurezza percepito nel proprio
quartiere espresso tramite scale di atteggiamento (qualitativo ordinato); infine vediamo il grado di sicurezza nell’usare
i mezzi di trasporto pubblico, sempre tramite scale di atteggiamento (qualitativo ordinato).
2. avendo a che fare con caratteri dicotomici ha senso calcolare la moda (qual è la modalità che presenta la
numerosità/frequenza più alta. Per la variabile Y se utilizziamo i numeri 1 e 0 rispettivamente per si e no vediamo che
la moda M(Y)=0. Procedendo con la stessa modalità vediamo che M(Z)=0.
È anche interessante valutare la distribuzione del fenomeno, calcolando la percentuale di una delle due variabili. Per
le variabili dicotomiche la percentuale è la media. µ(Y)=0,45p à 45% µ(Z)=0,4p à 40%
3. il quantile di ordine 0,1 è 3. Il quantile di ordine 0,9 è 5. In questo caso vediamo l’analisi del fenomeno utilizzando gli
indici di posizione detti quantili, che dividono la distribuzione in determinate percentuali. Nel caso specifico in analisi
sono stati utilizzati i decili c/10 che ci permettono di dividere in 10 parti uguali l’insieme di dati. Per il calcolo
dobbiamo utilizzare la funzione di ripartizione (frequenze relative cumulate) e andremo a valutare quando le cumulate
assumono valori ≥0,1 e ≥0,9.
4. per analizzare le variabili Y e Z congiuntamente occorre costruire una tabella a doppia entrata. Nel caso specifico in
analisi la tabella mostra la relazione tra due variabili dicotomiche, è quindi detta tabella di contingenza. Possiamo
subito vedere che esiste una relazione di dipendenza (ma non di dipendenza perfetta) tra le due variabili, poiché le
distribuzioni relative condizionate risultano diverse tra loro e diverse alla distribuzione marginale; dunque, al variare di
Z varia anche Y (ma non viceversa perché la relazione di dipendenza non è biunivoca).
pf2

Anteprima parziale del testo

Scarica Esercizi di Statistica Sociale: Analisi di Dati e Relazioni tra Variabili - Prof. Rivellin e più Prove d'esame in PDF di Statistica Sociale solo su Docsity!

ASSIGMENT STATISTICA SOCIALE

Ferrari Chiara

  1. all’interno del dataset sono presenti 20 unità statistiche che costituiscono la popolazione in analisi. Su queste possiamo osservare dei caratteri interessanti per lo studio: il genere degli studenti (carattere qualitativo dicotomico, caso particolare del carattere qualitativo dove la variabile può essere osservata in due sole modalità); le ore dedicate allo studio nell’ultima settimana (quantitativo continuo); il numero di persone presenti all’interno del nucleo familiare di ogni studente (quantitativo discreto); vediamo poi un carattere che definisce se gli studenti sono o meno fuorisede (qualitativo dicotomico); il numero di episodi di serie TV guardati nell’ultima settimana (quantitativo discreto); la spesa settimanale, in euro, per il tempo libero (quantitativo discreto/continuo. A rigore è discreto, poiché è possibile enumerare, ma spesso dato il numero elevato di valori viene trattato come una variabile continua. Si parla anche di carattere semi-continuo o carattere trasferibile); continuando troviamo un carattere che specifica l’intenzione o meno, di trascorrere un periodo di studio all’estero e se gli studenti abbiano in passato già effettuato un percorso di studio all’estero (caratteri qualitativi dicotomici); la spesa effettuata per l’ultimo viaggio all’estero (anche qui, avendo il carattere espresso in euro vale il ragionamento di cui sopra); troviamo poi il grado di sicurezza percepito nel proprio quartiere espresso tramite scale di atteggiamento (qualitativo ordinato); infine vediamo il grado di sicurezza nell’usare i mezzi di trasporto pubblico, sempre tramite scale di atteggiamento (qualitativo ordinato).
  2. avendo a che fare con caratteri dicotomici ha senso calcolare la moda (qual è la modalità che presenta la numerosità/frequenza più alta. Per la variabile Y se utilizziamo i numeri 1 e 0 rispettivamente per si e no vediamo che la moda M(Y)=0. Procedendo con la stessa modalità vediamo che M(Z)=0. È anche interessante valutare la distribuzione del fenomeno, calcolando la percentuale di una delle due variabili. Per le variabili dicotomiche la percentuale è la media. μ(Y)=0,45p à 45% μ(Z)=0,4p à 40%
  3. il quantile di ordine 0,1 è 3. Il quantile di ordine 0,9 è 5. In questo caso vediamo l’analisi del fenomeno utilizzando gli indici di posizione detti quantili, che dividono la distribuzione in determinate percentuali. Nel caso specifico in analisi sono stati utilizzati i decili c/10 che ci permettono di dividere in 10 parti uguali l’insieme di dati. Per il calcolo dobbiamo utilizzare la funzione di ripartizione (frequenze relative cumulate) e andremo a valutare quando le cumulate assumono valori ≥0,1 e ≥0,9.
  4. per analizzare le variabili Y e Z congiuntamente occorre costruire una tabella a doppia entrata. Nel caso specifico in analisi la tabella mostra la relazione tra due variabili dicotomiche, è quindi detta tabella di contingenza. Possiamo subito vedere che esiste una relazione di dipendenza (ma non di dipendenza perfetta) tra le due variabili, poiché le distribuzioni relative condizionate risultano diverse tra loro e diverse alla distribuzione marginale; dunque, al variare di Z varia anche Y (ma non viceversa perché la relazione di dipendenza non è biunivoca).

Per misurare la dipendenza (connessione) tra le variabili occorre calcolare c^2. Un indice compreso tra 0 e 1. Sarà pari a 0 in caso di indipendenza stocastica e pari a 1 in caso di massima dipendenza. Nel nostro caso utilizzando il calcolo del chi-quadro e della V di Cramer (^)!! ! !"#$^! ! possiamo arrivare a dire che c^2 =1,008 e V=0,224, quindi tra le due variabili c’è una bassa associazione.

  1. anche in questo caso dobbiamo costruire delle tabelle a doppia entrata, una per i maschi e una per le femmine. Ad occhio vediamo subito che la relazione nel gruppo dei maschi è sicuramente indipendente. Proseguiamo con il calcolo del chi-quadro e V di Cramer. Nel caso delle femmine avremo c^2 =0,178 e V=0,149, una connessione molto bassa; mentre nel caso dei maschi troviamo il caso limite c^2 =0 possiamo quindi dire che vi è assenza di connessione e indipendenza stocastica.
  2. procediamo con il calcolo della proporzione campionaria dei soggetti che non vogliono studiare all’estero (11) e troviamo che 𝑝̅ =0,55. Avendo n𝑝̅ e n(1-𝑝̅ ) ≥5 possiamo approssimare la distribuzione binomiale con la distribuzione normale. La proporziona campionaria, di fatto, presenta la stessa struttura della media campionaria, quindi ha anche le stesse proprietà: non distorsione, consistenza, efficienza.
  3. l’intervallo di confidenza è uno stimatore corretto della proporzione della popolazione e viene utilizzato come stima puntuale. Come già detto la distribuzione binomiale ha le caratteristiche per essere approssimata ad una distribuzione normale. Procedendo con i calcoli troviamo che l’intervallo di confidenza per un livello di confidenza pari a 0,95 è: 0,33<p<0,77. Spostando il livello di confidenza a 0,99 otteniamo: 0,26<p<0,84. Vediamo due intervalli comunque simili. Nel primo avremo il 95% di probabilità di trovare il parametro della popolazione, nel secondo caso avremo il 99%.
  4. prendiamo la variabile quantitativa discreta H. calcolando media pari a 14,98 e varianza pari a 47,95 troviamo che l’intervallo di confidenza per la media è pari a 11,94<μ<18,02. Prendendo quindi il campione rappresentativo questo intervallo di confidenza ci aiuta a scoprire il vero valore che stiamo cercando all’interno della popolazione.