ASSIGMENT STATISTICA SOCIALE

Ferrari Chiara

1. all’interno del dataset sono presenti 20 unità statistiche che costituiscono la popolazione in analisi. Su queste

possiamo osservare dei caratteri interessanti per lo studio: il genere degli studenti (carattere qualitativo dicotomico,

caso particolare del carattere qualitativo dove la variabile può essere osservata in due sole modalità); le ore dedicate

allo studio nell’ultima settimana (quantitativo continuo); il numero di persone presenti all’interno del nucleo familiare

di ogni studente (quantitativo discreto); vediamo poi un carattere che definisce se gli studenti sono o meno fuorisede

(qualitativo dicotomico); il numero di episodi di serie TV guardati nell’ultima settimana (quantitativo discreto); la

spesa settimanale, in euro, per il tempo libero (quantitativo discreto/continuo. A rigore è discreto, poiché è possibile

enumerare, ma spesso dato il numero elevato di valori viene trattato come una variabile continua. Si parla anche di

carattere semi-continuo o carattere trasferibile); continuando troviamo un carattere che specifica l’intenzione o

meno, di trascorrere un periodo di studio all’estero e se gli studenti abbiano in passato già effettuato un percorso di

studio all’estero (caratteri qualitativi dicotomici); la spesa effettuata per l’ultimo viaggio all’estero (anche qui, avendo

il carattere espresso in euro vale il ragionamento di cui sopra); troviamo poi il grado di sicurezza percepito nel proprio

quartiere espresso tramite scale di atteggiamento (qualitativo ordinato); infine vediamo il grado di sicurezza nell’usare

i mezzi di trasporto pubblico, sempre tramite scale di atteggiamento (qualitativo ordinato).

2. avendo a che fare con caratteri dicotomici ha senso calcolare la moda (qual è la modalità che presenta la

numerosità/frequenza più alta. Per la variabile Y se utilizziamo i numeri 1 e 0 rispettivamente per si e no vediamo che

la moda M(Y)=0. Procedendo con la stessa modalità vediamo che M(Z)=0.

È anche interessante valutare la distribuzione del fenomeno, calcolando la percentuale di una delle due variabili. Per

le variabili dicotomiche la percentuale è la media. µ(Y)=0,45p à 45% µ(Z)=0,4p à 40%

3. il quantile di ordine 0,1 è 3. Il quantile di ordine 0,9 è 5. In questo caso vediamo l’analisi del fenomeno utilizzando gli

indici di posizione detti quantili, che dividono la distribuzione in determinate percentuali. Nel caso specifico in analisi

sono stati utilizzati i decili c/10 che ci permettono di dividere in 10 parti uguali l’insieme di dati. Per il calcolo

dobbiamo utilizzare la funzione di ripartizione (frequenze relative cumulate) e andremo a valutare quando le cumulate

assumono valori ≥0,1 e ≥0,9.

4. per analizzare le variabili Y e Z congiuntamente occorre costruire una tabella a doppia entrata. Nel caso specifico in

analisi la tabella mostra la relazione tra due variabili dicotomiche, è quindi detta tabella di contingenza. Possiamo

subito vedere che esiste una relazione di dipendenza (ma non di dipendenza perfetta) tra le due variabili, poiché le

distribuzioni relative condizionate risultano diverse tra loro e diverse alla distribuzione marginale; dunque, al variare di

Z varia anche Y (ma non viceversa perché la relazione di dipendenza non è biunivoca).

Anteprima parziale del testo

Scarica Esercizi di Statistica Sociale: Analisi di Dati e Relazioni tra Variabili - Prof. Rivellin e più Prove d'esame in PDF di Statistica Sociale solo su Docsity!

ASSIGMENT STATISTICA SOCIALE

Ferrari Chiara

all’interno del dataset sono presenti 20 unità statistiche che costituiscono la popolazione in analisi. Su queste possiamo osservare dei caratteri interessanti per lo studio: il genere degli studenti (carattere qualitativo dicotomico, caso particolare del carattere qualitativo dove la variabile può essere osservata in due sole modalità); le ore dedicate allo studio nell’ultima settimana (quantitativo continuo); il numero di persone presenti all’interno del nucleo familiare di ogni studente (quantitativo discreto); vediamo poi un carattere che definisce se gli studenti sono o meno fuorisede (qualitativo dicotomico); il numero di episodi di serie TV guardati nell’ultima settimana (quantitativo discreto); la spesa settimanale, in euro, per il tempo libero (quantitativo discreto/continuo. A rigore è discreto, poiché è possibile enumerare, ma spesso dato il numero elevato di valori viene trattato come una variabile continua. Si parla anche di carattere semi-continuo o carattere trasferibile); continuando troviamo un carattere che specifica l’intenzione o meno, di trascorrere un periodo di studio all’estero e se gli studenti abbiano in passato già effettuato un percorso di studio all’estero (caratteri qualitativi dicotomici); la spesa effettuata per l’ultimo viaggio all’estero (anche qui, avendo il carattere espresso in euro vale il ragionamento di cui sopra); troviamo poi il grado di sicurezza percepito nel proprio quartiere espresso tramite scale di atteggiamento (qualitativo ordinato); infine vediamo il grado di sicurezza nell’usare i mezzi di trasporto pubblico, sempre tramite scale di atteggiamento (qualitativo ordinato).
avendo a che fare con caratteri dicotomici ha senso calcolare la moda (qual è la modalità che presenta la numerosità/frequenza più alta. Per la variabile Y se utilizziamo i numeri 1 e 0 rispettivamente per si e no vediamo che la moda M(Y)=0. Procedendo con la stessa modalità vediamo che M(Z)=0. È anche interessante valutare la distribuzione del fenomeno, calcolando la percentuale di una delle due variabili. Per le variabili dicotomiche la percentuale è la media. μ(Y)=0,45p à 45% μ(Z)=0,4p à 40%
il quantile di ordine 0,1 è 3. Il quantile di ordine 0,9 è 5. In questo caso vediamo l’analisi del fenomeno utilizzando gli indici di posizione detti quantili, che dividono la distribuzione in determinate percentuali. Nel caso specifico in analisi sono stati utilizzati i decili c/10 che ci permettono di dividere in 10 parti uguali l’insieme di dati. Per il calcolo dobbiamo utilizzare la funzione di ripartizione (frequenze relative cumulate) e andremo a valutare quando le cumulate assumono valori ≥0,1 e ≥0,9.
per analizzare le variabili Y e Z congiuntamente occorre costruire una tabella a doppia entrata. Nel caso specifico in analisi la tabella mostra la relazione tra due variabili dicotomiche, è quindi detta tabella di contingenza. Possiamo subito vedere che esiste una relazione di dipendenza (ma non di dipendenza perfetta) tra le due variabili, poiché le distribuzioni relative condizionate risultano diverse tra loro e diverse alla distribuzione marginale; dunque, al variare di Z varia anche Y (ma non viceversa perché la relazione di dipendenza non è biunivoca).

Per misurare la dipendenza (connessione) tra le variabili occorre calcolare c^2. Un indice compreso tra 0 e 1. Sarà pari a 0 in caso di indipendenza stocastica e pari a 1 in caso di massima dipendenza. Nel nostro caso utilizzando il calcolo del chi-quadro e della V di Cramer (^)!! ! !"#$^! ! possiamo arrivare a dire che c^2 =1,008 e V=0,224, quindi tra le due variabili c’è una bassa associazione.

anche in questo caso dobbiamo costruire delle tabelle a doppia entrata, una per i maschi e una per le femmine. Ad occhio vediamo subito che la relazione nel gruppo dei maschi è sicuramente indipendente. Proseguiamo con il calcolo del chi-quadro e V di Cramer. Nel caso delle femmine avremo c^2 =0,178 e V=0,149, una connessione molto bassa; mentre nel caso dei maschi troviamo il caso limite c^2 =0 possiamo quindi dire che vi è assenza di connessione e indipendenza stocastica.
procediamo con il calcolo della proporzione campionaria dei soggetti che non vogliono studiare all’estero (11) e troviamo che 𝑝̅ =0,55. Avendo n𝑝̅ e n(1-𝑝̅ ) ≥5 possiamo approssimare la distribuzione binomiale con la distribuzione normale. La proporziona campionaria, di fatto, presenta la stessa struttura della media campionaria, quindi ha anche le stesse proprietà: non distorsione, consistenza, efficienza.
l’intervallo di confidenza è uno stimatore corretto della proporzione della popolazione e viene utilizzato come stima puntuale. Come già detto la distribuzione binomiale ha le caratteristiche per essere approssimata ad una distribuzione normale. Procedendo con i calcoli troviamo che l’intervallo di confidenza per un livello di confidenza pari a 0,95 è: 0,33<p<0,77. Spostando il livello di confidenza a 0,99 otteniamo: 0,26<p<0,84. Vediamo due intervalli comunque simili. Nel primo avremo il 95% di probabilità di trovare il parametro della popolazione, nel secondo caso avremo il 99%.
prendiamo la variabile quantitativa discreta H. calcolando media pari a 14,98 e varianza pari a 47,95 troviamo che l’intervallo di confidenza per la media è pari a 11,94<μ<18,02. Prendendo quindi il campione rappresentativo questo intervallo di confidenza ci aiuta a scoprire il vero valore che stiamo cercando all’interno della popolazione.

Esercizi di Statistica Sociale: Analisi di Dati e Relazioni tra Variabili - Prof. Rivellin, Prove d'esame di Statistica Sociale

Documenti correlati

Anteprima parziale del testo

Scarica Esercizi di Statistica Sociale: Analisi di Dati e Relazioni tra Variabili - Prof. Rivellin e più Prove d'esame in PDF di Statistica Sociale solo su Docsity!

ASSIGMENT STATISTICA SOCIALE