
ASSIGMENT STATISTICA SOCIALE
Ferrari Chiara
1. all’interno del dataset sono presenti 20 unità statistiche che costituiscono la popolazione in analisi. Su queste
possiamo osservare dei caratteri interessanti per lo studio: il genere degli studenti (carattere qualitativo dicotomico,
caso particolare del carattere qualitativo dove la variabile può essere osservata in due sole modalità); le ore dedicate
allo studio nell’ultima settimana (quantitativo continuo); il numero di persone presenti all’interno del nucleo familiare
di ogni studente (quantitativo discreto); vediamo poi un carattere che definisce se gli studenti sono o meno fuorisede
(qualitativo dicotomico); il numero di episodi di serie TV guardati nell’ultima settimana (quantitativo discreto); la
spesa settimanale, in euro, per il tempo libero (quantitativo discreto/continuo. A rigore è discreto, poiché è possibile
enumerare, ma spesso dato il numero elevato di valori viene trattato come una variabile continua. Si parla anche di
carattere semi-continuo o carattere trasferibile); continuando troviamo un carattere che specifica l’intenzione o
meno, di trascorrere un periodo di studio all’estero e se gli studenti abbiano in passato già effettuato un percorso di
studio all’estero (caratteri qualitativi dicotomici); la spesa effettuata per l’ultimo viaggio all’estero (anche qui, avendo
il carattere espresso in euro vale il ragionamento di cui sopra); troviamo poi il grado di sicurezza percepito nel proprio
quartiere espresso tramite scale di atteggiamento (qualitativo ordinato); infine vediamo il grado di sicurezza nell’usare
i mezzi di trasporto pubblico, sempre tramite scale di atteggiamento (qualitativo ordinato).
2. avendo a che fare con caratteri dicotomici ha senso calcolare la moda (qual è la modalità che presenta la
numerosità/frequenza più alta. Per la variabile Y se utilizziamo i numeri 1 e 0 rispettivamente per si e no vediamo che
la moda M(Y)=0. Procedendo con la stessa modalità vediamo che M(Z)=0.
È anche interessante valutare la distribuzione del fenomeno, calcolando la percentuale di una delle due variabili. Per
le variabili dicotomiche la percentuale è la media. µ(Y)=0,45p à 45% µ(Z)=0,4p à 40%
3. il quantile di ordine 0,1 è 3. Il quantile di ordine 0,9 è 5. In questo caso vediamo l’analisi del fenomeno utilizzando gli
indici di posizione detti quantili, che dividono la distribuzione in determinate percentuali. Nel caso specifico in analisi
sono stati utilizzati i decili c/10 che ci permettono di dividere in 10 parti uguali l’insieme di dati. Per il calcolo
dobbiamo utilizzare la funzione di ripartizione (frequenze relative cumulate) e andremo a valutare quando le cumulate
assumono valori ≥0,1 e ≥0,9.
4. per analizzare le variabili Y e Z congiuntamente occorre costruire una tabella a doppia entrata. Nel caso specifico in
analisi la tabella mostra la relazione tra due variabili dicotomiche, è quindi detta tabella di contingenza. Possiamo
subito vedere che esiste una relazione di dipendenza (ma non di dipendenza perfetta) tra le due variabili, poiché le
distribuzioni relative condizionate risultano diverse tra loro e diverse alla distribuzione marginale; dunque, al variare di
Z varia anche Y (ma non viceversa perché la relazione di dipendenza non è biunivoca).