




























































































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
appunti statistica sociale università d'annunzio chieti
Tipologia: Dispense
1 / 149
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!





























































































LA LOGICA DELL’INDAGINE STATISTICA
Assumiamo, come concetti base della Statistica, i seguenti: (a) collettivo ; (b) unità statistica ; (c) fenomeno ; (d) carattere.
Il collettivo, detto anche universo statistico o popolazione , è l’insieme su cui si effettua l’indagine statistica. Le unità statistiche sono gli elementi del collettivo. Esse, a seconda della natura del collettivo, si dicono anche individui , oggetti , osservazioni , esperienze , prove.
Esempi di collettivi sono: (a) la popolazione italiana; (b) le persone sposate; (c) tutti i possibili lanci di un dado; (d) le persone di 50 anni; (e) gli animali; (f) tutte le possibili osservazioni del fenomeno di caduta dei corpi; (g) tutti i possibili tempi di attesa per il verificarsi di un dato evento.
Un collettivo può essere finito o infinito. Sono finiti i collettivi (a), (b), (d), (e), sono infiniti (c), (f), (g). Se un collettivo è numeroso o, addirittura, infinito, non è possibile osservarne tutti gli elementi. E’ allora necessario limitarci ad esaminare i suoi sottoinsiemi finiti, detti campioni e formarci da essi delle opinioni sull’intero collettivo.
Un campione deve avere i seguenti requisiti: (a) essere formato da “ poche ” unità statistiche, per ridurre al minimo i tempi di indagine e di elaborazione e i relativi costi; (b) avere un numero di unità statistiche sufficienti per essere “ rappresentativo ”, ossia tale che dalla sua osservazione si possano avere delle informazioni “ attendibili ” sull’intero collettivo. La rappresentatività di un campione dipende inoltre anche dal modo in cui si scelgono le unità statistiche che ne fanno parte. Il criterio che ci limitiamo a considerare, che unisce i pregi della semplicità e, in genere, della massima rappresentatività , è quello della scelta casuale degli individui del campione. In tale ipotesi il campione si dice casuale. Il numero delle sue unità statistiche si dice ampiezza.
Un campione casuale di ampiezza n può essere di due tipi: (a) con ripetizione se, per ogni intero non negativo j < n , una volta scelti a caso gli oggetti O 1 , O 2 , …, Oj , l’oggetto Oj + 1 è selezionato a caso fra tutti gli elementi del collettivo, compresi quelli già scelti in precedenza; (b) senza ripetizione se, per ogni intero non negativo j < n , una volta scelti a caso gli oggetti O 1 , O 2 , …, Oj , l’oggetto Oj + 1 è selezionato a caso fra gli elementi del collettivo diversi da quelli già scelti. Ai fini delle informazioni che si possono ottenere dal campione sull’intero collettivo i due tipi di campionamento danno gli stessi risultati se la popolazione è infinita. I risultati, inoltre, sono praticamente gli stessi se la popolazione è finita, ma il numero dei suoi elementi è molto maggiore dell’ampiezza del campione.
Un fenomeno (dal greco, ciò che appare ) è ciò che si osserva negli elementi di un collettivo. Ad esempio, nel collettivo “insieme degli Italiani” sono fenomeni: (a) il reddito; (b) la nascita di un figlio; (c) la permanenza in vita per altri 10 anni;
Se V è un sottoinsieme di R, insieme dei numeri reali, il carattere si dice quantitativo ; se V è un insieme d’attributi il carattere si dice qualitativo.
Ad esempio, se U è l’insieme degli Italiani, sono quantitativi i caratteri: (a) l’età; (b) il peso; (c) il reddito annuo; e sono qualitativi i caratteri: (d) il titolo di studio; (e) il colore dei capelli. Nel caso (d) l’insieme delle modalità può essere { nessun titolo , licenza media , maturità classica , maturità scientifica , …} e nel caso (e) { nero , castano , biondo , calvo , …}.
In alcuni testi si usa il nome di variabile solo per i caratteri quantitativi e si chiamano mutabili quelli qualitativi. Di recente però, per motivi di omogeneità di trattazione, è emersa la tendenza, a cui ci atteniamo, di usare il nome di variabile come sinonimo di carattere.
I caratteri quantitativi, in base al loro significato, vanno divisi in: (a) caratteri sostanzialmente quantitativi, se i valori assunti hanno il significato di “ misura dell’intensità ” di un certo fenomeno; (b) caratteri apparentemente quantitativi, assimilabili a quelli qualitativi, in caso contrario. Ad esempio, il carattere “altezza degli Italiani” è sostanzialmente quantitativo. Se consideriamo l’insieme {1, 2} e la funzione X che ad ogni elemento del collettivo “Italiani” associa 1 se l’individuo è maschio e 2 se è femmina, si ha un carattere apparentemente quantitativo. Un carattere qualitativo, o apparentemente quantitativo, per il quale esista un ordinamento totale delle modalità prende il nome di variabile ordinata.
Per descrivere un fenomeno si considera un insieme ordinato X = { X 1 , X 2 , …, Xn } di variabili che si ritiene possano rappresentare il fenomeno e si chiama andamento del fenomeno l’insieme dei valori assunti da tali variabili nei vari oggetti del collettivo. Chiamiamo X insieme delle variabili associate al fenomeno o che definiscono il fenomeno. Ad esempio, il fenomeno “ ricchezza degli Italiani ” potrebbe essere descritto dall’insieme delle variabili: X 1 : reddito denunciato; X 2 : valore degli immobili e dei terreni posseduti; X 3 : ammontare del conto in banca; X 4 : numero di automobili possedute.
Supponiamo di voler studiare un fenomeno e di dover svolgere, a questo scopo, un’indagine statistica. I primi problemi che si presentano sono: (a) definire il collettivo e le unità statistiche; (b) decidere quale insieme di variabili è opportuno considerare per definire il fenomeno. La soluzione dei due problemi non è univoca e dipende da tanti fattori, fra cui (1) lo scopo dell’indagine; (2) i mezzi economici a disposizione; (3) i tempi; (4) le persone che lavorano all’indagine.
Cominciamo con il considerare il problema (a). Esso non è semplice da affrontare come potrebbe sembrare da un’analisi superficiale.
L’elemento generico aij all’interno della matrice è il valore che il carattere j - esimo assume nell’unità i -esima. Supponiamo che l’universo statistico sia formato da m oggetti O 1 , O 2 , …, Om e che il fenomeno sia definito da n variabili X 1 , X 2 , …, Xn. Detto aij il valore assunto nell’oggetto Oi dalla variabile Xj , per i = 1, 2, …, m e j = 1, 2, …, n , il risultato dell’indagine statistica viene rappresentato per mezzo della seguente tabella, detta matrice oggetti- caratteri :
caratteri
X 1 X 2 X 3 … Xj … Xn
O 1 a 11 A 12 a 13 … a 1 j … a 1 n
O 2 a 21 A 22 a 23 … a 2 j … a 2 n
O 3 a 31 A 32 a 33 … a 3 j … a 3 n
… … … … … …
Oi ai 1 ai 2 ai 3 … aij … ain
... … … … … …
Om am 1 am 2 am 3 ... amj ... amn
Tabella 1.
Essa è anche detta tabella oggetti-modalità o, se i caratteri sono tutti quantitativi (sostanzialmente), tabella oggetti-intensità. Il passaggio dal mondo reale alla tabella 1.1 è il processo di astrazione o di costruzione del modello matematico del problema.
Come esempio di matrice di dati si consideri quella riportata nella tabella 1.2: vi è riprodotta un’osservazione effettuata su un campione di 9 studenti sui quali sono state rilevate informazioni circa le ore dedicate allo studio, le ore dedicate allo sport, il tipo di attività
oggetti
sportiva svolta in prevalenza, le ore dedicate alla navigazione in Internet. I valori sono stati inseriti avendo come riferimento per riga gli oggetti (gli studenti) e per colonna le variabili (attività svolte e il tempo dedicato).
Celestino 1 3 surf 20
Felipe 2 1 pallavolo 40
Paolo 2 2 tennis 60
M atteo 2 1 pallavolo 20
Emiliano 4 0 nessuna 30
M ario 2 1 palestra 0
Giovanni 1 1 calcio 40
Andrea 3 0 nessuna 30
Alessandro 1 2 calcio 0
studenti orestudio oresport attivitàsportiva internet ( inminuti )
Tabella 1.2 : Indagine statistica sulle attività svolte dagli studenti in una giornata
Nella tabella 1.2 sono quantitative le variabili ore studio , ore sport , internet mentre attività sportiva è una variabile qualitativa.
Esempio 1. Si supponga di voler localizzare, in Abruzzo, una nuova Facoltà universitaria, che si prevede affollata da molti studenti, ad esempio la Facoltà di Turismo. Si chiede di effettuare un’indagine statistica per procedere alla scelta della sede.
Considerazioni e suggerimenti. Il collettivo è un insieme di città dell’Abruzzo. Il fenomeno è “idoneità delle città ad essere sede della Facoltà di Turismo”.
Chieti L’Aquila Teramo … Pescara
U V = insieme dei numeri naturali
X 1
Figura 1.
Un fenomeno, a sua volta, può essere definito come un insieme di variabili statistiche. Il fenomeno della tabella 1.3 è l’insieme delle variabili statistiche X 1, X 2, X 3.
Si suggeriscono di seguito ulteriori esercizi.
Esercizio 1. Indagine statistica sulle caratteristiche delle famiglie degli studenti.
Considerazioni e suggerimenti. Il collettivo può essere una classe o più classi di un istituto superiore. Esempi di variabili sono: il numero dei fratelli o sorelle, l’età di ciascun genitore, il numero di stanze della casa.
Esercizio 1. Indagine statistica sulle caratteristiche degli allievi.
Considerazioni e suggerimenti. Alcune variabili sono: l’età, il sesso, l’altezza, il peso, il colore dei capelli. Esercizio 1. Indagine statistica sul clima di una città.
Considerazioni e suggerimenti. Si può assumere come collettivo un insieme di date in cui si eseguono i rilevamenti. Alcune variabili possono essere la pressione, l’umidità, la presenza o assenza di pioggia, la temperatura.
Esercizio 1. Indagine statistica per scegliere la città in Abruzzo sede della nuova Facoltà di Turismo, che si prevede affollata da molti studenti.
Considerazioni e suggerimenti. Il collettivo è un insieme di città abruzzesi. Alcune variabili potrebbero essere: il numero di monumenti, il numero di alberghi, il numero dei negozi, il numero di case disponibili all’affitto, una misura del servizio dei trasporti.
Supponiamo di avere un collettivo U formato da m unità statistiche O 1 , O 2 , …, Om e che X sia un carattere definito in U , con insieme di valori V. La tabella 1.1 si riduce alla caratteri
oggetti
Om am
O a
O a
2 2
1 1
Tabella 1.
con a 1 , a 2 , …, am elementi di V.
Esempio 1. Supponiamo di avere un collettivo di 40 studenti e sia X la variabile statistica “ sesso dello studente ”. La corrispondente tabella oggetti-caratteri è:
Tabella 1.
Oltre ad essere laboriosa da compilare, tale tabella non ci offre indicazioni significative. Si preferisce allora sostituirla con la seguente:
Tabella 1.
Studenti sesso O 1 O 2 O 3 . . O 40
Sesso frequenze assolute
totale 40
Si vede che 26 è la frequenza assoluta della modalità M (maschio) del carattere “sesso”, 14 è la frequenza assoluta della modalità F (femmina). Naturalmente si ha 26 + 14 = 40.
Sia X una variabile statistica su un collettivo con n elementi che assume i valori v 1 , v 2 , …, vk rispettivamente con frequenze assolute n 1 , n 2 , …, nk. Si dicono frequenze relative , o semplicemente frequenze , di X i rapporti
fi = n
ni , i = 1, 2, …, k. (1.1)
Si dicono frequenze percentuali di X i numeri
hi = 100 fi , i = 1, 2, …, k.
Si noti che
1 1
n
n n
n f
k
i
i k
i
i^ (1.2)
vale a dire, la somma delle frequenze di X è, qualunque sia il collettivo, sempre uguale ad 1 e, necessariamente, quella delle frequenze percentuali sempre uguale a 100. La trasformazione delle frequenze assolute in frequenze relative consente di effettuare confronti fra le distribuzioni delle modalità di una stessa variabile riferiti a collettivi aventi diversa ampiezza, ad esempio gli abitanti di Pescara e quelli di Roma.
Le tabelle formate da due colonne, la prima con i valori assunti da X , l’altra con le corrispondenti frequenze percentuali, si dicono distribuzioni delle frequenze o delle frequenze percentuali di X.
Tabella 1.
Esempio 1. Sia U l’insieme dei 160 studenti di una certa scuola superiore e sia X la variabile statistica “altezza in cm”. Si potrebbero riportare i risultati su una tabella oggetti-caratteri
Tabella 1.
oppure eseguire una partizione dell’insieme dei valori assunti, un esempio potrebbe essere
c 1 = valori inferiori a 140 cm; c 2 = valori non inferiori a 140 cm e inferiori a 155;
valori di^ X frequenze assolute c 1 c 2 . . . ck
n 1 n 2 . . . nk
totale n
Studenti altezza in cm O 1 O 2 O 3 O 4 . . O 160
c 3 = valori non inferiori a 155 cm e inferiori a 170; c 4 = valori non inferiori a 170 cm e inferiori a 185; c 5 = valori non inferiori a 185 e considerare un’altra rappresentazione più sintetica e efficace
Tabella 1.
Alla classe c 1 è assegnata la frequenza assoluta 4, cioè ci sono 4 studenti dell’istituto che hanno un’altezza inferiore ai 140 cm, e così via per le altre classi.
Esempio 1. Si sia rilevata la superficie, espressa in mq., di 1000 appartamenti in cui risiedono altrettanti capifamiglia; si ha
valori di X frequenze assolute
c 1 c 2 c 3 c 4 c 5
totale 160