Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Introduzione alla Statistica: Variabili, Frequenze e Rappresentazioni Grafiche, Dispense di Statistica

appunti statistica sociale università d'annunzio chieti

Tipologia: Dispense

2014/2015

Caricato il 07/12/2015

Vega1985
Vega1985 🇮🇹

4.3

(12)

22 documenti

1 / 149

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
5
Indice
Prefazione 5
Capitolo 1 La logica dell’indagine statistica 8
1.1. Concetti fondamentali della statistica 8
1.2. Costruzione di un modello matematico di un fenomeno
reale 12
1.3. Rappresentazione di una distribuzione statistica ad una
dimensione 18
1.4. Variabili statistiche con modalità raggruppate 22
Capitolo 2 Raccolta, registrazione e rappresentazione
dei dati 27
2.1. Rilevazione dei dati 27
2.2. Elaborazione dei dati 29
2.3. Perequazione aritmetica o meccanica 32
2.4. Perequazione analitica 34
2.5. Variabili finite, discrete, continue 37
2.6. Rappresentazione grafica di una distribuzione statistica 39
2.7. Funzione di ripartizione 47
Capitolo 3 Indici di posizione 52
3.1. Medie ferme 52
3.2. Applicazioni delle medie 37
3.3. Medie lasche 42
Capitolo 4 Indici di variabilità 53
4.1. La nozione di variabili 53
4.2. Gamma e distanza interquantile 55
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Anteprima parziale del testo

Scarica Introduzione alla Statistica: Variabili, Frequenze e Rappresentazioni Grafiche e più Dispense in PDF di Statistica solo su Docsity!

Indice

Capitolo 1

LA LOGICA DELL’INDAGINE STATISTICA

1.1. Concetti fondamentali della Statistica

Assumiamo, come concetti base della Statistica, i seguenti: (a) collettivo ; (b) unità statistica ; (c) fenomeno ; (d) carattere.

Il collettivo, detto anche universo statistico o popolazione , è l’insieme su cui si effettua l’indagine statistica. Le unità statistiche sono gli elementi del collettivo. Esse, a seconda della natura del collettivo, si dicono anche individui , oggetti , osservazioni , esperienze , prove.

Esempi di collettivi sono: (a) la popolazione italiana; (b) le persone sposate; (c) tutti i possibili lanci di un dado; (d) le persone di 50 anni; (e) gli animali; (f) tutte le possibili osservazioni del fenomeno di caduta dei corpi; (g) tutti i possibili tempi di attesa per il verificarsi di un dato evento.

Un collettivo può essere finito o infinito. Sono finiti i collettivi (a), (b), (d), (e), sono infiniti (c), (f), (g). Se un collettivo è numeroso o, addirittura, infinito, non è possibile osservarne tutti gli elementi. E’ allora necessario limitarci ad esaminare i suoi sottoinsiemi finiti, detti campioni e formarci da essi delle opinioni sull’intero collettivo.

Un campione deve avere i seguenti requisiti: (a) essere formato da “ poche ” unità statistiche, per ridurre al minimo i tempi di indagine e di elaborazione e i relativi costi; (b) avere un numero di unità statistiche sufficienti per essere “ rappresentativo ”, ossia tale che dalla sua osservazione si possano avere delle informazioni “ attendibili ” sull’intero collettivo. La rappresentatività di un campione dipende inoltre anche dal modo in cui si scelgono le unità statistiche che ne fanno parte. Il criterio che ci limitiamo a considerare, che unisce i pregi della semplicità e, in genere, della massima rappresentatività , è quello della scelta casuale degli individui del campione. In tale ipotesi il campione si dice casuale. Il numero delle sue unità statistiche si dice ampiezza.

Un campione casuale di ampiezza n può essere di due tipi: (a) con ripetizione se, per ogni intero non negativo j < n , una volta scelti a caso gli oggetti O 1 , O 2 , …, Oj , l’oggetto Oj + 1 è selezionato a caso fra tutti gli elementi del collettivo, compresi quelli già scelti in precedenza; (b) senza ripetizione se, per ogni intero non negativo j < n , una volta scelti a caso gli oggetti O 1 , O 2 , …, Oj , l’oggetto Oj + 1 è selezionato a caso fra gli elementi del collettivo diversi da quelli già scelti. Ai fini delle informazioni che si possono ottenere dal campione sull’intero collettivo i due tipi di campionamento danno gli stessi risultati se la popolazione è infinita. I risultati, inoltre, sono praticamente gli stessi se la popolazione è finita, ma il numero dei suoi elementi è molto maggiore dell’ampiezza del campione.

Un fenomeno (dal greco, ciò che appare ) è ciò che si osserva negli elementi di un collettivo. Ad esempio, nel collettivo “insieme degli Italiani” sono fenomeni: (a) il reddito; (b) la nascita di un figlio; (c) la permanenza in vita per altri 10 anni;

Se V è un sottoinsieme di R, insieme dei numeri reali, il carattere si dice quantitativo ; se V è un insieme d’attributi il carattere si dice qualitativo.

Ad esempio, se U è l’insieme degli Italiani, sono quantitativi i caratteri: (a) l’età; (b) il peso; (c) il reddito annuo; e sono qualitativi i caratteri: (d) il titolo di studio; (e) il colore dei capelli. Nel caso (d) l’insieme delle modalità può essere { nessun titolo , licenza media , maturità classica , maturità scientifica , …} e nel caso (e) { nero , castano , biondo , calvo , …}.

In alcuni testi si usa il nome di variabile solo per i caratteri quantitativi e si chiamano mutabili quelli qualitativi. Di recente però, per motivi di omogeneità di trattazione, è emersa la tendenza, a cui ci atteniamo, di usare il nome di variabile come sinonimo di carattere.

I caratteri quantitativi, in base al loro significato, vanno divisi in: (a) caratteri sostanzialmente quantitativi, se i valori assunti hanno il significato di “ misura dell’intensità ” di un certo fenomeno; (b) caratteri apparentemente quantitativi, assimilabili a quelli qualitativi, in caso contrario. Ad esempio, il carattere “altezza degli Italiani” è sostanzialmente quantitativo. Se consideriamo l’insieme {1, 2} e la funzione X che ad ogni elemento del collettivo “Italiani” associa 1 se l’individuo è maschio e 2 se è femmina, si ha un carattere apparentemente quantitativo. Un carattere qualitativo, o apparentemente quantitativo, per il quale esista un ordinamento totale delle modalità prende il nome di variabile ordinata.

Per descrivere un fenomeno si considera un insieme ordinato X = { X 1 , X 2 , …, Xn } di variabili che si ritiene possano rappresentare il fenomeno e si chiama andamento del fenomeno l’insieme dei valori assunti da tali variabili nei vari oggetti del collettivo. Chiamiamo X insieme delle variabili associate al fenomeno o che definiscono il fenomeno. Ad esempio, il fenomeno “ ricchezza degli Italiani ” potrebbe essere descritto dall’insieme delle variabili: X 1 : reddito denunciato; X 2 : valore degli immobili e dei terreni posseduti; X 3 : ammontare del conto in banca; X 4 : numero di automobili possedute.

1.2.Costruzione di un modello matematico di un

fenomeno reale

Supponiamo di voler studiare un fenomeno e di dover svolgere, a questo scopo, un’indagine statistica. I primi problemi che si presentano sono: (a) definire il collettivo e le unità statistiche; (b) decidere quale insieme di variabili è opportuno considerare per definire il fenomeno. La soluzione dei due problemi non è univoca e dipende da tanti fattori, fra cui (1) lo scopo dell’indagine; (2) i mezzi economici a disposizione; (3) i tempi; (4) le persone che lavorano all’indagine.

Cominciamo con il considerare il problema (a). Esso non è semplice da affrontare come potrebbe sembrare da un’analisi superficiale.

L’elemento generico aij all’interno della matrice è il valore che il carattere j - esimo assume nell’unità i -esima. Supponiamo che l’universo statistico sia formato da m oggetti O 1 , O 2 , …, Om e che il fenomeno sia definito da n variabili X 1 , X 2 , …, Xn. Detto aij il valore assunto nell’oggetto Oi dalla variabile Xj , per i = 1, 2, …, m e j = 1, 2, …, n , il risultato dell’indagine statistica viene rappresentato per mezzo della seguente tabella, detta matrice oggetti- caratteri :

caratteri

X 1 X 2 X 3 … Xj … Xn

O 1 a 11 A 12 a 13 … a 1 ja 1 n

O 2 a 21 A 22 a 23 … a 2 ja 2 n

O 3 a 31 A 32 a 33 … a 3 ja 3 n

… … … … … …

Oi ai 1 ai 2 ai 3 … aijain

... … … … … …

Om am 1 am 2 am 3 ... amj ... amn

Tabella 1.

Essa è anche detta tabella oggetti-modalità o, se i caratteri sono tutti quantitativi (sostanzialmente), tabella oggetti-intensità. Il passaggio dal mondo reale alla tabella 1.1 è il processo di astrazione o di costruzione del modello matematico del problema.

Come esempio di matrice di dati si consideri quella riportata nella tabella 1.2: vi è riprodotta un’osservazione effettuata su un campione di 9 studenti sui quali sono state rilevate informazioni circa le ore dedicate allo studio, le ore dedicate allo sport, il tipo di attività

oggetti

sportiva svolta in prevalenza, le ore dedicate alla navigazione in Internet. I valori sono stati inseriti avendo come riferimento per riga gli oggetti (gli studenti) e per colonna le variabili (attività svolte e il tempo dedicato).

Celestino 1 3 surf 20

Felipe 2 1 pallavolo 40

Paolo 2 2 tennis 60

M atteo 2 1 pallavolo 20

Emiliano 4 0 nessuna 30

M ario 2 1 palestra 0

Giovanni 1 1 calcio 40

Andrea 3 0 nessuna 30

Alessandro 1 2 calcio 0

studenti orestudio oresport attivitàsportiva internet ( inminuti )

Tabella 1.2 : Indagine statistica sulle attività svolte dagli studenti in una giornata

Nella tabella 1.2 sono quantitative le variabili ore studio , ore sport , internet mentre attività sportiva è una variabile qualitativa.

Esempio 1. Si supponga di voler localizzare, in Abruzzo, una nuova Facoltà universitaria, che si prevede affollata da molti studenti, ad esempio la Facoltà di Turismo. Si chiede di effettuare un’indagine statistica per procedere alla scelta della sede.

Considerazioni e suggerimenti. Il collettivo è un insieme di città dell’Abruzzo. Il fenomeno è “idoneità delle città ad essere sede della Facoltà di Turismo”.

Chieti L’Aquila Teramo … Pescara

U V = insieme dei numeri naturali

X 1

Figura 1.

Un fenomeno, a sua volta, può essere definito come un insieme di variabili statistiche. Il fenomeno della tabella 1.3 è l’insieme delle variabili statistiche X 1, X 2, X 3.

Si suggeriscono di seguito ulteriori esercizi.

Esercizio 1. Indagine statistica sulle caratteristiche delle famiglie degli studenti.

Considerazioni e suggerimenti. Il collettivo può essere una classe o più classi di un istituto superiore. Esempi di variabili sono: il numero dei fratelli o sorelle, l’età di ciascun genitore, il numero di stanze della casa.

Esercizio 1. Indagine statistica sulle caratteristiche degli allievi.

Considerazioni e suggerimenti. Alcune variabili sono: l’età, il sesso, l’altezza, il peso, il colore dei capelli. Esercizio 1. Indagine statistica sul clima di una città.

Considerazioni e suggerimenti. Si può assumere come collettivo un insieme di date in cui si eseguono i rilevamenti. Alcune variabili possono essere la pressione, l’umidità, la presenza o assenza di pioggia, la temperatura.

Esercizio 1. Indagine statistica per scegliere la città in Abruzzo sede della nuova Facoltà di Turismo, che si prevede affollata da molti studenti.

Considerazioni e suggerimenti. Il collettivo è un insieme di città abruzzesi. Alcune variabili potrebbero essere: il numero di monumenti, il numero di alberghi, il numero dei negozi, il numero di case disponibili all’affitto, una misura del servizio dei trasporti.

1.3. Rappresentazione di una distribuzione statistica

ad una dimensione

Supponiamo di avere un collettivo U formato da m unità statistiche O 1 , O 2 , …, Om e che X sia un carattere definito in U , con insieme di valori V. La tabella 1.1 si riduce alla caratteri

oggetti

Om am

O a

O a

X

2 2

1 1

Tabella 1.

con a 1 , a 2 , …, am elementi di V.

Esempio 1. Supponiamo di avere un collettivo di 40 studenti e sia X la variabile statistica “ sesso dello studente ”. La corrispondente tabella oggetti-caratteri è:

Tabella 1.

Oltre ad essere laboriosa da compilare, tale tabella non ci offre indicazioni significative. Si preferisce allora sostituirla con la seguente:

Tabella 1.

Studenti sesso O 1 O 2 O 3 . . O 40

M F F.. M

Sesso frequenze assolute

M

F

_______________

totale 40

Si vede che 26 è la frequenza assoluta della modalità M (maschio) del carattere “sesso”, 14 è la frequenza assoluta della modalità F (femmina). Naturalmente si ha 26 + 14 = 40.

Sia X una variabile statistica su un collettivo con n elementi che assume i valori v 1 , v 2 , …, vk rispettivamente con frequenze assolute n 1 , n 2 , …, nk. Si dicono frequenze relative , o semplicemente frequenze , di X i rapporti

fi = n

ni , i = 1, 2, …, k. (1.1)

Si dicono frequenze percentuali di X i numeri

hi = 100 fi , i = 1, 2, …, k.

Si noti che

1 1

 ^  ^ 

  n

n n

n f

k

i

i k

i

i^ (1.2)

vale a dire, la somma delle frequenze di X è, qualunque sia il collettivo, sempre uguale ad 1 e, necessariamente, quella delle frequenze percentuali sempre uguale a 100. La trasformazione delle frequenze assolute in frequenze relative consente di effettuare confronti fra le distribuzioni delle modalità di una stessa variabile riferiti a collettivi aventi diversa ampiezza, ad esempio gli abitanti di Pescara e quelli di Roma.

Le tabelle formate da due colonne, la prima con i valori assunti da X , l’altra con le corrispondenti frequenze percentuali, si dicono distribuzioni delle frequenze o delle frequenze percentuali di X.

Tabella 1.

Esempio 1. Sia U l’insieme dei 160 studenti di una certa scuola superiore e sia X la variabile statistica “altezza in cm”. Si potrebbero riportare i risultati su una tabella oggetti-caratteri

Tabella 1.

oppure eseguire una partizione dell’insieme dei valori assunti, un esempio potrebbe essere

c 1 = valori inferiori a 140 cm; c 2 = valori non inferiori a 140 cm e inferiori a 155;

valori di^ X  frequenze assolute c 1 c 2 . . . ck

n 1 n 2 . . . nk


totale n

Studenti altezza in cm O 1 O 2 O 3 O 4 . . O 160

c 3 = valori non inferiori a 155 cm e inferiori a 170; c 4 = valori non inferiori a 170 cm e inferiori a 185; c 5 = valori non inferiori a 185 e considerare un’altra rappresentazione più sintetica e efficace

Tabella 1.

Alla classe c 1 è assegnata la frequenza assoluta 4, cioè ci sono 4 studenti dell’istituto che hanno un’altezza inferiore ai 140 cm, e così via per le altre classi.

Esempio 1. Si sia rilevata la superficie, espressa in mq., di 1000 appartamenti in cui risiedono altrettanti capifamiglia; si ha

valori di X  frequenze assolute

c 1 c 2 c 3 c 4 c 5

________________

totale 160