TEORIA STATISTICA PROF. TORELLI MOI | Appunti di Statistica

STATISTICA PARTE TEORICA

PARTE 1 STATIST ICA DES CRI TTI VA

IL SIGNIFICATO DI STATISTICA

Si tratta di un insieme di metodologie che hanno come scopo la conoscenza quantitativa dei fenomeni collettivi. Lo

studio dei fenomeni collettivi può essere svolto sull’intera collettività, oppure solo una sua parte. Se si utilizzano

informazioni su una parte per trarre conclusioni o deduzioni sull’intera collettività, il campo della statistica è

chiamato statistica inferenziale o inferenza statistica. Al contrario, la statistica descrittiva ha come oggetto la

semplice descrizione quantitativa delle caratteristiche di una collettività, sia essa intera o parziale.

L’IMPORTANZA DI IMPOSTARE CORRETTAMENTE UN’INDAGINE STATISTICA

Per ottenere risultati affidabili occorre seguire procedure rigorose e controllare (limitare) i fattori di disturbo

dell’indagine. Occorre soprattutto partire da un’ottica corretta e non distorta (Es. se si effettua uno studio su due

gruppi di soggetti, per ottenere risultati comparabili è necessario che le caratteristiche dei due gruppi siano

corrispondenti e comparabili).

UN CASO SIGNIFICATIVO

-Per verificare l’effetto di un farmaco, non dovrebbero essere i pazienti a scegliere il gruppo in cui ci sarà il

trattamento di quel farmaco o Quello in cui non ci sarà (di trattamento o di controllo)

-Si avrebbe il rischio di una sproporzione di pazienti più attivi, meno rassegnati, più attenti, più consapevoli nel

gruppo di trattamento

-Occorre un esperimento controllato, dove è la casualità statistica a stabilire chi farà parte del gruppo dei due

gruppi

-Conviene utilizzare anche dei placebo, e sia i pazienti, sia i medici dovrebbero essere all’oscuro del gruppo di

appartenenza

METODI DI RICERCA E DISTORSIONI

Per conoscere la propensione alla lettura da parte di un campione di giovani rappresentativo di tutta quella fascia

di età, non si dovrebbero scegliere gli intervistati all’interno di una biblioteca. Se un campione deve essere

rappresentativo di una popolazione, non ci si dovrebbe affidare ad un metodo di indagine che si caratterizza per un

tasso di risposta dell’1%.

ALCUNE DEFINIZIONI

-POPOLAZIONE STATISTICA: la popolazione statistica è l’oggetto di un’indagine, l’insieme degli elementi che ci

interessano ai fini dell’indagine (es. tutti i visitatori di una fiera).

-UNITÀ STATISTICHE: sono i singoli elementi che compongono la popolazione statistica (i singoli visitatori)

-FENOMENI STATISTICI: sono le caratteristiche rilevate per ogni unità statistica (es. tipologia di visitatori); si

distinguono in fenomeni quantitativi (espressi con parole o concetti) e fenomeni quantitativi (in numeri)

-MODALITÀ: Sono i diversi valori che può presentare un fenomeno (es riguardo alla tipologia di visitatore: italiano

o straniero; appartenente ad un settore industriale o terziario, ecc.)

I fenomeni qualitativi si suddividono in ordinali e nominali:

-fenomeni ordinali: fra le modalità si può stabilire un ordine logico (crescente o decrescente): per esempio,

livello di accordo con la depenalizzazione del suicidio

-Fenomeni nominalI: fra le modalità non si possono instaurare relazioni di graduatoria di superiorità o inferiorità

si possono instaurare solo relazioni di uguale o diverso (es. tipologia di negozio preferito—> non c’è un ordine

logico tra supermercato, ipermercato, mercato del contadino, ecc —> non posso quindi instaurare relazioni di

graduatoria di superiorità o inferiorità, ma solo di relazioni di uguale o diverso)

Spesso, per praticità di elaborazione, si attribuiscono codifiche numeriche alle diverse modalità dei fenomeni

qualitativi, che ovviamente rimangono qualitativi: si tratta infatti di dati che non provengono da operazioni di

misurazione o di conteggio, ma da una codifica.

I fenomeni quantitativi presentano modalità espresse con numeri, che derivano da un’operazione di misura o di

conteggio.

-Fenomeni discreti: le modalità sono costituite da un numero finito di valori, che possono variare tra loro solo per

un ammontare fisso (es. studenti di un comune); le modalità possono essere poste in corrispondenza con un

sottoinsieme dei numeri interi

-Fenomeni continui: la scala delle possibili modalità è continua: il numero delle modalità è teoricamente infinito

(le modalità possono differire tra loro per entità variabili). Le modalità con cui si possono esprimere questi

fenomeni continui sono corrispondenti ad un sottoinsieme dei numeri reali e non più di numeri interi (es.

distanza tra luogo di lavoro e residenza dell’acquirente).

LE MISURE DI POSIZIONE, DI VARIABILITÀ E DI CONCENTRAZIONE

MISURE DI POSIZIONE

IL CALCOLO DI UNA MEDIA

La media ha lo scopo di rappresentare con un solo indicatore un insieme di dati, evidenziando quindi l’ordine di

grandezza. Le medie possono essere distinte in:

-medie ottenute in base ad un vincolo analitico

-Medie che fanno riferimento alla posizione dei valori

Le medie analitiche si basano su fenomeni quantitativi e sono: media aritmetica, geometrica, quadratica, ecc..; le

medie di posizione sono: mediana (su fenomeni quantitativi e qualitativi ordinali) e la moda (su tutti i fenomeni)

1

TEORIA STATISTICA PROF. TORELLI MOI, Appunti di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica TEORIA STATISTICA PROF. TORELLI MOI e più Appunti in PDF di Statistica solo su Docsity!

STATISTICA PARTE TEORICA

PARTE 1 STATISTICA DESCRITTIVA

IL SIGNIFICATO DI STATISTICA

L’IMPORTANZA DI IMPOSTARE CORRETTAMENTE UN’INDAGINE STATISTICA

UN CASO SIGNIFICATIVO

- Per verificare l’effetto di un farmaco, non dovrebbero essere i pazienti a scegliere il gruppo in cui ci sarà il

- Si avrebbe il rischio di una sproporzione di pazienti più attivi, meno rassegnati, più attenti, più consapevoli nel

- Occorre un esperimento controllato, dove è la casualità statistica a stabilire chi farà parte del gruppo dei due

- Conviene utilizzare anche dei placebo, e sia i pazienti, sia i medici dovrebbero essere all’oscuro del gruppo di

METODI DI RICERCA E DISTORSIONI

ALCUNE DEFINIZIONI

- POPOLAZIONE STATISTICA: la popolazione statistica è l’oggetto di un’indagine, l’insieme degli elementi che ci

- UNITÀ STATISTICHE: sono i singoli elementi che compongono la popolazione statistica (i singoli visitatori)

- FENOMENI STATISTICI: sono le caratteristiche rilevate per ogni unità statistica (es. tipologia di visitatori); si

- MODALITÀ: Sono i diversi valori che può presentare un fenomeno (es riguardo alla tipologia di visitatore: italiano

- fenomeni ordinali : fra le modalità si può stabilire un ordine logico (crescente o decrescente): per esempio,

- Fenomeni nominalI: fra le modalità non si possono instaurare relazioni di graduatoria di superiorità o inferiorità

- Fenomeni discreti: le modalità sono costituite da un numero finito di valori, che possono variare tra loro solo per

- Fenomeni continui : la scala delle possibili modalità è continua: il numero delle modalità è teoricamente infinito

LE MISURE DI POSIZIONE, DI VARIABILITÀ E DI CONCENTRAZIONE

MISURE DI POSIZIONE

IL CALCOLO DI UNA MEDIA

- medie ottenute in base ad un vincolo analitico

- Medie che fanno riferimento alla posizione dei valori

LE MEDIE ANALITICHE

LE PRINCIPALI MEDIE ANALITICHE

- Media aritmetica (l’operazione è la somma dei valori):

- media aritmetica semplice

- media aritmetica ponderata

- Media geometrica (l’operazione è il prodotto dei valori)

- Media quadratica (l’operazione è il quadrato dei valori

LA MEDIA ARITMETICA

- La media campionaria si indica con X

- La media della popolazione si indica con μ

- In tanti casi, per indicare in modo generico la media aritmetica, si utilizza M

LA MEDIA ARITMETICA SEMPLICE

LA MEDIA ARITMETICA PONDERATA: QUANDO VIENE UTILIZZATA

- Quando i dati sono presentati in una distribuzione di frequenze, dove a ogni modalità corrisponde una certa

- In generale, quando si ritiene utile (o necessario) ponderare i valori con un opportuno sistema di pesi, in quanto è

ESEMPIO DI MEDIA ARITMETICA PONDERATA

M= (171)+(277)+(398)+(488)+(595)+ (649)+(7*22) / 71 + 77 + 98 + 88 + 95 + 49 + 22

M= 1794/500= 3,588 MINUTI —> SIGNIFICA CHE MEDIAMENTE CHE I 500 SOGGETTI CHE FANNO PARTE DEL CAMPIONE

HANNO EVIDENZIATO UNA DURATA DEL PROCESSO DECISIONALE DI 3,588 MINUTI

+ 4,5 +9,9 +4,2 +7,8= 111668,8/55,1= 202,70 KM/H DELLA VELOCITÀ DEL

VENTO —> L’INSIEME DEL PAESE CONSIDERATO HA FATTO RISCONTRARE

UNA VELOCITÀ MEDIA DEL VENTO DI 202,70 KM/H

PROPRIETÀ DELLA MEDIA ARITMETICA

- Calcolo % di 71 su 500= 14,2%

- Calcolo % di 148 su 500= 29,6%

- Calcolo % di 246 su 500= 49,2%

MEDIA E MEDIANA NELLE DISTRIBUZIONI ASIMMETRICHE

- ASIMMETRIA NEGATIVA: coda pronunciata verso sinistra, quindi maggiore concentrazione verso le modalità

- ASIMMETRIA POSITIVA: coda pronunciata verso destra, quindi maggiore concentrazione verso le modalità minori

I PERCENTILI

I PERCENTILI: CASI PARTICOLARI

UNA APPLICAZIONE: RILEVAZIONE DEL FOSFORO REATTIVO ALLA STAZIONE DI CATTOLICA SU 365 GIORNI (MG/MC)

- il 3% delle rilevazioni ha un valore MINORE O UGUALE DI 1,

- Il 10% delle rilevazioni ha un valore MINORE O UGUALE DI 1,

- Il 5% delle rilevazioni ha un valore MAGGIORE O UGUALE DI 4,

- QUAL È LA % DELLE RILEVAZIONI CHE HANNO DATO UN VALORE MINORE O UGUALE AL 3,51%? IL 75%.

- QUAL È IL VALORE CORRISPONDENTE AL PRIMO 25% DI STAZIONI? HA UN VALORE INFERIORE O UGUALE A 2,

- QUAL È LA PERCENTUALE DI RILEVAZIONI HA HANNO UN VALORE COMPRESO TRA 1,97 E 4,62? L’85% —> 1,97 è

- Una rilevazione che ha fatto rilevare un valore = 1,91 è in corrispondenza del percentile? Approssimativamente il

LE MISURE DI VARIABILITÀ

IL SIGNIFICATO DI VARIABILITÀ

- non assumono mai valori negativi

- Sono pari a zero se il fenomeno non presenta variabilità

- Presentano valori crescenti all’aumentare della variabilità

IL CAMPO DI VARIAZIONE (RANGE)

LA DEVIAZIONE STANDARD O SCARTO QUADRATICO MEDIO

SIMBOLOGIA

- Si dice deviazione standard la media quadratica degli scarti di ogni valore dalla media aritmetica.

- La deviazione standard è espressa nella stessa unità di misura dei valori del fenomeno

- Il numeratore che si trova sotto la radice quadrata, ossia Σ (xi - M)^2, è chiamato devianza

GLI INDICI RELATIVI DI VARIABILITÀ RAPPORTATI AL LORO MASSIMO

- sono idonei a rispondere ad una domanda di questo tipo: la variabilità espressa da una deviazione standard, o da

09 I 10 =[ 0,994 * 240 + 1,004 187 / 248 +187]