Dispensa Statistica Applicata | Dispense di Statistica Applicata

Statistica Applicata

SLIDE 01: Introduzione

AREE della statistica:

Statistica Descrittiva: è quella che mira a fare delle sintesi, quello che viene fatto è prendere un

insieme di soggetti ed eﬀettuare una sintesi (e solo quella) della loro altezza: media, moda,

mediana, primo/secondo quartile."

––> SE osservo TUTTA la popolazione = Statistica Descrittiva. "

Esempi: clinica Mangiagalli (mamme che partoriscono da sole); censimenti ISTAT. #

Statistica Probabilistica: studio del meccanismo generatore delle realizzazioni campionarie. "

Vuol dire che noi estraiamo un campione di 10 soggetti, vogliamo capire da un punto di vista

probabilistico come questi 10 soggetti siano stati generati. !

Capire come dato un certo modello, si arriva ad un campione. "

QUI: > Modello ––> Campione #

Statistica Inferenziale: fare inferenza significa cercare di capire un problema generale sulla

base di poco elementi. "

Sulla base di un campione di soggetti si cerca quindi di capire come si comporta un certo

carattere in una data popolazione. "

Come si distribuisce il reddito delle famiglie italiane (= campione obiettivo). !

Un modo è intervistare famiglia per famiglia MA non si può perchè troppo dispendioso di tempo. !

Quello che invece si può (e conviene) fare è prendere un campione di famiglie italiane e su

questo campione studiare le caratteristiche del reddito per cercare poi di capire come si

distribuisce il reddito nell’intera popolazione italiana. !

QUI: > Campione ––> Modello"

Prendere un campione ≈ significa ≈ prendere un sottogruppo della popolazione che mi permette

di trarre conclusioni, facendo stime, su TUTTA la popolazione. #

Le motivazioni per le quali la Statistica Inferenziale è importante rispetto alla Statistica Descrittiva

sono (≈ cioè i motivi per i quali non si hanno a disposizione i dati sono):

1. Tempi e costi:

•Il censimento si fa ogni 10 anni per ovvi motivi di costo.

•Auditel: i dati mi servono subito, non posso considerare un campione troppo ampio.

2. Popolazione infinita o virtuale: "

Esempio: verificare la tossicità di un nuovo farmaco rispetto alla gravità della malattia. #

3. La rilevazione distrugge le unità statistiche: "

Esempio: misurare il grado di friabilità del biscotto (devo rompere e mangiare il biscotto);!

verificare il quantitativo di una cerca sostanza in una pastiglia (la pastiglia dev’essere spezzata

e analizzata). Non posso ovviamente rompere tutti i biscotti o spezzare tutte le pastiglie. #

4. Precisione dei risultati: "

si è dimostrato che le rilevazioni campionarie (incomplete) portano a risultati più precisi di

quelle complete (censimento). Esempio: elezioni in America, più precise con campione ridotto.#

Le indagini campionarie si basano quindi sull’analisi di un campione di riferimento. Bisogna ora

rispondere a: #

a) Il campione va scelto con qualche criterio? SI"

Il campione deve essere Rappresentativo (“come estrarlo?”)!

deve cioè essere un campione CASUALE (o probabilistico). "

Un campione è casuale se, nessuna unità statistica è esclusa a priori dalla procedura di

selezione (cioè se PDI ESTRAZIONE >0 ≈ Tutte le unità estratte devono avere probabilità non nulla

di entrare a far parte del campione). Per poterlo fare, dovremo avere una lista della popolazione. !

Con un campione casuale è inoltre possibile quantificare l’errore che si compie nella stima del

parametro di interesse.#

b) Si possono utilizzare gli strumenti della statistica descrittiva per analizzare i dati? NO"

Perchè la Statistica Descrittiva serve solo a fare una sintesi dopo che abbiamo estratto TUTTI

gli elementi da una popolazione. Noi, utilizzando solo un campione, e non l’intera popolazione,

non potremo utilizzarla.#

 di 1 26

Dispensa Statistica Applicata, Dispense di Statistica Applicata

Documenti correlati

Anteprima parziale del testo

Scarica Dispensa Statistica Applicata e più Dispense in PDF di Statistica Applicata solo su Docsity!

a) Il campione va scelto con qualche criterio? SI

b) Si possono utilizzare gli strumenti della statistica descrittiva per analizzare i dati? NO

P(A) = ∑ pi

P(A) = casi favorevoli (ad A) / casi possibili

Formula: (ho bisogno di: M =successi? ; N =numero tot di palline nell’urna ; k =tentativi)

μX = M(X) = n•p

Ø^2 X = Var(X) = n•p•(1–p)•[ (N–n)/(N–1) ]

VARIABILI CASUALI CONTINUE: In queste v.c. si definiscono da:

F(x) = P (X ≤ x)

VARIABILE CASUALE NORMALE STANDARDIZZATA: X ~ N (M = 0, Var = 1)

CAMPIONAMENTO: