Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica: principi e metodi Cap. 15, Slide di Statistica

Statistica: principi e metodi Cap. 15 - Popolazione, campione e distribuzioni campionarie

Tipologia: Slide

2017/2018

Caricato il 19/09/2018

Dennis96
Dennis96 🇮🇹

4.6

(57)

70 documenti

1 / 44

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Capitolo 15
Popolazione, campione e
distribuzioni campionarie
Statistica: principi e metodi
Cap. 15-1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c

Anteprima parziale del testo

Scarica Statistica: principi e metodi Cap. 15 e più Slide in PDF di Statistica solo su Docsity!

Capitolo 15

Popolazione, campione e

distribuzioni campionarie

Statistica: principi e metodi

 È l’insieme dei metodi e delle tecniche con cui “si fa

luce” su uno o più parametri della popolazione

generatrice, utilizzando i dati di un campione casuale.

 Inferenza statistica: indurre o inferire le proprietà

di una popolazione ( parametri ) sulla base dei dati

conosciuti relativi ad un campione ( statistiche )

 Due sono i percorsi tipici dell’inferenza statistica: la

stima dei parametri e la verifica delle ipotesi.

Inferenza statistica

es3. Studi di Affidabilità. Per valutare la durata media di vita di

prodotti elettronici, un campione di prodotti viene messo in funzione e, per ciascun oggetto coinvolto nell'esperimento, viene

registrato il tempo che intercorre fino alla sua «rottura». La media

dei tempi di vita del campione può essere impiegata per stimare il tempo di vita medio μ dei prodotti considerati.

es4. Prove Cliniche. Lo studio dell'efficacia di nuovi farmaci viene effettuata con esperimenti chiamati prove cliniche. Non potendo somministrare un nuovo farmaco a tutti i soggetti che ne necessitano, il farmaco viene assunto da un numero limitati di pazienti. Viene quindi misurato l'effetto sperimentale su tutti i soggetti del campione. Con questi valori rilevati si stima l'effetto incognito del farmaco.

Esempi di inferenza statistica

Esiste una popolazione costituita da un numero finito di

individui chiaramente individuabili ed etichettabili.

La popolazione di riferimento preesiste all'osservazione che

fornisce i dati campionari.

es1. elettori del paese; es2. studentesse del corso di laurea

Selezionando opportunamente una piccola parte di individui, si

rileva su di questi il carattere di interesse.

es1. voto; es2. altezza.

La caratteristica di interesse nella popolazione, che vogliamo

stimare sulla base delle informazioni parziali che si ottengono dal

campione, prende nome di parametro

es1. proporzione; es2. media.

Campionamento da popolazioni finite

L’estrazione a sorte di un’unità da una popolazione di N

unità genera una v.c. la cui distribuzione di probabilità

è identica alla distribuzione di frequenza relativa del

carattere nella popolazione.

Le costanti caratteristiche (media, mediana,

deviazione standard) della v.c. X sono uguali a quelle

del carattere X nella popolazione.

Popolazione finita e v.c. associata

all’estrazione a sorte di un’unità

Se si pensa di ripetere n volte l’estrazione, con

reinserimento, di un’unità dalla popolazione, ad ognuna di

queste n estrazioni sarà associata una v.c. Xi, i=1,...,n.

Siccome l’estrazione è con reinserimento, le n v.c. Xi sono

indipendenti e hanno tutte la stessa distribuzione di

probabilità.

Le n v.c. X 1 , X 2 , …, Xn sono indipendenti ed

identicamente distribuite (i.i.d.)

Popolazione finita e campione

casuale ( semplice con ripetizione)

Supponiamo di considerare un esperimento clinico per valutare

l’effetto di una determinata terapia in termini di guarigione.

L’esito dell’esperimento sul singolo paziente può essere descritto

mediante una v.c. X di Bernoulli che assume valore 1 (guarigione)

con probabilità p e valore 0 (non guarigione) con probabilità 1-p.

Popolazione teorica e v.c. associata

ad un esperimento clinico

X ∼ Ber(p)

La legge di probabilità è data da

( ) ( 1 ) , 0 , 1.

= − =

f x p p x

x x

Supponiamo di sottoporre a terapia n pazienti che presentano caratteristiche similari rispetto a fattori che potrebbero concorrere, insieme alla terapia, a determinare l’esito dell’esperimento. Per ognuno dei pazienti, l’esito è descrivibile da una v.c. X di Bernoulli

Popolazione teorica e campione

casuale: es. esperimento clinico

Xi ∼Ber(p), i=1,..., n

Le n v.c. X 1 , X 2 , …, Xn sono indipendenti ed hanno tutte la

stessa distribuzione di probabilità (i.i.d)

f(x ) p (1 p) , xi 0, 1. x 1 x i = i^ − − i =

Se l’esperimento consiste nel prelevare dalla linea di produzione n

confezioni di pasta, si può assumere che, in assenza di fenomeni

perturbatori del processo produttivo, il peso di ogni confezione si

comporti come una v.c. normale di media μ=500 g e con deviazione

standard σ.

Popolazione teorica e campione

casuale: es. controllo qualità

Xi ∼ N( , ),i=1,..., n

2 μ σ

    

− ^ − i

σ

x μ 2

1

i e , x

f(x)

i^2

Le n v.c. X 1 , X 2 , …, Xn sono indipendenti ed hanno tutte la

stessa distribuzione di probabilità (i.i.d)

Con il termine popolazione si farà riferimento alla

popolazione generatrice dei dati campionari.

 Nel campionamento da popolazione finita, la

popolazione generatrice è data dal collettivo statistico costituito dalla “totalità” degli elementi.

 Nel campionamento da popolazione teorica, la

popolazione generatrice è data dal modello probabilistico descrittivo della v.c. X associata all’esperimento. Il modello descrittivo della popolazione verrà indicato con fX( x; θ), dove il simbolo θ indica il parametro.

Popolazione

Problema diretto (deduttivo) e

problema inverso (induttivo)

 Dato il campione casuale X 1 , X 2 , …, Xn

composto da n v.c. i.i.d., si denomina campione osservabile una specifica realizzazione del campione casuale, ossia una n-upla di numeri che indichiamo con ( x 1 , x 2 , …, xn).

 Tutti i possibili campioni osservabili

costituiscono lo spazio campionario.

Spazio campionario

Supponiamo che la durata del periodo di gestazione sia descritta da una v.c. normale con media 265 e deviazione standard 18.

Esempio 2: spazio campionario

continuo

x 1 x 2 x 3 x 4 x 5 282.12 270.60 256.49 300.14 276. 249.42 266.57 303.47 254.40 255. 258.23 259.49 269.54 316.34 240. 253.32 270.59 299.43 250.20 262. 248.62 291.46 264.28 258.52 265. 269.10 232.19 267.01 252.18 256. 257.67 268.41 249.25 284.03 274. 267.99 278.08 297.70 255.91 252. 285.05 278.77 263.28 284.06 249. 272.84 314.08 262.44 306.29 236. 245.23 267.38 274.47 259.49 226. 271.13 291.66 275.40 282.92 305. 229.13 236.71 242.97 280.85 250. 230.88 246.21 262.35 240.61 287. 246.74 262.24 230.28 280.64 291.

… … … … … Cap. 15-

Lo spazio campionario dei campioni di ampiezza 5 estraibili da questa popolazione è composto da infiniti campioni , che non sono enumerabili come nell’Esempio

Nella tabella sono riportati 15 campioni di ampiezza 5 estratti casualmente dalla nostra popolazione. Si tratta di un sottoinsieme dell’infinità di campioni di ampiezza 5 che costituiscono lo spazio campionario in questione.

∼ N(265, 18 ) 2 X

Si chiama statistica campionaria o variabile casuale

campionaria una qualsiasi funzione delle v.c. X 1 , X 2 , …, Xn

che compongono il campione casuale.

T=T(X 1 , X 2 , …, Xn )

Ogni statistica campionaria, quale funzione di v.c., è una

variabile casuale.

La distribuzione campionaria di una statistica è la

distribuzione di probabilità (caso discreto) o di densità

di probabilità (caso continuo) dei valori che la statistica

assume nello spazio campionario.

Statistiche campionarie