Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Teoria della Stima Puntuale: Appunti di Statistica, Slide di Statistica Farmaceutica

Una panoramica completa della teoria della stima puntuale in statistica. Concetti chiave come la media campionaria, la retta dei minimi quadrati, il metodo della massima verosimiglianza e l'intervallo di confidenza. Include esempi pratici e formule per illustrare i principi fondamentali della stima puntuale.

Tipologia: Slide

2023/2024

Caricato il 20/03/2025

chiara679
chiara679 🇮🇹

4

(1)

6 documenti

1 / 27

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1
INFERENZA STATISTICA
Metodi per trarre affermazioni su una popolazione da un campione
Obiettivo: ridurre al minimo gli errori che si commettono.
momento obbligato di ogni indagine scientifica
finita
Tipi di popolazione
infinita (esiti lancio moneta)
Se popolazione infinita campioni casuali (semplici o a
componenti correlate)
campioni casuali
Se popolazione finita campioni non casuali
CAMPIONE CASUALE SEMPLICE: le sue componenti Xi sono estratte
sempre alle medesime condizioni e sono tra loro indipendenti.
STATISTICA: combinazione dei dati campionari usata per giungere
a delle conclusioni sulla popolazione oggetto di studio.
STIMA DI UN PARAMETRO: identificare il particolare valore assunto
da un indice descrittivo con riferimento alla distribuzione di un
carattere in una popolazione.
- Stima puntuale: propone un unico valore per il parametro .
- Stima intervallare: propone un intervallo di valori che
dovrebbe contenere quello di .
VERIFICA DI IPOTESI: si giudica la coerenza di alcune affermazioni
sulla popolazione con le osservazioni sperimentali disponibili.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b

Anteprima parziale del testo

Scarica Teoria della Stima Puntuale: Appunti di Statistica e più Slide in PDF di Statistica Farmaceutica solo su Docsity!

INFERENZA STATISTICA

Metodi per trarre affermazioni su una popolazione da un campione

Obiettivo: ridurre al minimo gli errori che si commettono.

→momento obbligato di ogni indagine scientifica

finita

Tipi di popolazione

infinita (esiti lancio moneta)

Se popolazione infinita → campioni casuali (semplici o a

componenti correlate)

campioni casuali

Se popolazione finita

campioni non casuali

CAMPIONE CASUALE SEMPLICE: le sue componenti Xi sono estratte

sempre alle medesime condizioni e sono tra loro indipendenti.

STATISTICA: combinazione dei dati campionari usata per giungere

a delle conclusioni sulla popolazione oggetto di studio.

STIMA DI UN PARAMETRO: identificare il particolare valore assunto

da un indice descrittivo  con riferimento alla distribuzione di un

carattere in una popolazione.

  • Stima puntuale: propone un unico valore per il parametro .
  • Stima intervallare: propone un intervallo di valori che

dovrebbe contenere quello di .

VERIFICA DI IPOTESI: si giudica la coerenza di alcune affermazioni

sulla popolazione con le osservazioni sperimentali disponibili.

STIMATORE: funzione dei dati del campione usata per calcolare la

stima dell’indice  nella popolazione.

→ uno stimatore è una variabile casuale.

TEORIA DELLA STIMA PUNTUALE

La media campionaria può essere utilizzata per stimare la media

della popolazione  non nota.

Questa scelta si basa sul fatto che:

  • la sua distribuzione è centrata sulla media della popolazione;
  • la precisione di stima migliora al crescere del campione.

Proprietà di uno stimatore:

  • CORRETTEZZA: il valore atteso dello stimatore coincide con il parametro oggetto di studio
  • CONSISTENZA: accade quando, fissato un margine di approssimazione qualsiasi, la probabilità che la stima ottenuta sia distante dal parametro oltre il margine scelto, tende a zero al crescere della numerosità campionaria.

TEOREMA: se per lo stimatore t ( X 1 ,…, Xn ) del parametro  vale:

 ( ) = n →  n

lim E t X 1 ,..., X & lim  ( 1 ,..., )= 0 n →  n

V t X X

allora t ( X 1 ,…, Xn ) è uno stimatore consistente.

Se si usa un campione casuale semplice, la media campionaria è

stimatore corretto e consistente della media della popolazione.

E ( X ) = e ( ) n

V X

2  = soddisfano le condizioni del teorema.

Metodo dei momenti

Momento dall’origine di ordine r :

n i

r r r Xi n

M X 1

Momento misto dall’origine di ordine r e s :

= (^ ) =  =

n i

r s r s rs Xi Yi n

M X Y 1

Lo stimatore è determinato in due passi:

  • riportando la relazione tra i parametri oggetto di inferenza e i momenti riferiti alla popolazione da cui è tratto il campione;
  • sostituendo ai momenti teorici quelli campionari.
  • ricavando la relazione inversa che esprime  in funzione dei momenti campionari

Media e varianza di una popolazione normale

2 1 2 2 2

2 (^2 22) ~

x S n

x

x

n

x

x

E X

E X n i i

n i i

Retta dei minimi quadrati (modello lineare stocastico)

Modello:  = ( y – a – b x ) ~ N (0; 

2 ) con E ( x  ) = 0

2 1

2

1 2 1

2

1

1

2 2 1

=

=

=

=

=

n

i

i i

n

i

i i i

n

i

i i

n

i

i i i

n

i

i i

y y b x x n

x y y b x x n

a y bx

y a bx n

x y a bx n

y a bx n

E

E x

E

( ) ( )

( ) ( ) ( )( )

2 1 1

2 2 1

2

1 1 1 2

1 1

1 1

~

 − +  − −  − − = 

 − =  −

= −

= = =

= = n

i

i i

n

i

i

n

i

i

n

i

i i

n

i

i i

y y x x n

x x b n

y y b n

x x x n

x y y b n

a y bx

2

2 2 2

2

2

2 2 2

2

2 2 2 2

2

~ 2

~

~

2

~

x

xy y x

xy

x

xy y

xy x

y x xy

xy x

S

S S S

S

S

S S

b S S

a y bx

S b S bS

S bS

a y bx

= + − = −

=

= −

  • − =

=

= −

( ) ( )

2 2 2 2 2 2

2

y xy x y xy

xy x

S S S S r

b S S

a y bx

Sia ( X 1 , …, Xn ) un campione casuale semplice estratto da una

popolazione in cui X segue una distribuzione continua con densità

f ( x ) =

x +^

con x  1 e  > 1. Determinare il valore atteso di X e lo

stimatore del parametro  ottenuto con il metodo dei momenti.

E ( X ) =

x

x +1 dx^ =^ 

xdx^ =

x −(− 1 )

1

E ( X ) =

=  x → 1 +

= x →  =

x

x − 1

Sia ( X 1 ,…, Xn ) un campione casuale semplice estratto da una

popolazione in cui X segue una distribuzione continua con densità

f ( x ) = (1+ ) x^ ^ per 0  x  1 e nulla altrove. Determinare il valore

atteso di X e lo stimatore del parametro  ottenuto con il metodo

dei momenti.

Ogni elemento di un campione casuale semplice ha quindi

probabilità p di presentare il carattere e 1 – p di non presentarlo

seguendo una stessa distribuzione di Bernoulli :

( ) ( 1 ) 0 , 1

1 = − =

i

x x p xi p p p x i i

La probabilità di estrarre un campione X = ( X 1 , …, Xn ) è allora:

( ) ( ) ( )

 (^) = − =

− = (^)  (^) = = − = −

n i i

n n i i i xi n x i

n x x p X p i p xi p p p p p ( ) 1 1 1 1 1

1 1

Ad esempio, la probabilità di un campione che ripete per 3 volte il

carattere qualitativo su 5 estrazioni in un a certa sequenza è:

( )

3 2 p ( X 1 = 0 , X 2 = 1 , X 3 = 1 , X 4 = 0 , X 5 = 1 , p )= p 1 − p

che è proporzionale alla probabilità di osservare un generico

campione che contiene per 3 volte il carattere qualitativo su 5

estrazioni calcolata dalla v.c. binomiale.

→ la probabilità di osservare il campione X dipende quindi dalla

frazione p di soggetti che presentano il carattere nella popolazione

e può essere vista come una funzione di questo parametro.

Invertendo l’ordine di causalità che si è tenuto fino a questo punto,

si può usare la probabilità del campione per impostare un

ragionamento ipotetico e valutare il grado di accordo tra valori

congetturati di p e i risultati del campione X = ( X 1 , X 2 , …, Xn ).

Se si legge la probabilità o densità del campione X come una

funzione dei valori congetturabili per , questa funzione è detta

verosimiglianza ed è definita eliminando fattori di proporzionalità.

( ) ( ) (^)  ( )

n

i

L f X X Xn f Xi 1

 X  1 , 2 ,..., .

Il logaritmo della verosimiglianza è definita log–verosimiglianza

l ( ) L ( ) f ( X ) c

nX = ln  X = (^) i = 1 ln  i +

Riprendendo l’esempio precedente, la verosimiglianza associata a

un campione casuale semplice per un carattere che segue

distribuzione di Bernoulli è:

( ) ( ) ( ) ( )

n x n x nx n (^^ x ) i

x x L p p p p p p p

n i i

n i i i i − − =

− = (^)  − = − = −

 (^) = =^1 1

1 1 1 1 1 1

mentre la sua log–verosimiglianza è:

( ) ( ) ( ) n ( p ) p

p l p nx p n x p nx + − −

= + − − = ln 1 1

ln 1 ln 1 ln

Si consideri un campione casuale semplice estratto da popolazione

normale di media  e varianza ^2. Determinare le funzioni di

verosimiglianza e di log–verosimiglianza rispetto ai due parametri.

( ) ( )

( ) 

= =

n

i

i

n n

i

i

x f f X 1 2

2 2 2 (^1 )

exp 2

X  

( )

( ) 

=

n

i

i

n x L 1 2

2 2 2

2

2

exp

  X

( )

( ) 

− = − − =

n

i

n xi l 1 2

2 2 2

2

ln 2

, 

   X

L’idea chiave nel considerare la verosimiglianza a fini inferenziali

è di scegliere come stimatore del parametro , l’espressione dei

dati campionari che rende massima la verosimiglianza, seguendo

2 1

2

X  ˆ n 

n

i

 (^) i − =

e ( )

2 1

2 2 ˆ X X n S

n

i

= (^)  (^) i − =

Si consideri un campione casuale semplice estratto da una

popolazione di bernoulli. Determinare lo stimatore di massima

verosimiglianza di p.

l (^ p )^ (^ x )^ p ( n^ x )^ (^ p ) c

n i i

n = (^)  i = 1 i ln + −= 1 ln 1 − +

1 1

p

n x

p

x

p

l p

n i i

n i i

f n

x p x

n

p

x

n x

p

p

p

n x

p

x

n i i n i (^) i

n i i

n i (^) i

n i (^) i

n i (^) i

=

=

= = =

1

1

1

1 1 1

Sotto ampie condizioni di regolarità, il metodo dei momenti e

quello della massima verosimiglianza assicurano entrambi degli

stimatori consistenti e asintoticamente non distorti.

Proprietà stimatori di massima verosimiglianza:

  • stimatori consistenti e asintoticamente corretti
  • stimatori BAN ( Best Asymptotically Normal )

  n N i

n i

N (^) n n n n

lim ˆ ~ 0 ;

lim ˆ ~ ;  − 

dove 1/( n  i ()) è limite inferiore per la varianza di un qualsiasi

stimatore asintoticamente corretto (teorema di Cramer − Rao ).

STIMA PER INTERVALLI:

Stima di  attraverso un intervallo casuale funzione del

campione X :

I ( X ) = [ a ( X ), b ( X )]

con a ( X )  b ( X ) e tale che P ( I ( X )  ) = 1 – .

QUANTITÀ PIVOT: espressione V ( X , ) dei dati e del parametro 

oggetto di inferenza la cui distribuzione non dipende da .

V ( X , ) ~ D ( c )

Modello Xi ~ N ( ,  02 ) nel caso di varianza nota,

n

X N

2 0 ~ 0 ;

 e ( , ) ~ ( 0 ; 1 ) 0

N

X

V X n

V ( X , ) = n

X¯ − 

è quantità pivot poiché la sua distribuzione è

N (0,1) per qualsiasi valore di .

Si noti come V ( X , ) non è una statistica perché dipende dal valore

ignoto di  → V ( X ,) non è calcolabile neanche dopo aver estratto

il campione X.

L’idea è quella di

  • individuare un intervallo entro cui la quantità pivot ricade nel

1 –  % delle volte.

  • trovare un intervallo con probabilità equivalente che isola il parametro di interesse.

Ampiezza intervallo minore di 

=    

   

 − −   

   

 − = + − − − 2

1 2

1 2

1  ^2 

   z n

z n

z x n

b a x

Isolando n si ottiene 2

1

n   z e quindi ( )

2 2 1 2

2 (^4) 

  − 

n   z

Da una popolazione N (;4) è stato tratto il campione casuale

semplice {2,3; 3,1; 1,6; 3,9; 1,2}.

a) Calcolare per  degli intervalli di fiducia

1 −  rispettivamente pari a 0,90; 0,95; 0,99. b) Trovare le numerosità campionarie minime affinché intervalli con stessi livelli di fiducia dei precedenti presentino ampiezza minore di 1.

( 2 , 3 3 , 1 1 , 6 3 , 9 1 , 2 ) 2 , 42 5

x = + + + + =

1 −  = 0,90 /2 = 0,05 1 − (/2) = 0,95 z 0,95 = 1,

1 , 645 2 , 42 1 , 47 0 , 95 5

2 = − z 0 , 95 = 2 , 42 − = − = n

a x

1 , 645 2 , 42 1 , 47 3 , 89 5

2 = + z 0 , 95 = 2 , 42 + = + = n

b x

  (0,95 ; 3,89) con fiducia 0,

1 − = 0,95 /2 = 0,025 1 − /2= 0,975 z 0,975 =1,

1 , 96 2 , 42 1 , 75 0 , 67 5

2 = − z 0 , 975 = 2 , 42 − = − = n

a x

1 , 96 2 , 42 1 , 75 4 , 17 5

2 = + z 0 , 975 = 2 , 42 + = + = n

b x

  (0,67 ; 4,17) con fiducia 0,

1 − = 0,99 /2 = 0,005 1 − /2 = 0,995 z 0,995 = 2,

2 , 575 2 , 42 2 , 3 0 , 12 5

2 = − z 0 , 995 = 2 , 42 − = − = n

a x

2 , 575 2 , 42 2 , 3 4 , 72 5

2 = + z 0 , 995 = 2 , 42 + = + = n

b x

  (0,12 ; 4,72) con fiducia 0,

Isolando n : ( )

2 2 1 2

2 (^4) 

n   z , si ottengono infine le numerosità

campionarie minime:

per 1− = 0,90 (^1 ,^645 )^43 ,^3 1

2 n    = → n  44

per 1− = 0,95 ( 1 , 96 ) 61 , 5 1

2 n    = → n  62

per 1− =0,99 ( 2 , 575 ) 106 , 1 1

2 n    = → n  107

Modello statistico: N (  , 

2 ) con  2 non noto

Stima di : se in n

X¯ − 

si sostituisce di  2 con la sua stima

puntale s 2 C :^ V ( X ,^ )^ =^ n^

X¯ − 

sC

è ancora una quantità pivot ma

non si distribuisce più secondo una normale. Infatti

( )

( ) ( )^1 1

2

Y n

Z

n

n S

X

n

S

n X

S

X

n C C C

con Z che segue una distribuzione normale standard e Y una chi

quadrato con n – 1 gradi di libertà, tra loro indipendenti per le

proprietà del campionamento da popolazione normale.

Tavole dei percentili per V. C. t di student

Tornando al problema della stima per intervallo della media di una

popolazione normale, n

X¯ − 

sC

si distribuisce secondo una t di

student con n – 1 gradi di libertà.

Conoscendo questo risultato, possiamo ora impostare passaggi

analoghi a quelli per l’intervallo sulla media con varianza nota e

ottenere gli estremi di un intervallo su  usando i percentili della

distribuzione t di student con n – 1 gradi di libertà:

  =^ −

2 ^  t 1 − 2 1 S

X

P t n C

( ) ^ (  )=^ −^ 

− (^1) − 2  −  t 1 − 2 1 n

S

t X n

S

P

C C

e quindi:

a ( X ) = X¯ −

SC

n

t 1 −(  / 2) b ( X ) = X¯ +

SC

n

t 1 −(  / 2)

Si assume che i rendimenti mensili di un fondo azionario seguano

una distribuzione normale. Assimilando le seguenti rilevazioni,

a un campione casuale semplice, costruire un intervallo di

confidenza di livello 0,9 per la media .

( 0 , 1 1 , 9 ... 2 , 8 ) 1 , 033 9

x = − + + =

(  )  (  )=^ −^ 

− (^1) − 2   + t 1 − 2 1 n

S

t X n

S

P X

C C

t n S

X

n C

Percentili della variabile casuale chi – quadro

per diversi valori di p = P ( Xx ) Il campione casuale semplice {3,9; 3,5; 3,4; 3,5; 4,3; 4,2} è stato

  • g.d.l. 0.900 0.950 0.975 0.990 0. - 1 3.0777 6.3137 12.7062 31.8210 63. - 2 1.8856 2.9200 4.3027 6.9645 9. - 3 1.6377 2.3534 3.1824 4.5407 5. - 4 1.5332 2.1318 2.7765 3.7469 4. - 5 1.4759 2.0150 2.5706 3.3649 4. - 6 1.4398 1.9432 2.4469 3.1427 3. - 7 1.4149 1.8946 2.3646 2.9979 3. - 8 1.3968 1.8595 2.3060 2.8965 3. - 9 1.3830 1.8331 2.2622 2.8214 3. - 10 1.3722 1.8125 2.2281 2.7638 3. - 11 1.3634 1.7959 2.2010 2.7181 3. - 12 1.3562 1.7823 2.1788 2.6810 3. - 13 1.3502 1.7709 2.1604 2.6503 3. - 14 1.3450 1.7613 2.1448 2.6245 2. - 15 1.3406 1.7531 2.1315 2.6025 2. - 16 1.3368 1.7459 2.1199 2.5835 2. - 17 1.3334 1.7396 2.1098 2.5669 2. - 18 1.3304 1.7341 2.1009 2.5524 2. - 19 1.3277 1.7291 2.0930 2.5395 2. - 20 1.3253 1.7247 2.0860 2.5280 2. - 21 1.3232 1.7207 2.0796 2.5176 2. - 22 1.3212 1.7171 2.0739 2.5083 2. - 23 1.3195 1.7139 2.0687 2.4999 2. - 24 1.3178 1.7109 2.0639 2.4922 2. - 25 1.3163 1.7081 2.0595 2.4851 2. - 26 1.3150 1.7056 2.0555 2.4786 2. - 27 1.3137 1.7033 2.0518 2.4727 2. - 28 1.3125 1.7011 2.0484 2.4671 2. - 29 1.3114 1.6991 2.0452 2.4620 2. - 30 1.3104 1.6973 2.0423 2.4573 2. - 60 1.2958 1.6706 2.0003 2.3901 2.
    • + 1.2816 1.6449 1.9600 2.3264 2.
    • g.d.l. 0,005 0,010 0,025 0,050 0,100 0,900 0,950 0,975 0,990 0, p - 1 0,000 0,000 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7, - 2 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10, - 3 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12, - 4 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14, - 5 0,412 0,554 0,831 1,145 1,610 9,236 11,070 12,833 15,086 16, - 6 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18, - 7 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20, - 8 1,344 1,646 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21, - 9 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,
      • 10 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,
      • 11 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,
      • 12 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,
      • 13 3,565 4,107 5,009 5,892 7,042 19,812 22,362 24,736 27,688 29,
      • 14 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,
      • 15 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,
      • 16 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,
      • 17 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,
      • 18 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,
      • 19 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,
      • 20 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,
      • 21 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,
      • 22 8,643 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289 42,
      • 23 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,
      • 24 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,
      • 25 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,
      • 26 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,
      • 27 11,808 12,879 14,573 16,151 18,114 36,741 40,113 43,195 46,963 49,
      • 28 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,
      • 29 13,121 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,
      • 30 13,787 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,
      • 60 35,534 37,485 40,482 43,188 46,459 74,397 79,082 83,298 88,379 91,
  • fiducia per ^2 di livello rispettivamente pari a 0,95 e 0,9 estratto da una popolazione normale. Si calcolino due intervalli di - x = 3 , 8 0 , - s = 0 , 127 0 ,

Intervallo di fiducia 1 –  = 0,

a =

( n – 1 )  SC^2

2 0,95(^5 gdl )^

b =

( n – 1 )  SC 2

^2 0,05( 5 gdl )

Intervallo di fiducia 1 –  = 0,

a =

( n – 1 )  SC^2

2 0,975(^5 gdl )^

b =

( n – 1 )  SC^2

^2 0,025( 5 gdl )

Stima per intervallo di una proporzione p :

Si consideri di voler stimare la frazione di soggetti che presentano

un determinato attributo in una popolazione.

Se X = ( x 1 , …, xn ) è un campione casuale semplice estratto da una

stessa popolazione di Bernoulli , l’elemento xi segnala la presenza

dell’attributo ricercato sulla i – esima unità del campione e:

o  i XiBi ( n , p )

o x n

x

n

n f

n i i^ = = = 1 ^ = 1 è stimatore corretto e consistente

della media della Bernoulli ovvero di p

o s = f (1 − f ) è stimatore consistente della varianza della

Bernoulli di p (1 − p )