Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Stima e Inferenza Statistica: Teoria e Applicazioni, Appunti di Statistica

Appunti e dispense su inferenza statistica

Tipologia: Appunti

2018/2019

Caricato il 13/11/2021

vanessa-di-pompeo
vanessa-di-pompeo 🇮🇹

4.5

(2)

3 documenti

1 / 14

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
INFERENZA STATISTICA
Definizione:
L’inferenza statistica è un insieme di metodi che permettono di estrarre informazioni su una caratteristica
(come per esempio media, varianza ecc.) della popolazione da un “sottoinsieme” della stessa, detto anche
campione.
Osservazione:
La costruzione di un campione rappresentativo è un problema rilevante che richiede tecniche note come
tecniche di campionamento.
Si suppone che tutte le unità statistiche abbiano la stessa probabilità di essere estratte.
Definizione:
Un campione casuale è una ennupla (cioè n variabile) di variabili casuali (o aleatorie) indipendenti tra di
loro e identicamente distribuite, ovvero X1, X2, …, Xn indipendenti e identicamente distribuite, cioè
Xi X (deve essere specificata a priori), dove X è detta popolazione generatrice.
[sono variabili che hanno le stesse caratteristiche, stessa probabilità, stessa media ecc.]
N è un numero finito ed è detto ampiezza del campione.
ESERCIZIO:
Calcolare la funzione di probabilità di un campione di ampiezza n generato da una popolazione X
P (
λ
),
X che si distribuisce come una Poisson di parametro landa
X1, X2, …, Xn --> i (indipendenti) i (identicamente) d (distribuite)
Sono distribuite come Xi X P (
λ
).
P (
λ
) ha support Sx = {0, 1, 2, …} P(x) =
¿
x /x!) e- lamda
Definizione:
Poiché X1, X2, …, Xn, sono indipendenti la probabilità congiunta è il prodotto delle probabilità.
P (X1 = x1, X2 = x2, …, Xn = xn) = p (x1) p (x2) … p (xn) =
¿
x1 /x1!) e- lamda *
¿
x2 /x2!) e- lamda *
¿
xn /xn!) e- lamda
= (
x1 + x2 + … + xn * e- n * lamda) / X1! X2! … Xn!
ESERCIZIO:
Dato il campione di ampiezza n con Xi E (
λ
), con i = 1, 2, …, n. Calcolare la funzione di densità
congiunta.
Nota la densità di ciascun campione: fx (x) =
λ
e- lamda * x con x
0
f x1, x2, …, xn (x1, x2, …, xn) = fx1 (x1) fx2 (x2) … fxn (xn) =
λ
e- lamda * x1
λ
e- lamda * x2
λ
e- lamda * xn =
λ
n e- lamda (x1+x2+…+xn)
X1, X2, …, Xn prendono il nome di esiti campionari
Definizione:
Si definisce statistica (chiamata anche statistica campionaria) una funzione degli esiti campionari.
Una statistica campionaria serve per stimare una caratteristica della popolazione.
Data una popolazione generatrice X fx (x,
θ
) o X Px (x,
θ
), il problema dell’inferenza
parametrica è quello di costruire una statistica per stimare
θ
.
La stima può essere:
Puntuale (un valore preciso);
Intervallare (un intervallo che contiene il parametro)
STIMA PUNTUALE
Definizione:
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe

Anteprima parziale del testo

Scarica Stima e Inferenza Statistica: Teoria e Applicazioni e più Appunti in PDF di Statistica solo su Docsity!

INFERENZA STATISTICA

Definizione:

L’inferenza statistica è un insieme di metodi che permettono di estrarre informazioni su una caratteristica

(come per esempio media, varianza ecc.) della popolazione da un “sottoinsieme” della stessa, detto anche

campione.

Osservazione:

La costruzione di un campione rappresentativo è un problema rilevante che richiede tecniche note come

tecniche di campionamento.

Si suppone che tutte le unità statistiche abbiano la stessa probabilità di essere estratte.

Definizione:

Un campione casuale è una ennupla (cioè n variabile) di variabili casuali (o aleatorie) indipendenti tra di

loro e identicamente distribuite , ovvero X 1

, X

2

, …, X

n

indipendenti e identicamente distribuite, cioè

X

i

X (deve essere specificata a priori), dove X è detta popolazione generatrice.

[sono variabili che hanno le stesse caratteristiche, stessa probabilità, stessa media ecc.]

N è un numero finito ed è detto ampiezza del campione.

ESERCIZIO:

Calcolare la funzione di probabilità di un campione di ampiezza n generato da una popolazione X

P ( λ ),

X che si distribuisce come una Poisson di parametro landa

X

1

, X

2

, …, X

n

--> i (indipendenti) i (identicamente) d (distribuite)

Sono distribuite come X i

X P ( λ ).

P ( λ ) ha support S x

= {0, 1, 2, …} P(x) = ¿

x

/x!) e

  • lamda

Definizione:

Poiché X 1

, X

2

, …, X

n

, sono indipendenti la probabilità congiunta è il prodotto delle probabilità.

P (X

1

= x 1

, X

2

= x 2

, …, X

n

= x n

) = p (x 1

) p (x 2

) … p (x n

x

/x 1

!) e

  • lamda

x

/x 2

!) e

  • lamda

xn

/x n

!) e

  • lamda

= ( λ

x1 + x2 + … + xn

  • e
  • n * lamda

) / X

1

! X

2

! … X

n

ESERCIZIO:

Dato il campione di ampiezza n con X i

E ( λ ), con i = 1, 2, …, n. Calcolare la funzione di densità

congiunta.

Nota la densità di ciascun campione: f x

(x) =

λ e

  • lamda * x

con x

f x1, x2, …, xn

(x 1

, x 2

, …, x n

) = f x

(x 1

) f x

(x 2

) … f xn

(x n

) = λ e

  • lamda * x

λ e

  • lamda * x

λ e

  • lamda * xn

= λ

n

e

  • lamda (x1+x2+…+xn)

X

1

, X

2

, …, X

n

prendono il nome di esiti campionari

Definizione:

Si definisce statistica (chiamata anche statistica campionaria) una funzione degli esiti campionari.

Una statistica campionaria serve per stimare una caratteristica della popolazione.

Data una popolazione generatrice X f x

(x,

θ ) o X P x

(x,

θ ), il problema dell’ inferenza

parametrica è quello di costruire una statistica per stimare θ.

La stima può essere:

 Puntuale (un valore preciso);

 Intervallare (un intervallo che contiene il parametro)

STIMA PUNTUALE

Definizione:

Uno stimatore del parametro

θ della popolazione è una statistica campionaria, cioè una funzione degli esiti

campionari.

T = t (X 1

, X

2

, …, X

n

^

θ = t ((X 1

, X

2

, …, X

n

T (o

^

θ

) è una variabile aleatoria o casuale.

Quando si sostituisce al posto delle variabili delle osservazioni si ottiene una stima (cioè un numero)

ESEMPIO:

si suppone di avere un campione di ampiezza 4 e siano X 1

, X

2

, X

3

, X

4

i i d con media

μ .

Si osserva che x 1

= 2, x 2

= 3, x 3

= 1, x 4

^ μ

X 1 + X 2 + X 3 + X 4

= t (X 1

, X

2

, X

3

, X

4

Stima:

^ μ = t (X 1

, X

2

, X

3

, X

4

) = t (2, 3, 1, 1) =

Stima puntuale – Proprietà di uno stimatore

Sia

^

θ n

= t

n

uno stimatore del parametro θ della popolazione.

a) Correttezza.

^

θ n

è uno stimatore corretto se E [

^

θ n

] = θ

Se E [

^

θ n

]

≠ θ lo stimatore si dice distorto e si definisce distorsione o Bias --> Bias (

^

θ n

) = E [

^

θ n

] –

θ

--> Distorto (

^

θ n

) = E [

^

θ n

] –

θ

b) Asintoticamente corretto

Definizione:

Uno stimatore

^

θ n

è asintoticamente corretto se

lim

n → ∞

E

[

^

θ n

] = θ

ESEMPIO:

Si considera un campione di ampiezza n di variabili i i d con media

μ e varianza

σ

2

. Si consideri lo

stimatore media campionaria definito da X n

n

i = 1

n

X

i

a) Mostrare che è uno stimatore corretto di

μ

b) Calcolare la sua varianza

a) Se E [

X

n

] =

μ allora

X

n

è uno stimatore corretto di

μ

E [ X

n

] = E [

n

i = 1

n

X

i

] =

n

E [

i = 1

n

X

i

] =

n

i = 1

n

E [X

i

] --> (E [X

i

] = μ per ogni i)

n

i = 1

n

μ =

n

( μ + μ + … + μ ) =

n μ

n

= μ (è uno stimatore corretto)

X

n

ha Bias uguale a zero (perché stimatore corretto)

b) Calcolo varianza di X n

(media campionaria)

V (

X

n

) = V (

n

i = 1

n

X

i

n

2

V (

i = 1

n

X

i

Osservazione:

X

i

e X j

sono indipendenti per ogni coppia i, j allora cov (X i

, X

j

= 1 / n

2

i = 1

n

V (X

i

) = 1 / n

2

i = 1

n

σ

2

= 1/n

2

( σ

2

  • σ

2

  • … + σ

2

) = n σ

2

/ n

2

= σ

2

/ n

Osservazione:

la media campionaria X n

n

i = 1

n

X

i

è uno stimatore corretto della media E [ X n

] = μ , mentre la

varianza della media campionaria tende a zero per n che tende a più infinito.

= V (X

1

n

X

n

μ

n

2

= V (X

1

) + V (

n

X

n

) + 2 cov (X 1

n

X

n

μ

2

/ n

2

) = --> V (X

1

) = V (X

n

σ

2

σ

2

n

2

σ

2

n

cov (X 1

, X

n

μ

2

/ n

2

) --> cov (X 1

, X

n

) = 0 perché indipendenti

= σ

2

  • (1 / n

2

) σ

2

  • ( μ

2

/ n

2

lim

n → +

M

SE =

lim

n → +

σ 2

  • (1 / n

2

) σ

2

  • ( μ

2

/ n

2

) = σ

2

--> gli altri sono uguali a zero

Media campionaria -->

^

X

n

^ μ

n

n

i = 1

n

X

i

X

i

i i d media μ e varianza σ

2

La media campionaria è uno stimatore corretto E [

^

X

n

] =

μ

B (

^

X

n

) = 0 per ogni n ed è consistente E [(

^

X

n

μ )

2

] = V (

^

X

n

σ

2

/ n

Varianza campionaria --> s

2

n − 1

i = 1

n

i

X

n

2

a) E ( X

n

) = μ V ( X

n

) = σ

2

/ n --> E [ X

n

2

] = V ( X

n

) + E ( X

n

2

= σ

2

/ n + μ

2

b) E [X i

] = μ V (X i

) = σ

2

--> E [X

i

] = V ( X

n

) + E (X

i

2

= σ

2

  • μ

2

c)

i = 1

n

X

i

= n

X

n

E [s

2

] = E [

n

i = 1

n

X

i

- X

n

2

n − 1

E [

i = 1

n

X

i

2

i = 1

n

n

2

i = 1

n

X

i

* X

n

]

n − 1

E [

i = 1

n

X

i

2

  • n X

n

2

– 2 X

n ∑

i = 1

n

X

i

] --> per la proprietà c:

i = 1

n

X

i

= n X

n

n − 1

E [

i = 1

n

X

i

2

  • n X

n

2

  • 2 n X

n

2

]

n − 1

[E (

i = 1

n

X

i

2

) – n E [ X

n

2

] ]=

n − 1

[

i = 1

n

E ¿ ¿

i

2

] – n [( σ

2

/ n) + μ

2

]

= E [s

2

] =

n − 1

[

i = 1

n

2

  • μ

2

  • σ

2

  • n μ

2

] =

n − 1

[ n σ

2

  • n μ

2

  • σ

2

  • n μ

2

] =

n − 1

σ

2

(n – 1) = σ

2

Osservazione:

Lo stimatore

σ ^

2

n

i = 1

n

i

X

n

2

non è corretto E [

σ ^

2

] =

n − 1

n

σ

2

--> asintoticamente corretto ma non

corretto.

Momenti campionari

Dato un campione X 1

, X

2

, …, X

n

X

i

i i d X μ k

= E [X

k

] --> momento di ordine k di X

μ

k

= E [X

i

k

] con k = 1 (media), 2, 3, …

Momento campionario di ordine k è definito M K

n

i = 1

n

X

i

k

M

k

è uno stimatore corretto di

μ

k

Dimostrazione:

E [M

k

] = E [

n

i = 1

n

X

i

k

] =

n

E [

i = 1

n

X

i

k

] =

n

i = 1

n

E [X

i

k

] =

n

i = 1

n

μ k

= (n -

μ

k

/ n) =

μ

k

Metodi di stima: il metodo dei momenti

ESEMPIO:

Sia dato il campione X 1

, X

2

, …, X

n

estratto dalla distribuzione P (x; θ ) = θ x = 1

θ x = 2

Siano n = 5 con X 1

= 1 X

2

= 1 X

3

= 2 X

4

= 1 X

5

= 2 S

x

Stimare il parametro θ con il metodo dei momenti.

μ = E [X] = 1

θ

  • 2 (1 –

θ ) =

θ

  • 2 - 2

θ = 2 -

θ

μ = 2 – θ θ = 2 – μ

Lo stimatore di

θ si costruisce sostituendo a

μ lo stimatore di

μ

^

θ

= 2 – M

i

= 2 – X

n

M

i

= X

n

Metodo dei momenti

Si indica con μ k

= E [X

k

] il momento d’ordine k e con M k

n

i = 1

n

X

i

k

i momenti campionari che sono stimatori

corretti di μ k

Lo schema del metodo consiste:

1. Calcolare tanti momenti teorici quanti sono i parametri da determinare.

Se si hanno m parametri da stimare, servono m momenti:

μ 1

= g 1

( θ 1

, θ 2

, θ 3,

…, θ m

μ

2

= g 2

θ

1

θ

2

θ

3,

θ

m

μ

m

= g

m

( θ

1

, θ

2

, θ

3,

…, θ

m

2. Invertire le funzioni pe ottenere

θ

1

= v 1

μ

1

μ

2

μ

m

θ

2

= v

1

( μ

1

, μ

2

, …, μ

m

θ

m

= v 1

μ

1

μ

2

μ

m

3. Sostituire i momenti teorici con quelli campionari M k

^

θ i

= v

i

(M

1

, M

2

, …, M

m

) con i = 1, 2, …, m

ESEMPIO:

Si consideri il campione X 1

, X

2

, …, X

n

generato dalla popolazione X N (

μ ,

σ

2

). Stimare

μ e

σ

2

con il

metodo dei momenti sapendo che il campione osservato è 1; 0; -1; 2; 5; 1; 0; 1; 1.

μ

1

= E [X] =

μ

μ

2

= E [X

2

] = V (X) + (

μ )

2

μ

2

σ

2

μ 1

= θ 1

g 1

= θ 1

μ

2

θ

2

θ

1

2

g 2

θ

2

θ

1

2

μ

μ

1

σ

2

= μ 2

  • ( μ 1

2

l’ (p) = r

p

  • (n – r)

1 − p

r

p

nr

1 − p

r ( 1 − p )−( nr ) p

p ( 1 − p )

R – r p – n p + r p = 0; r = n p; ^ p =

r

n

i = 1

n

x i

/ n) = X n

La derivata seconda, inoltre, deve essere negativa

Efficienza

Dati due stimatori dello stesso parametro T 1

, T

2

si può dire che T

1

è più efficiente di T

2

se

E [(T

1

  • θ )

2

] < E [(T

2

  • θ )

2

] = MSE (T

1

) < MSE (T

2

Stima per intervalli

Teorema 1:

Se X 1

, X

2

, …, X

n

sono variabili normali allora ogni loro combinazione è una variabile normale.

Y =

i = 1

n

c i

X

i

Y è normale

Se X i

X N (

μ ,

σ

2

) i i d allora

X

n

n

i = 1

n

X

i

N ( μ , σ

2

/n) per ogni n

Teorema limite centrale

Siano X 1

, X

2

, …, X

n

variabili con media μ e varianza σ

2

(E [X

i

] = μ V (X i

) = σ

2

allora

n

i = 1

n

X

i

N (

μ ,

σ

2

/n) per n che tende a + infinito

Teorema:

Se si considera lo stimatore varianza campionaria: s

2

n − 1

i = 1

n

¿¿X

1

– X

n

2

(n – 1) s

2

σ

2

CHI

2

n—

 distribuzione CHI

2

Distribuzione CHI n-

2

--> n – 1 sono i gradi di libertà

S

CHI (n-1)

= {x

0} f (x) = a X

(n-1)/

e

  • x/

--> a costante di normalizzazione

La CHI

2

n

i = 1

n

Z

i

2

Z

i

N (0, 1) --> Z

1

, Z

2

, …, Z

n

indipendenti

Distribuzione t – Student

t n-

X nμ

s

n

--> s

2

è la varianza campionaria

t n

= Z / (

CHI

2

n

/n) --> Z N (0, 1)

t n

è una normale mentre t n-

è una t di student

X

n

n

i = 1

n

X

i

--> X

i

N (

μ ,

σ

2

/n)

∀ n --> media campionaria

σ

2

non è nota

t – student è il rapporto tra una normale standardizzata (Z N (0, 1)) e una CHI

2

con un certo

numero di gradi di libertà.

Stime intervallari

Si analizza gli stimatori per la media di una popolazione normale in due ipotesi diverse:

  1. È nota la varianza (si usa la statistica normale Z, perché sigma è un numero)
  2. Non è nota la varianza ed è sostituita con la varianza campionaria.
  3. Ipotesi: X i

X N (

μ ,

σ

2

) X

i

i i d con i = 1, 2, …, n

Se σ

2

è nota allora si definisce l’intervallo di confidenza a livello di confidenza 1 – α come segue:

n

– Z

1 – (alfa)/

σ

√ n

X

n

+ Z

1 – (alfa)/

σ

√ n

 Intervallo casuale

P ( X

n

– Z

1 – (alfa)/

σ

√ n

≤ μ ≤ X

n

+ Z

1 – (alfa)/

σ

√ n

) = 1 - α  se α fosse 0 ci sarebbe Z

1

che coincide con

Margine di errore

Dimostrazione:

P (– Z

1 – (alfa)/

≤ ( X

n

  • μ ) /

σ

√ n

≤ + Z

1 – (alfa)/

) = 1 – α

Derivazione standard

f t(n-1)

è simmetrica. Rispetto all’origine è simile alla

densità della normale standardizzata con code più

alte.

P (1 / CHI

2

n-1; alfa/

≥ σ

2

/ ((n-1) s

2

) ≥ 1 / CHI

2

n-1; 1 – (alfa/2)

) = 1 - α

(si moltiplica per (n – 1) s

2

tutti i membri e si ottiene

P (((n-1) s

2

) / CHI

2

n-1; alfa/

≥ σ

2

((n-1) s

2

) / CHI

2

n-1; 1 – (alfa/2)

) = 1 - α

P (((n-1) s

2

) / CHI

2

n-1; alfa/

≤ σ

2

((n-1) s

2

) / CHI

2

n-1; 1 – (alfa/2)

) = 1 - α

ESERCIZIO:

Sia X N ( μ , σ

2

) con σ = 15

Viene estratto un campione casuale di ampiezza n = 225 dal quale risulta una media campionaria pari a 20.

x

n

= 20 (osservazione della media campionaria)

  1. Si determini l’intervallo di confidenza al 90% per la media μ.
  2. Si supponga di voler ridurre l’intervallo al livello di confidenza al 90% in modo tale che gli estremi

distino dal valore centrale 1. Quanto deve essere grande il campione?

  1. Si determini l’intervallo di confidenza al 90% per la media

μ .

x

n

σ

n

Z

1 – (alfa)/

α ;

α = 0,

Z

0,

x n

σ

n

Z

0,

21,65 o 18,

μ ∈ [18,35; 21,65]

P (18,

≤ μ ≤ 21,65) = 0,

  1. Si supponga di voler ridurre l’intervallo al livello di confidenza al 90% in modo tale che gli estremi distino

dal valore centrale 1. Quanto deve essere grande il campione?

√ n

n

N = (24,75)

2

ESERCIZIO:

Sia α = 0,05 e si suppone di avere un campione di 10 elementi con s

2

= 4. Trovare l’intervallo di confidenza

per la media sapendo che la media campionaria è X n

Info: Z 0,

= - 1,2 t 10,

= 2,5 t 9; 0,

= 2,262 t 8,

Formula da usare è: X n

- t n-1, 1 – (alfa/2)

s

n

; X

n

+ t n-1, 1 – (alfa/2)

s

n

si usa la t – student

α

[2 – 2,

]

ESERCIZIO:

Un’azienda è in perdita di 20 mattoni al giorno con una varianza campionaria s

2

Assumendo un campione normale, determinare l’intervallo di confidenza al 95% della varianza.

P (((n-1) s

2

) / CHI

2

n-1; alfa/

≤ σ

2

((n-1) s

2

) / CHI

2

n-1; 1 – (alfa/2)

) = 1 - α

n = 20 s

2

= 0,1 1 – α = 0,95 quindi α = 0,05 α /2 = 0,

Info: CHI

2

19; 0,

= 8,95 CHI

2

19; 0,

Prova d’ipotesi (test d’ipotesi)

La prova d’ipotesi è uno schema per stabilire se un’ipotesi su un parametro della popolazione può essere

“accettata” o meglio “non rifiutata” conoscendo solo una statistica (cioè uno stimatore) di quel parametro.

Si suppone di avere un campione normale e di voler testare che la media della popolazione sia un valore

pari a μ 0

( ipotesi nulla: H 0

) e non un valore pari a μ 1

( ipotesi alternativa: H 1

). Queste due si dicono ipotesi

semplici perché sono numeri e sono uguaglianze.

In quest’esempio la statistica (stimatore) da usare è la media campionaria.

Il punto chiave è definire la regione di rifiuto (R)

Errore di prima specie è la probabilità di rifiutare H 0

quando H 0

è vera: P (R | H 0

α --> |: “condizionato a

Errore di seconda specie è la probabilità di accettare quando è vera l’ipotesi alternativa.

Se R è la regione di rifiuto e A è la regione di accettazione (S x

– A): P (A | H

1

) = β

β è detta potenza del test

Il problema è estrarre un campione e valutare uno stimatore di θ su le realizzazioni del campione

^

θ

= t (X 1

, X

2

, …, X

n

) e si calcola sulle osservazioni x 1

, x 2

, …, x n

e si dovrà valutare se la stima

θ = t (x 1

, x 2

, …, x n

) permette di confermare l’ipotesi nulla oppure no.

Quindi, associato a questo problema si hanno due errori:

Errore di prima specie: P (rifiuto H 0

| H

0

) = α

Errore di seconda specie: P (NON rifiutare H 0

| H

1

β

La prova di ipotesi ha come obiettivo minimizzare entrambi gli errori e il test che minimizza ciò

α e β fu formulato da Neyman e Pearson.

La regione di rifiuto deve avere la forma --> R : L (

θ

0

) / L (

θ

1

K

K è scelta in modo che P (L ( θ 0

) / L ( θ

1

) K) = α

Si cerca P ( X n

< X

x

| H

0

) = α = P (Z < Z

c

X

c

μ

0

– Z

1-alfa

σ /

n --> coda a sinistra

Ipotesi complesse

H

0

μ =¿ μ

0

(semplice)

H

1

--> μ ≠ μ 0

--> ipotesi complessa perché definita da una diseguaglianza

Si fissa alfa (errore di prima specie)

R : X

n

≤ X

L

(unione) X n

≥ X

U

P (

X

n

X

L

(unione)

X

n

X

U

α

Si deve trovare X L

e X u

con la standardizzazione

(X

L

μ

0

σ /

n = Z L

Z

L

= Z

alfa/

= - Z

1 – (alfa/2)

(X

L

μ

0

σ /

n = Z U

Z

U

= Z

1 – (alfa/2)

X

U

μ

0

+ Z

1 – (alfa/2)

σ /

n )

Altra ipotesi

H

0

μ ≥ μ

0

H

1

--> μ < μ 1

Coda da eliminare è la sinistra e la zona di rifiuto è: R :

X

n

< X

c

P (

X

n

< X

c

| H

0

α

(X

c

- μ

0

) / σ /

n

= Z

alfa

= - Z

1 – alfa

ESERCIZIO 6 DELL’ESAME DEL 11/01/2018 TESTO B

X N ( μ , σ

2

) σ

2

= 16 n = 64 campione casuale

Date le due ipotesi: H 0

: μ 0

= 20 H

1

: μ 1

a) Definire la probabilità di commettere un errore di prima specie e quindi determinare il punto critico e la

regione di rifiuto per l’ipotesi nulla a livello di significatività α = 0,

P (Rifiutare H 0

| H

0

) = α

È la probabilità di rifiutare H 0

quando questa è vera.

Media campionaria > X c

(eliminare coda a destra)R : X

n

> X

c

Z = Z

1 – 0,

= Z

0,

Z

0,

(X

c

μ

0

σ /

n = Z 1 – alfa

 (X

c

– 20) / 4/8 = Z

0,

Se maggiore di questo numero si rifiuta

b) Definire la potenza del test e calcolarla

La potenza del test è la probabilità di rifiutare l’ipotesi nulla quando questa non è vera.

β = P (rifiutare H 0

| H

1

) = P (

X

n

> 20,22 | H

1

) = P (Z >

Z

Per trovare la potenza del test normalizzare per

μ

1

e non per

μ

0

Z

X

n

μ

1

σ /

n = (20,22 – 22) / 4/8 = - 2,

- 2,36 = Z

0,

P (Z > Z

0,

) --> si elimina la coda si sinistra, in cui l’area equivale a 0,

P (Z > Z

0,

) = 1 – 0,0091 = 0,99 --> test molto affidabile