Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Inferenza Statistica: Stima Puntuale e Intervalli di Confidenza, Esercizi di Statistica

Una panoramica completa dell'inferenza statistica, concentrandosi sulla stima puntuale e sugli intervalli di confidenza. Esplora concetti chiave come stimatori corretti e non distorti, errore quadratico medio, consistenza in probabilità, teorema del limite centrale, proporzione campionaria e varianza campionaria. Anche il metodo della massima verosimiglianza per la costruzione di stimatori e fornisce esempi pratici per la determinazione della numerosità campionaria e la costruzione di intervalli di confidenza.

Tipologia: Esercizi

2024/2025

Caricato il 27/01/2025

AnnaaVittoriaa
AnnaaVittoriaa 🇮🇹

2 documenti

1 / 28

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
La distribuzione della probabilità della variabile casuale popolazione 𝑋 è di FORMA NOTA,
ma contenente uno o più parametri incogniti
Es.
- 𝑋 variabile casuale Bernoulliana con 𝜋=𝑃(𝑋=1) incognita
𝜋 è il parametro incognito
- 𝑋 variabile casuale Normale 𝑁(𝜇,𝜎2)
𝜇 e/o 𝜎2 parametro incognito
In generale con 𝑋 la variabile casuale “popolazione”, e con 𝑓(𝑥;𝜃) la sua distribuzione di
probabilità in cui 𝜃 = parametro incognito
Si effettuano 𝑛 osservazioni della popolazione condotte in modo indipendente
CAMPIONE CASUALE della popolazione 𝑋
(𝑋1,𝑋2,,𝑋𝑛)
Collezione di 𝑛 variabili casuali:
𝑋1 = prima osservazione
𝑋2 = seconda osservazione
𝑋𝑛 = ennesima osservazione
Assunzione di base:
Le variabili casuali 𝑋1,𝑋2,,𝑋𝑛 sono indipendenti
Le variabili casuali 𝑋1,𝑋2,,𝑋𝑛 hanno tutte la stessa distribuzione di probabilità che è
uguale a 𝑓(𝑥;𝜃)
(coincidente con quella della popolazione)
Del campione casuale 𝑋1,𝑋2,,𝑋𝑛 si osserva una realizzazione: 𝑥1,𝑥2,,𝑥𝑛 che da luogo ai
DATI STATISTICI CAMPIONARI
STATISTICA CAMPIONARIA = è una qualunque funzione del campione casuale 𝑋1,𝑋2,,𝑋𝑛
𝑆𝑛(𝑋1,𝑋2,,𝑋𝑛)
Funzione della variabile casuale 𝑋1,𝑋2,,𝑋𝑛 che formano il campione casuale, quindi è una
variabile casuale anch’essa
STIMA PUNTUALE
Variabile casuale 𝑋 “popolazione” con distribuzione di probabilità 𝑓(𝑥;𝜃)
Di essa di osserva un campione casuale di numerosità 𝑛
𝑋1,𝑋2,,𝑋𝑛 𝑛 variabili casuali indipendenti e tutte con stessa distribuzione di probabilità
Problema: costruire una ragionevole approssimazione numerica per il parametro incognito
𝜃 sulla base dei dati forniti dal mio campione casuale
Il problema viene affrontato mediante la costruzione di una funzione del campione casuale
𝑇𝑛=𝑇(𝑋1,𝑋2,,𝑋𝑛)
che prende il nome di STIMATORE di 𝜃
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c

Anteprima parziale del testo

Scarica Inferenza Statistica: Stima Puntuale e Intervalli di Confidenza e più Esercizi in PDF di Statistica solo su Docsity!

La distribuzione della probabilità della variabile casuale popolazione 𝑋 è di FORMA NOTA,

ma contenente uno o più parametri incogniti

Es.

  • 𝑋 variabile casuale Bernoulliana con 𝜋 = 𝑃

incognita

𝜋 è il parametro incognito

  • 𝑋 variabile casuale Normale 𝑁(𝜇, 𝜎

2

𝜇 e/o 𝜎

2

parametro incognito

In generale con 𝑋 la variabile casuale “popolazione”, e con 𝑓(𝑥; 𝜃) la sua distribuzione di

probabilità in cui 𝜃 = parametro incognito

Si effettuano 𝑛 osservazioni della popolazione condotte in modo indipendente

CAMPIONE CASUALE della popolazione 𝑋

1

2

𝑛

Collezione di 𝑛 variabili casuali:

1

= prima osservazione

2

= seconda osservazione

𝑛

= ennesima osservazione

Assunzione di base:

 Le variabili casuali 𝑋 1

2

𝑛

sono indipendenti

 Le variabili casuali 𝑋 1

2

𝑛

hanno tutte la stessa distribuzione di probabilità che è

uguale a 𝑓(𝑥; 𝜃)

(coincidente con quella della popolazione)

Del campione casuale 𝑋

1

2

𝑛

si osserva una realizzazione: 𝑥

1

2

𝑛

che da luogo ai

DATI STATISTICI CAMPIONARI

STATISTICA CAMPIONARIA = è una qualunque funzione del campione casuale 𝑋

1

2

𝑛

𝑛

1

2

𝑛

Funzione della variabile casuale 𝑋

1

2

𝑛

che formano il campione casuale, quindi è una

variabile casuale anch’essa

STIMA PUNTUALE

Variabile casuale 𝑋 “popolazione” con distribuzione di probabilità 𝑓(𝑥; 𝜃)

Di essa di osserva un campione casuale di numerosità 𝑛

1

2

𝑛

→ 𝑛 variabili casuali indipendenti e tutte con stessa distribuzione di probabilità

Problema: costruire una ragionevole approssimazione numerica per il parametro incognito

𝜃 sulla base dei dati forniti dal mio campione casuale

Il problema viene affrontato mediante la costruzione di una funzione del campione casuale

𝑛

1

2

𝑛

che prende il nome di STIMATORE di 𝜃

CAMPIONE CASUALE DATI STATISTICI CAMPIONARI

𝑛 variabili casuali 𝑛 numeri realizzazioni del campione

casuale

1

2

𝑛

1

2

𝑛

STIMATORE DI 𝜃 STIMA DI 𝜃

variabile casuale realizzazione dello stimatore (numero)

𝑛

1

2

𝑛

𝑛

1

2

𝑛

Lo stimatore deve fornire un’approssimazione numerica precisa di 𝜃 (parametro)

Dovrebbe essere poco disperso intorno a 𝜃: 𝐸

[

𝑛

]

Dispersione dello stimatore 𝑇 𝑛

1

2

𝑛

ERRORE DI STIMA AL QUADRATO

𝑛

2

→ variabile casuale, essendo 𝑇

𝑛

una variabile casuale

ERRORE QUADRATICO MEDIO dello stimatore 𝑇 𝑛

= valore atteso dell’errore di stima al quadrato, misura l’efficienza di uno stimatore

𝒏

= 𝑬[

𝒏

𝟐

]

si scompone in 𝐸𝑄𝑀

𝑛

𝑛

𝑛

2

Errore quadratico grande: stimatore cattivo

Errore quadratico piccolo: stimatore buono

  • Uno stimatore 𝑇

𝑛

di 𝜃 è CORRETTO se 𝐸

[

𝑛

]

  • Uno stimatore 𝑇 𝑛

di 𝜃 è DISTORTO se non è corretto: 𝒅

𝒏

[

𝒏

]

𝑋 variabile casuale popolazione

Con valore atteso 𝜇 = 𝐸[𝑋] (media della popolazione)

E varianza 𝜎

2

= 𝐸[

2

]

1

variabile casuale con la stessa distribuzione della popolazione 𝑋 e con 𝐸

[

1

]

[

]

e 𝑉𝐴𝑅

1

2

𝑛

variabile casuale con la stessa distribuzione della popolazione 𝑋 e con 𝐸

[

𝑛

]

[

]

e 𝑉𝐴𝑅

𝑛

2

1

2

𝑛

sono indipendenti

Problema: stimare 𝜇 (valore atteso della popolazione) sulla base di un campione

casuale 𝑋

1

2

𝑛

di numerosità 𝑛

MEDIA CAMPIONARIA

Stimatore di 𝜇

𝑛

𝑖

𝑛

𝑖= 1

𝑛

1

2

𝑛

1

2

𝑛

Proprietà:

  1. Media campionaria è uno stimatore corretto della media della popolazione

[

𝑛

]

= 𝜇 =media della popolazione

[

𝑛

]

= 𝐸 [

1

2

𝑛

] =

[

1

]

[

2

]

[

𝑛

]

𝑛

𝑛

) perché la distorsione è 0

𝑛

1

2

𝑛

2

1

2

2

2

𝑛

2

2

2

2

2

2

2

2

2

2

2

2

2

𝑛𝑢𝑚𝑒𝑟𝑜𝑠𝑖𝑡à 𝑐𝑎𝑚𝑝𝑖𝑜𝑛𝑎𝑟𝑖𝑎

Combinazione lineare delle

variabili casuali

𝑋

1

, 𝑋

2

, … , 𝑋

𝑛

con

coefficienti

1

𝑛

Cosa succede se 𝑛 aumenta?

Secondo la legge debole dei grandi numeri dimostra che la media campionaria è consistente

in probabilità per 𝜇

𝑛

diminuisce, cioè diminuisce la dispersione di 𝑋

𝑛

intorno a 𝜇

𝑛

diventa sempre più precisa all’aumentare di 𝜇

Se 𝑛 → ∞, 𝑉𝐴𝑅

𝑛

𝜎

2

𝑛

Distribuzione della variabile casuale 𝑋 𝑛

media campionaria

Se vogliamo la distribuzione esatta della media campionaria, abbiamo pochi risultati

Distribuzione approssimata di 𝑋 𝑛

TEOREMA DEL LIMITE CENTRALE

𝑋

𝑛

̅̅̅̅ −E[𝑋

𝑛

̅̅̅̅ ]

√𝑉𝐴𝑅

( 𝑋 𝑛

̅̅̅̅ )

≈ 𝑁( 0 , 1 ) per 𝑛 grande 𝐸

[

𝑛

]

= 𝜇 e 𝑉𝐴𝑅

2

2

𝑋 𝑛

̅̅̅̅ −𝜇

𝜎

2

𝑛

𝑋

𝑛

̅̅̅̅ −𝜇

𝜎

2

𝑛

≈ 𝑁( 0 , 1 ) per 𝑛 grande

In pratica significa che per 𝑛 grande (𝑛 > 30 𝑜 𝑛 > 50 ) posso approssimare la distribuzione

di 𝑋

𝑛

con una Normale 𝑁 (𝜇,

𝜎

2

𝑛

𝑛

2

PROPORZIONE CAMPIONARIA

= frequenza relativa dei successi nel campione

Popolazione costituita da parti classificate come favorevoli (= successo, 1) o sfavorevoli (=

insuccesso, 0)

Popolazione descritta dalla variabile casuale 𝑋~𝐵𝑒𝑟(𝜋) con 𝜋 = 𝐸[𝑋]

Per stimare 𝜋 si utilizza la proporzione di successi nel campione (𝑋

1

2

𝑛

1

2

𝑛

= numero di successi nel campione

Lo stimatore di 𝜋 è la PROPORZIONE CAMPIONARIA

𝒊

𝒏

𝒊=𝟏

Media campionaria di una popolazione bernoulliana

Stimatore non distorto: 𝐸

[

]

Consistente in probabilità per 𝜋

Varianza di una variabile casuale bernoulliana: 𝑉𝐴𝑅

METODI DI COSTRUZIONE DEGLI STIMATORI: Metodo della massima verosimiglianza

Sia 𝑋~𝑓(𝑥; 𝜃) variabile casuale che descrive la popolazione

Si considera come stima di 𝜃 il valore 𝑡 𝑛

per il quale è massima la probabilità del campione

Variabili campionarie 𝑋 1

2

𝑛

indipendenti con stessa funzione di densità 𝑓(𝑥; 𝜃)

Funzione di densità del campione: 𝑓

1

2

𝑛

FUNZIONE DI VEROSOMIGLIANZA: 𝐿(𝜃) = 𝑓(𝑥

1

2

𝑛

Esprime quanto è verosimile che il valore del parametro sia 𝜃

Stima massima di verosimiglianza: valore per il quale 𝐿

è massima

Modello Stimatori di massima verosimiglianza

𝑖

𝑛

𝑖= 1

2

𝑖

𝑛

𝑖= 1

2 ̂

𝑖

2

𝑛

𝑖= 1

DETERMINAZIONE DELLA NUMEROSITA’ CAMPIONARIA PER LA MEDIA

Vincolo: 𝑆 = 𝐶

𝐹

𝐼

quindi 𝑛 =

𝑆−𝐶

𝐹

𝐶

𝐼

< 𝜀 dove 𝜀 = errore ritenuto tollerabile

Poiché 𝑋

è consistente in probabilità, la certezza che

< 𝜀 si ha per 𝑛 infinitamente

grande

Determinare 𝑛 tale che 𝑃

INTERVALLI DI CONFIDENZA

Plausibili valori per un parametro se lo stimatore è una variabile casuale continua

Riassume il grado di incertezza sul valore del parametro

La lunghezza degli intervalli si riduce quando la numerosità campionaria aumenta

𝑋~𝑓(𝑥; 𝜃) variabile casuale che descrive la popolazione

Intervallo di confidenza = stimatore di 𝜃 determinato in base a un campione casuale

1

2

𝑛

Produce come stima un insieme di plausibili valori per 𝜃

  • Estremo inferiore 𝐿 1

1

1

2

𝑛

  • Estremo superiore 𝐿 2

2

1

2

𝑛

Intervallo di confidenza (𝐿

1

2

) è un intervallo casuale

Funzioni del campione osservato:

1

1

1

2

𝑛

2

2

1

2

𝑛

Insieme di valori che verosimilmente comprende il parametro con alta probabilità

Probabilità = LIVELLO DI CONFIDENZA

1

2

= 1 − 𝛼 (frequenza relativa)

 INTERVALLO DI CONFIDENZA PER LA MEDIA DI POPOLAZIONE CON VARIANZA NOTA

Variabile casuale normale 𝑋~𝑁

2

[

]

= 𝜇 incognita

2

nota

Per costruire intervallo di confidenza: QUANTITA’ PIVOT = funzione del campione e del

parametro

In questo caso si può usare la media campionaria standardizzata:

2

2

2

2

Funzione di ripartizione = Φ (𝑧

𝑎

2

1 −𝛼

2

Può essere riscritta in modo tale da ottenere un intervallo di confidenza per 𝜇

2

2

𝛼

2

𝛼

2

𝛼

2

𝛼

2

Estremi:

1

𝑧 𝛼

2

𝜎

𝑛

2

𝑧𝛼

2

𝜎

√𝑛

Si ottiene intervallo di confidenza (𝐿

1

2

) tale che 𝑃(𝐿

1

2

Statistiche campionarie: variabili casuali

Estremi:

1

𝑧 𝛼

2

𝜎

𝑛

2

𝑧𝛼

2

𝜎

√𝑛

 INTERVALLO DI CONFIDENZA PER LA PROBABILITA’ DI SUCCESSO DI UNA VARIABILE

CASUALE DI BERNOULLI

Variabile casuale Bernoulliana 𝑋~𝐵𝑒𝑟

Stimatore della media: 𝑝̂

Stimatore della varianza: 𝑝̂ ( 1 − 𝑝̂ )

Di conseguenza la proporzione campionaria standardizzata è:

Per 𝑛 sufficientemente grande, ha distribuzione approssimativamente normale

standardizzata

2

2

2

2

𝛼

2

𝛼

2

𝛼

2

𝛼

2

Estremi:

1

𝛼

2

𝑝̂

( 1 −𝑝̂

)

𝑛

2

𝛼

2

𝑝̂( 1 −𝑝̂)

𝑛

Estremi

VARIANZA NOTA

𝑍 =

𝑋

̅

− 𝜇

𝜎/ √

𝑛

𝑃

( −𝑧

𝛼

2

<

𝑋

̅

− 𝜇

𝜎/ √

𝑛

< 𝑧

𝛼

2

) = 1 − 𝛼

𝑃 (𝑋

̅

𝑧𝛼

2

𝜎

√𝑛

< 𝜇 < 𝑋

̅

𝑧𝛼

2

𝜎

√𝑛

) = 1 − 𝛼

𝐿

1

= 𝑋

̅

𝑧𝛼

2

𝜎

√𝑛

𝐿

2

= 𝑋

̅

𝑧 𝛼

2

𝜎

√𝑛

VARIANZA INCOGNITA

𝑍 =

𝑋

̅

− 𝜇

𝜎̂ /√𝑛

𝑃 (−𝑡

𝑛− 1 ,

𝛼

2

<

𝑋

̅

− 𝜇

𝜎̂ / √

𝑛

< 𝑡

𝑛− 1 ,

𝛼

2

) = 1 − 𝛼

𝑃 (𝑋

̅

− 𝑡

𝑛− 1 ,

𝛼

2

𝜎̂ /√𝑛 < 𝜇 < 𝑋

̅

  • 𝑡

𝑛− 1 ,

𝛼

2

𝜎̂ /√𝑛) = 1 − 𝛼

𝐿

1

= 𝑋

̅

− 𝑡

𝑛− 1 ,

𝛼

2

𝜎̂ / √

𝑛

𝐿

2

= 𝑋

̅

  • 𝑡

𝑛− 1 ,

𝛼

2

𝜎̂ /√𝑛

NON NORMALE

𝑍 =

𝑋

̅

− 𝜇

𝜎/ √

𝑛

𝑃 (−𝑧𝛼

2

<

𝑋

̅

− 𝜇

𝜎/ √

𝑛

< 𝑧𝛼

2

) ≅ 1 − 𝛼

𝑃 (𝑋

̅

− 𝑧𝛼

2

𝜎̂ /√𝑛 < 𝜇 < 𝑋

̅

  • 𝑧𝛼

2

𝜎̂ /√𝑛) = 1 − 𝛼

𝐿

1

= 𝑋

̅

𝑧 𝛼

2

𝜎

√𝑛

𝐿

2

= 𝑋

̅

𝑧𝛼

2

𝜎

𝑛

BERNOULLI

𝑍 =

𝑝̂ − 𝜋

𝑝̂ ( 1 − 𝑝̂ )

𝑛

𝑃 (−𝑧𝛼

2

<

𝑝̂ − 𝜋

√𝑝̂

( 1 − 𝑝̂

) /𝑛

< 𝑧𝛼

2

) ≅ 1 − 𝛼

𝑃 (𝑝̂ − 𝑧

𝛼

2

𝑝̂( 1 −𝑝̂ )

𝑛

< 𝜋 < 𝑝̂ + 𝑧

𝛼

2

𝑝̂ ( 1 −𝑝̂)

𝑛

) ≅ 1 − 𝛼

𝐿

1

= 𝑝̂ − 𝑧

𝛼

2

𝑝̂

( 1 −𝑝̂

)

𝑛

𝐿

2

= 𝑝̂ + 𝑧

𝛼

2

𝑝̂ ( 1 −𝑝̂ )

𝑛

ERRORI NEL TEST DELLE IPOTESI

Decisione 𝐻

0

vera 𝐻

0

falsa

0

respinta ERRORE I TIPO

Decisione corretta

0

non respinta Decisione corretta

ERRORE II TIPO

𝛼 e 𝛽 sono legate inversamente

Nel test delle ipotesi si fissa la probabilità dell’errore di tipo I (ritenuto più grave)

Procedimento di verifica di un sistema di ipotesi:

  1. Si fissa il livello di significatività di 𝛼
  2. Si individua la statistica test 𝑇

𝑛

  1. Nell’insieme di valori assunti da 𝑇 𝑛

si individua una regione critica tale che la probabilità

dell’errore di tipo I sia pari ad 𝛼

 TEST UNIDIREZIONALE SULLA MEDIA DI UNA POPOLAZIONE NORMALE CON VARIANZA

NOTA

  1. Confrontiamo un’ipotesi nulla semplice sulla media con un’ipotesi alternativa composita

unidirezionale

0

0

verso 𝐻

1

0

Se l’ipotesi nulla è vera, la media campionaria standardizzata ha distribuzione nota

𝑛

0

𝐻

0

𝑛

𝛼

Dove 𝑧

𝛼

è determinato in modo che

0

0

𝑛

0

𝑛

𝛼

0

0

𝛼

0

Valore della funzione di ripartizione di 𝑍 in 𝑧

𝛼

è Φ

𝛼

𝑥̅ −𝜇

0

𝜎

√𝑛

𝛼

𝑥̅ −𝜇

0

𝜎

𝑛

𝛼

  1. Se l’ipotesi nulla è un’ipotesi composita del tipo 𝐻

0

0

e si confrontano le due

ipotesi unidirezionali

0

0

verso 𝐻

1

0

Regola di decisione = {

𝑥̅ −𝜇 0

𝜎

√𝑛

𝛼

0

𝑛𝑜𝑛 è 𝑟𝑒𝑠𝑝𝑖𝑛𝑡𝑎

𝑥̅ −𝜇

0

𝜎

√𝑛

𝛼

0

è 𝑟𝑒𝑠𝑝𝑖𝑛𝑡𝑎

La regola di decisione rimane inalterata

Il livello di significatività 𝛼 diventa la massima probabilità di commettere l’errore di tipo I

2

con 𝜎

2

nota

Sottoponiamo a test un’ipotesi nulla del tipo 𝐻

0

0

o 𝐻

0

0

verso 𝐻

1

0

0

𝛼

0

𝛼

𝑥̅ −𝜇 0

𝜎

√𝑛

𝛼

𝑥̅ −𝜇

0

𝜎

√𝑛

𝛼

 TEST UNIDIREZIONALE SULLA MEDIA DI UNA POPOLAZIONE NORMALE CON VARIANZA

INCOGNITA

2

) e supponiamo di voler confrontare due ipotesi unidirezionali

0

0

verso 𝐻

1

0

Se la varianza non è nota, non è possibile utilizzare come statistica test la media

campionaria standardizzata

Quando 𝜇 = 𝜇

0

, la media campionaria studentizzata ha distribuzione nota:

𝑛

0

𝜇=𝜇

0

𝑛− 1

Dove 𝜎̂

2

è lo stimatore non distorto della varianza

Valore critico:

𝑛

𝑛− 1 ,𝛼

0

0

𝑛− 1 ,𝛼

0

𝑛− 1

𝑛− 1 ,𝛼

𝑥̅ −𝜇 0

𝜎

√𝑛

𝑛− 1 ,𝛼

𝑥̅ −𝜇

0

𝜎

√𝑛

𝑛− 1 ,𝛼

  1. Quando le ipotesi da sottoporre al test sono 𝐻

0

0

verso 𝐻

1

0

0

𝑛− 1 ,𝛼

0

𝑛− 1

𝑛− 1 ,𝛼

𝑥̅ −𝜇 0

𝜎

√𝑛

𝑛− 1 ,𝛼

𝑥̅ −𝜇

0

𝜎

√𝑛

𝑛− 1 ,𝛼

Regola di decisione = {

𝑥̅ −𝜇

0

𝜎

𝑛

𝛼

0

𝑛𝑜𝑛 è 𝑟𝑒𝑠𝑝𝑖𝑛𝑡𝑎

𝑥̅ −𝜇 0

𝜎

√𝑛

𝛼

0

è 𝑟𝑒𝑠𝑝𝑖𝑛𝑡𝑎

𝑥̅ −𝜇

0

𝜎

𝑛

𝛼

  1. Per verificare il sistema di ipotesi bidirezionale 𝐻

0

0

verso 𝐻

1

0

𝑥̅ −𝜇 0

𝜎

√𝑛

𝛼

2

𝑥̅ −𝜇

0

𝜎

√𝑛

𝛼

2

dove 𝑧

𝛼

2

è tale che 𝑃(𝑍 < −𝑧

𝛼

2

𝛼

2

𝛼

2

 TEST SULLA PROBABILITA’ DI SUCCESSO DI UNA VARIABILE CASUALE DI BERNOULLI

Se 𝜋 = 𝜋

0

allora 𝐸

[

]

0

e 𝑉𝐴𝑅

0

0

Per la proporzione campionaria risulta: 𝐸[𝑝̂ ] = 𝜋

0

e 𝑉𝐴𝑅(𝑝̂ ) =

𝜋

0

( 1 −𝜋

0

)

𝑛

si può quindi utilizzare come statistica test:

𝑝̂ −𝜋

0

𝜋

0

( 1 −𝜋

0

)

𝑛

ossia la media campionaria standardizzata per una Bernoulliana

Per il Teorema del limite centrala, quando 𝜋 = 𝜋

0

la statistica test ha distribuzione

asintoticamente normale e per 𝑛 sufficientemente grande si ha

0

0

0

  1. Per verificare il sistema di ipotesi 𝐻

0

0

verso 𝐻

1

0

oppure 𝐻

0

0

verso

1

0

𝑝̂−𝜋

0

𝜋

0

( 1 −𝜋

0

)

𝑛

𝛼

𝑝̂−𝜋 0

𝜋 0

( 1 −𝜋 0

)

𝑛

𝛼

dove 𝑧

𝛼

è tale che 𝑃(𝑍 > 𝑧

𝛼

  1. Per verificare il sistema di ipotesi 𝐻 0

0

verso 𝐻

1

0

oppure 𝐻

0

0

verso

1

0

𝑝̂−𝜋

0

𝜋

0

( 1 −𝜋

0

)

𝑛

𝛼

𝑝̂−𝜋

0

𝜋

0

( 1 −𝜋

0

)

𝑛

𝛼

  1. Per verificare il sistema di ipotesi bidirezionale 𝐻 0

0

verso 𝐻

1

0

𝑝̂ −𝜋

0

𝜋

0

( 1 −𝜋

0

)

𝑛

𝛼

2

𝑝̂ −𝜋

0

𝜋

0

( 1 −𝜋

0

)

𝑛

𝛼

2

dove 𝑧

𝛼

2

è tale che 𝑃(𝑍 < −𝑧

𝛼

2

𝛼

2

𝛼

2

UNIDIREZIONALE DX

𝐻

0

: 𝜇 = 𝜇

0

o 𝐻

0

: 𝜇 ≤ 𝜇

0

verso

𝐻

1

: 𝜇 > 𝜇

0

UNIDIREZIONALE SX

𝐻

0

: 𝜇 = 𝜇

0

o 𝐻

0

: 𝜇 ≥ 𝜇

0

verso

𝐻

1

: 𝜇 < 𝜇

0

BIDIREZIONALE

𝐻

0

: 𝜇 = 𝜇

0

verso

𝐻

1

: 𝜇 ≠ 𝜇

0

NORMALE VARIANZA

NOTA

𝑇 𝑛

= (

𝑋

̅ −𝜇 0

𝜎

𝑛

)

𝐻

0

~𝑁( 0 , 1 )

𝑅. 𝐴. =

𝑥̅ −𝜇 0

𝜎

𝑛

≤ 𝑧

𝛼

𝑅. 𝐶. =

𝑥̅ −𝜇

0

𝜎

𝑛

𝑧

𝛼

𝑅. 𝐴. =

𝑥̅ −𝜇 0

𝜎

𝑛

≥ −𝑧

𝛼

𝑅. 𝐶. =

𝑥̅ −𝜇

0

𝜎

𝑛

< −𝑧

𝛼

NORMALE VARIANZA

INCOGNITA

𝑇 𝑛

= (

𝑋

̅ −𝜇

0

𝜎̂

√𝑛

)

𝜇=𝜇 0

~𝑡

𝑛− 1

𝑅. 𝐴. =

𝑥̅ −𝜇

0

𝜎̂

√𝑛

≤ 𝑧

𝛼

𝑅. 𝐶. =

𝑥̅ −𝜇 0

𝜎̂

𝑛

𝑧

𝛼

𝑅. 𝐴. =

𝑥̅ −𝜇

0

𝜎̂

√𝑛

≥ −𝑡

𝑛− 1 ,𝛼

𝑅. 𝐶. =

𝑥̅ −𝜇 0

𝜎̂

𝑛

< −𝑡

𝑛− 1 ,𝛼

𝑅. 𝐴. = |

𝑥̅ −𝜇

0

𝜎̂

√𝑛

| ≤ 𝑡

𝑛− 1 ,

𝛼

2

𝑅. 𝐶. =

|

𝑥̅ −𝜇 0

𝜎̂

𝑛

|

𝑡

𝑛− 1 ,

𝛼

2

NON NORMALE

𝑇 𝑛

=

𝑋

̅ −𝜇 0

𝜎̂

𝑛

𝑅. 𝐴. =

𝑥̅ −𝜇

0

𝜎̂

√𝑛

≤ 𝑧

𝛼

𝑅. 𝐶. =

𝑥̅ −𝜇 0

𝜎̂

𝑛

𝑧

𝛼

𝑅. 𝐴. =

𝑥̅ −𝜇

0

𝜎̂

√𝑛

≥ −𝑧

𝛼

𝑅. 𝐶. =

𝑥̅ −𝜇 0

𝜎̂

𝑛

< −𝑧

𝛼

𝑅. 𝐴. = |

𝑥̅ −𝜇

0

𝜎̂

√𝑛

| > 𝑧

𝛼

2

𝑅. 𝐶. =

|

𝑥̅ −𝜇 0

𝜎̂

𝑛

| ≤ 𝑧

𝛼

2

BERNOULLI

𝑇 𝑛

=

𝑝̂−𝜋 0

𝜋 0

( 1 −𝜋 0

)

𝑛

𝑅. 𝐴. =

𝑝̂−𝜋

0

𝜋

0

( 1 −𝜋

0

)

𝑛

≤ 𝑧

𝛼

𝑅. 𝐶. =

𝑝̂ −𝜋 0

𝜋 0

( 1 −𝜋 0

)

𝑛

𝑧

𝛼

𝑅. 𝐴. =

𝑝̂−𝜋

0

𝜋

0

( 1 −𝜋

0

)

𝑛

≥ −𝑧

𝛼

𝑅. 𝐶. =

𝑝̂ −𝜋 0

𝜋 0

( 1 −𝜋 0

)

𝑛

< −𝑧

𝛼

𝑅. 𝐴. =

|

𝑝̂−𝜋 0

𝜋 0

( 1 −𝜋 0

)

𝑛

|

𝑧

𝛼

2

𝑅. 𝐶. = |

𝑝̂ −𝜋 0

𝜋 0

( 1 −𝜋 0

)

𝑛

| ≤ 𝑧

𝛼

2

TEST CHI QUADRATO

𝑡 𝑛

=

𝑟 𝑋𝑌

√ ( 1 −𝑟

𝑋𝑌

2

)/(𝑛− 2 )

𝑅. 𝐴. : |𝑡

𝑛

| ≤ 𝑡

𝑛− 2 ,

𝛼

2

𝑅. 𝐶. :

| 𝑡

𝑛

|

𝑡

𝑛− 2 ,

𝛼

2

POTENZA DEL TEST 𝜸

= probabilità di respingere l’ipotesi nulla quando è falsa

Probabilità dell’errore di II tipo (𝛽)

A differenza di 𝛼 e di 𝛽, la potenza del test esprime la probabilità che si assuma una

decisione corretta

0

1

𝑛

1

Riducendo il livello di significatività si riduce la potenza del test (si riduce la probabilità di

respingere l’ipotesi nulla sia quando è vera sia quando è falsa

Quando l’ipotesi alternativa è COMPOSITA è possibile calcolare la potenza del test per

particolari valori del parametro compresi sotto l’ipotesi alternativa

1) NORMALE CON VARIANZA NOTA

2

Vogliamo verificare le ipotesi 𝐻

0

0

verso 𝐻

1

0

sulla base di un campione di

numerosità 𝑛

È possibile calcolare la potenza del test quando la media assume un valore 𝜇

1

tale che

1

0

Poiché la varianza è nota si utilizza la media campionaria come statistica test e la regione

critica è:

0

𝛼

Ciò significa che l’ipotesi nulla è respinta quando il valore osservato della media

campionaria 𝑥̅ è maggiore di 𝜇

0

𝛼

𝜎

𝑛

e quindi la regione critica può essere ridefinita

come:

0

𝛼

Potenza del test quando la media è 𝜇

1

è data da:

1

0

𝛼

1

  • Per valori del parametro compresi sotto l’ipotesi alternativa la potenza del test varia tra

il livello di significatività 𝛼 e 1

  • Aumentando la numerosità campionaria è possibile che la potenza del test tenda più

rapidamente a 1

2) BERNOULLIANA

Vogliamo verificare le ipotesi 𝐻

0

0

verso 𝐻

1

0

0

0

0

2

0

𝛼

2

0

0

0

𝛼

2

0

0

Potenza del test quando la probabilità di successo assume il valore 𝜋

1

𝛾

( 𝜋

1

) = 𝑃 (𝑝̂ < 𝜋

0

− 𝑧

𝛼

2

√𝜋

0

( 1 − 𝜋

0

)/𝑛

| 𝜋 = 𝜋

1

) 𝑃 (𝑝̂ > 𝜋

0

  • 𝑧

𝛼

2

√𝜋

0

( 1 − 𝜋

0

)/𝑛

| 𝜋 = 𝜋

1

)

  • La potenza varia fra il livello di significatività 𝛼 e 1
  • Aumenta quando il valore del parametro si allontana dai valori considerati sotto l’ipotesi

nulla

  • Aumentando il livello di significatività è possibile aumentare la potenza del test
  • La potenza del test tede tanto più rapidamente a 1 quanto maggiore è la numerosità

campionari

INTERVALLI DI CONFIDENZA E TEST DELLE IPOTESI BIDIREZIONALI

Se la statistica test e la quantità pivot hanno la stessa espressione, avendo a disposizione un

intervallo di confidenza, è possibile predire l’esito del test

Un intervallo di confidenza è costituito da tutti i valori del parametro 𝜃

0

per i quali l’ipotesi

nulla 𝜃 = 𝜃 0

non è respinta

Popolazione normale

2

Vogliamo verificare le ipotesi 𝐻 0

0

verso 𝐻

1

0

sulla base di un campione di

numerosità 𝑛 al livello di significatività 𝛼

0

𝑛− 1 ,

𝛼

2

La statistica test assume valori tra:

𝑛− 1 ,

𝛼

2

0

𝑛− 1 ,

𝛼

2

𝑛− 1 ,

𝛼

2

0

𝑛− 1 ,

𝛼

2