Scarica intervallo di confidenza e più Appunti in PDF di Statica solo su Docsity!
Statistica Inferenziale
a) L’Intervallo di Confidenza
b) La distribuzione t di Student
c) La differenza delle medie
d) L’intervallo di confidenza della differenza
Prof Paolo Chiodini
Dalla Popolazione al Campione e Ritorno
POPOLAZIONE
CAMPIONAMENTO
CAMPIONE
PARAMETRO
STIMA
INFERENZA
Qual è la Media della Popolazione?
CAMPIONE
POPOLAZIONE
CAMPIONAMENTO
Stimare i Parametri della Popolazione
- La media del gruppo (campione) è una stima puntuale
del parametro della popolazione
- La stima puntuale non da indicazioni sulla variabilità
della stima
- L’intervallo di confidenza è la stima intervallare del
parametro della popolazione
- Ogni media di gruppo fornisce una diversa stima
connessa alle fluttuazioni casuali dovute al
campionamento
- Costruisco un intervallo centrato intorno alla media di
gruppo sul quale ho una certa confidenza che il
parametro della popolazione cada nell’intervallo
Intervallo di Confidenza e Parametro
Intervallo di Confidenza e Parametro
Intervallo di Confidenza
- Gli intervalli di confidenza sono definiti come un
intervallo di valori costruito a partire dai dati
- All’interno dell’intervallo ho una certa probabilità
(tipicamente 95%) che sia compreso il parametro della
popolazione
- Per calcolare l’intervallo utilizzo le proprietà della
distribuzione di campionamento delle medie
La distribuzione delle medie campionarie approssima la
distribuzione Gaussiana, quindi il rapporto
è distribuito come una gaussiana standardizzata nella quale
e quindi sostituendo a Z il rapporto standardizzato ottengo
Calcolo dell’Intervallo di Confidenza al 95%
Pr 1. 96 1. 96 = 0. 95
n
X
Pr { − 1. 96 ≤ Z ≤ 1. 96 } = 0. 95
n
X
Z
σ
Possiamo manipolare la disuguaglianza all’interno delle parentesi
moltiplicando i tre termini per σ/√σ/√σ/√σ/√ n
sottraendo da ciascun terminex e cambiando di segno
Calcolo dell’Intervallo di Confidenza al 95%
Pr 1. 96 1. 96 = 0. 95
n
X
Pr 1. 96 1. 96 = 0. 95
n
X
n
X σ μ^ σ
Pr 1. 96 1. 96 = 0. 95
n
X
n
Esempio di Calcolo dell’Intervallo di Confidenza al 95%
n = 20
x = 170
z = 1.
Informazioni
Limite Inferiore
Limite Superiore
− ⋅ + ⋅ n
X z n
X z σ^ ,^ σ
Intervallo di Confidenza
- Maggiore è l’ampiezza dell’ Intervallo di Confidenza
minore è la precisione della stima
- La sua ampiezza, e quindi la precisione della stima,
varia con la numerosità dello studio e il grado di
confidenza desiderato
All’aumentare della numerosità l’ampiezza
diminuisce e la precisione aumenta
All’aumentare del grado di confidenza (es. 99%
invece di 95%) l’ampiezza aumenta e la precisione
diminuisce
Proprietà
Se σσσσ è sconosciuta?
Problema
Se la varianza della popolazione σσσσ² non è nota?
(NB se μμμμ non è nota, è probabile che anche σσσσ² non sia nota)
Soluzione
Utilizzo la varianza campionaria s ² come stima di σσσσ²
(NB nella formula della varianza divido per (n-1) : i gradi di libertà)
Distribuzione t di Student e Intervallo di Confidenza
Consideriamo i dati sull’altezza raccolti da
un gruppo di studenti
n = 20
x = 172.
s = 10.
Qual è l’intervallo di confidenza al 95% della
media?
Distribuzione t di Student e Intervallo di Confidenza
Occorre modificare la formula precedente
− ⋅ + ⋅ n
X z n
X z σ^ ,^ σ
tenendo conto delle nuove informazioni
− (^) − ⋅ + −⋅ n
X t s n
X t s n 1 , n 1
Quali valori della distribuzione t di Student con 19 gradi
di libertà lasciano un’area nelle due code pari a 0.05?
PROBABILITA' (2 code) PROBABILITA' (1 coda) GL 0,1 0,05 0,02 0,01 0,05 0,025 0,01 0,00 5 1 6,31 12,71 31,82 63,66 6,31 12,71 31,82 63, 2 2,92 4,30 6,96 9,92 2,92 4,30 6,96 9, 3 2,35 3,18 4,54 5,84 2,35 3,18 4,54 5, 4 2,13 2,78 3,75 4,60 2,13 2,78 3,75 4, 5 2,02 2,57 3,36 4,03 2,02 2,57 3,36 4, 6 1,94 2,45 3,14 3,71 1,94 2,45 3,14 3, 7 1,89 2,36 3,00 3,50 1,89 2,36 3,00 3, 8 1,86 2,31 2,90 3,36 1,86 2,31 2,90 3, 9 1,83 2,26 2,82 3,25 1,83 2,26 2,82 3, 10 1,81 2,23 2,76 3,17 1,81 2,23 2,76 3, 11 1,80 2,20 2,72 3,11 1,80 2,20 2,72 3, 12 1,78 2,18 2,68 3,05 1,78 2,18 2,68 3, 13 1,77 2,16 2,65 3,01 1,77 2,16 2,65 3, 14 1,76 2,14 2,62 2,98 1,76 2,14 2,62 2, 15 1,75 2,13 2,60 2,95 1,75 2,13 2,60 2, 16 1,75 2,12 2,58 2,92 1,75 2,12 2,58 2, 17 1,74 2,11 2,57 2,90 1,74 2,11 2,57 2, 18 1,73 2,10 2,55 2,88 1,73 2,10 2,55 2, 19 1,73 2,09 2,54 2,86 1,73 2,09 2,54 2, 20 1,72 2,09 2,53 2,85 1,72 2,09 2,53 2, 21 1,72 2,08 2,52 2,83 1,72 2,08 2,52 2, 22 1,72 2,07 2,51 2,82 1,72 2,07 2,51 2, 23 1,71 2,07 2,50 2,81 1,71 2,07 2,50 2, 24 1,71 2,06 2,49 2,80 1,71 2,06 2,49 2, 25 1,71 2,06 2,49 2,79 1,71 2,06 2,49 2, 26 1,71 2,06 2,48 2,78 1,71 2,06 2,48 2, 27 1,70 2,05 2,47 2,77 1,70 2,05 2,47 2, 28 1,70 2,05 2,47 2,76 1,70 2,05 2,47 2, 29 1,70 2,05 2,46 2,76 1,70 2,05 2,46 2, 30 1,70 2,04 2,46 2,75 1,70 2,04 2,46 2, ∞ 1,64 1,96 2,05 2,33 1,64 1,96 2,05 2,
Percentili della distribuzione t di Student
Area nella coda superiore
-4.0 -3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0 x
f(x)
Area nelle due code
0,
0,
0,
0,
0,
0,
-4,0 -3,0 -2,0 -1,0 0,0 1,0 2,0 3,0 4,0 t
Calcolo dell’Intervallo di Confidenza
Inseriamo le informazioni raccolte nella formula
− (^) − ⋅ + −⋅ n
X t s n
X t s n 1 , n 1
I limiti dell’intervallo di confidenza sono 167.33 e 176.
n = 20
x = 172.
s = 10.
t = 2.
− ⋅ + ⋅ 20
, 172 2. 0910 20
172 2. 0910
Altezza della Popolazione di Studenti per Genere
Altezza (cm)
Frequenza
Altezza (cm)
Frequenza
DONNE
μd = 165.8 cm
UOMINI
μu = 178.5 cm
La differenza dell’altezza tra Uomini e Donne: μu - μd = 12.7 cm
Altezza di un Campione di Studenti per Genere
Altezza (cm)
Frequenza
DONNE
xd = 165.4 cm
Altezza (cm)
Frequenza
UOMINI
xu = 177.3 cm
La differenza dell’altezza tra Uomini e Donne: xu - xd = 11.8 cm
Distribuzione della differenza delle medie
( ) ( )
n n
x x
Z
σ
μ μ
Qual è la probabilità che la differenza media di altezza tra
uomini e donne in un gruppo formato da 10 uomini e 10 donne
sia inferiore a 6 cm?
Problema
Soluzione
La distribuzione della differenza delle medie campionarie è
gaussiana allora utilizzo il rapporto standardizzato:
La tavola della distribuzione Gaussiana Standardizzata
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.
Variabile Casuale Gaussiana Standardizzata
-4.0 -3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0 x
f(x)
P(xu- xd < 6) =
Calcolo dell’Intervallo di Confidenza al 95%
nu = 8
nd = 12
xu = 177.
xd = 165.
z = 1.
Informazioni
Limite Inferiore
Limite Superiore
( ) ( )
u d
u d
u d
u d
n n
X X z
n n
X X z
σ σ
( ) 11. 9 7. 6 4. 3
( ) 11. 9 7. 6 19. 5
^ +
Se σσσσ è sconosciuta?
Problema
Se la varianza della popolazione σσσσ² non è nota?
Soluzione
Utilizzo le due varianze campionarie e per stimare la
varianza della popolazione:
s 1 s
( ) ( )
n n
n S n S
S pooled
In questo caso la distribuzione delle differenza delle medie
approssima alla distribuzione t con n 1 + n 2 - 2 gradi di libertà
Calcolo dell’Intervallo di Confidenza al 95%
nu = 8
nd = 12
xu = 177.
xd = 165.
su^2 = 58.
sd^2 = 51.
gl = 18
t 18 = 2.
Informazioni
Limite Inferiore
Limite Superiore
( ) ( )
u d
u d gl pooled
u d
u d gl pooled
n n
X X t s
n n
X X t s
( ) 11. 9 7. 1 4. 8
( ) 11. 9 7. 119. 0
^ +