

Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Formulario statistica per esame
Tipologia: Schemi e mappe concettuali
1 / 3
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!


𝑃(𝐴) ≥ 0
𝑃(Ω) = 1
𝑃
( 𝐴⋃𝐵
) = 𝑃
( 𝐴
)
( 𝐵
) 𝑠𝑠𝑒 𝐴⋂𝐵 = ∅
( 𝐵|𝐴
!(#⋂%)
!(#)
Regola della somma
compatibili 𝑃
incompatibili 𝑃(𝐴⋃𝐵) = 𝑃(𝐴) + 𝑃(𝐵)
se due eventi sono incompatibili, la P(A|B)=0, sono fortemente dipendenti
Regola del prodotto
dipendenti 𝑃
indipendenti 𝑃(𝐴⋂𝐵) = 𝑃(𝐴) ∙ 𝑃(𝐵)
Teorema di Bayes
Test diagnostici
T- → ok 𝑃(𝑇 − |𝐷′) specificità
T+ → f+ 𝑃
T- → f- 𝑃
T+ → ok 𝑃(𝑇 + |𝐷) sensibilità
(p. di essere malati dato che il test è uscito +)
!
!
(per malattie rare, in cui il T è molto specifico, evito screening di massa, troppi f+)
Variabili casuali
i valori/elementi sono finiti o comunque infiniti ma numerabili, → funzione di massa di
probabilità f(Y) : la v.c. assume valori specifici, mi permette di calcolare la P(Y=y) ovvero
la probabilità che Y assuma determinati valori, ciascuno degli elementi del supporto.
Bernoulli 𝑌~𝐵𝑒(𝑝)
supporto: 0 → 𝑃
insuccesso
1 → 𝑃(𝑌 = 1 ) successo
"
#$"
in cui:
se 𝑦 = 0 → 𝑓( 0 ) = 1 − 𝑝
se 𝑦 = 1 → 𝑓
i valori/elementi non sono numerabili → funzione di densità di probabilità f(Y) : con la v.c.
fa un’ approssimazione del valore, mi dà la probabilità che Y sia in un intorno molto piccolo
di probabilità di valore P(y-k < Y < y+k) (non posso dire P(Y=y) come nella funzione di
massa poiché la variabile è continua e y non può corrispondere ad uno specifico valore).
Normale 𝑌~𝑁(𝜇,𝜎
%
supporto: y ∈ (- ∞ ,+ ∞ ), y ∈ R
(curva a campana, continua, asintotica, simmetrica rispetto alla media, 𝜇, che coincide
con M, Mod, Me )
punti di flesso: 𝜇 ± 𝜎
%
grande 𝜎 → + dispersione, + flessi lontani (curva “piatta”)
piccolo 𝜎 → - dispersione, + flessi vicini (curva “stretta”)
(il 99,7% sta nell’intervallo 𝜇 ± 3 𝜎
!
, oltre questo intervallo sono eventi
estremamente rari)
Standardizzazione
"
Stimatori – statistiche campionarie (T)
Media campionaria 𝑦A = ∑
&
"
'
Varianza campionaria 𝑆
%
(&
"
$&
) )
'$#
Proporzione campionaria 𝑝̂ =
&
"$%&''
'
) = 𝜇 e 𝐸(𝑝̂ ) = 𝑝
'
e 𝑉𝑎𝑟(𝑝̂) =
,(#$,)
'
^errore standard 𝐷𝑒𝑣𝑆𝑡(𝑌
√'
($)
/*
,,$-
^errore standard 𝐷𝑒𝑣𝑆𝑡
, 0 (#$, 0 )
'
(errore di stima: 𝑇 − 𝜃 → 0 )
Scelta di stimatore puntuale
(non dà una misura dell’errore - > stima a intervalli)
1º criterio
( 𝑇
) − 𝜇 = 0 corretto/non distorto
( 𝑇
) − 𝜇 < 0 sottostima
2º criterio
%
più preciso
Teoremi
1º se 𝑌~𝑁(𝜇
&
%
&
) allora 𝑊 = 𝑎 + 𝑏𝑌~𝑁(𝑎 + 𝑏𝜇
&
%
%
&
1
&
%
&
Consegue → 𝑍
&
)
&
) $ 3
.
√,
se non conosco 𝜎 → 𝑇 =
$ % '
3
√ 5
𝑛− 1
(curva a campana, continua, centrata sempre sullo 0, 𝜇 e 𝜎
!
legati ai gdl, n> 30 approssimo
a N, in caso contrario non si può approssimare, perché la t da più peso agli eventi estremi,
le code del grafico, con N si potrebbero sottostimare questi eventi estremi)
Stima per intervallo
intervallo di confidenza 𝑃
= 1 − 𝛼 livello di confidenza
(se aumenta → intervallo + ampio e +, - precisione)
Metodo del pivot (Q) ( 1 − 𝛼 fissato)
se sono soddisfatti:
intervallo per 𝜇 e 𝜎
%
%
≤ μ ≤ 𝑦A + 𝑧 7
%
intervallo per 𝜇 e NON 𝜎
%
(ma solo se n<30)
,'$#
√'
≤ μ ≤ 𝑦A + 𝑡
,'$#
√'
√
0 ∙ 23
4!
"
,$%&
intervallo per la proporzione p
𝑃 - 𝑝̂ −𝑧 7
8
∙
2
𝑝̂ ( 1 − 𝑝̂ )
𝑛
≤ 𝑝 ≤ 𝑝̂ + 𝑧 7
8
∙
2
𝑝̂ ( 1 − 𝑝̂ )
𝑛
7 = 1 − 𝛼
(per teorema del limite centrale, se 𝑛 ≥ 100 )
*Ampiezza 𝐴 = 𝐿 − 𝑙 = 2 𝑀𝐸 𝐿 = 𝑝̂ + 𝑀𝐸 𝑙 = 𝑝̂ − 𝑀𝐸
𝑀𝐸 =
567
!
=
8
!
*Mergine d’errore
√
'
,'$#
√
'
e 𝑀𝐸(𝑝) = 𝑧"
∙ :
9 :(;< 9 :)
=
*Ampiezza campionari
9 ∙ ;
<
%
=>
%
e 𝑛(𝑝) = 𝑧*
%
𝑝 0 ( 1 −𝑝 0 )
𝑀𝐸
2
(se non ho 𝑝̂ , lo sostituisco con 0.05, situa di max incertezza, approssimazione buona, simmetrico)
stima della media 𝑌
= 𝜇 Var. della media 𝑉𝑎𝑟
'
stima della media 𝑌
= 𝜇 Var. della media 𝑉𝑎𝑟(𝑌
'
?$'
?$#
𝑉𝑎𝑟
( 𝑌
1
:3;<
) < 𝑉𝑎𝑟
( 𝑌
1
=>;
)
piccola
%&'
%&(
fattore di correzione per popolazioni finite, + n è grande, + tende a 1
passo di campionamento 𝑘 =
;
0
=
?
@
= 𝑖 2 − 𝑖 1 𝑐𝑜𝑛𝑡𝑖𝑔𝑢𝑖
n-uple
USO
precisione, scorro tutta la lista di u, copro tutti i livelli della mia Y
( 𝑌
$
)+,
) < 𝑉𝑎𝑟
( 𝑌
$
--)
)
*unità di selezione: individui, ccs di individui da ogni stato
bassa omogeneità tra strati - elevata omogeneità entro strati
h-singolo strato
𝑛 = 𝑛 .(
- dimensione del campione che estraggo dalla popolazion N
𝑁 C
=
=
/
0
1
- dimensione dello strato h-esimo rispetto alla popolazione
𝑛
.
= 𝑊
.
∙ 𝑛 - dimensione del campione dello strato h-esimo
h
?
A
?
- proporzione di popolazione tot. che si trova nello strato h-esimo,
“peso”, + è grande + è il peso dello strato h-esimo sulla popolazione
@
@
%
@
@
^proporzionale
'
?
pro : semplice realizzazione di stimatori.
contro : se ho domini piccoli, rischio che ho poche u da selezionare dallo specifico strato,
n h
troppo piccolo → + variabilità, - precisione.
^non proporzionale (per popolazioni piccole, sovracampiono dagli strati più
piccoli)
Frazione di campionamento:
--sottopopolazioni preesistenti usate come:
strato (creo un ccs estraendo un ccs da ogni grappolo/strato)
unità di selezione (prendo un ccs di grappoli, prendendo tutte le u dei grappoli stessi)
selezionate)
stima del totale (𝑡
n-esimo percentile :
n=P - > la cerco nelle tavole e prendo lo z corrispondente - > con la
formula inversa della standardizzazione trovo il percentile (y)
𝑦 = f𝑧
"
∙ 𝜎g + 𝜇
per ridurre a metà l’ampiezza di un intervallo (A) si deve
quadruplicare la dimensione del campione (n)